Google lansirao FunctionGemma: AI model koji je u potpunosti ugrađen u mobitel i upravlja njime prirodnim jezikom
Google je službeno predstavio FunctionGemma, novi specijalizirani AI model osmišljen za rad izravno na mobilnim telefonima i drugim “edge” uređajima. Za razliku od klasičnih velikih jezičnih modela koji se oslanjaju na cloud, FunctionGemma je dizajnirana tako da lokalno razumije korisničke naredbe i odmah upravlja funkcijama uređaja – bez slanja podataka na udaljene servere. Model se temelji na Gemma 3 270M arhitekturi, dodatno fino podešenoj za tzv. function calling scenarije. Drugim riječima, umjesto da samo odgovara tekstom, FunctionGemma može pretvoriti prirodni jezik u konkretne naredbe koje mobilni sustav ili aplikacije odmah izvršavaju.
AI koji ne razgovara – nego djeluje
Za razliku od generičkih AI modela koji su fokusirani na dijalog, FunctionGemma je usmjerena na izvršavanje zadataka. Ona ne samo da razumije što korisnik želi, već automatski generira strukturirani kod funkcijskih poziva, najčešće u JSON formatu, kojim izravno upravlja aplikacijama i sustavskim funkcijama. U Googleovim internim testovima takozvanih “mobilnih akcija”, model je već u početnoj verziji postizao 58 % točnosti u izvršavanju naredbi. Nakon dodatnog fino podešavanja, ta se brojka popela na impresivnih 85 %, čak i kod složenijih zahtjeva poput: „Rezerviraj ručak i dodaj ga u kalendar“ ili Pošalji fotografije hrane snimljene jučer obitelji“. To jasno pokazuje da Google cilja na budućnost u kojoj AI asistent na mobitelu neće samo savjetovati, nego će stvarno obavljati zadatke umjesto vas.
Optimizirana za slabiji hardver
Kako bi mogla raditi na uređajima s ograničenom procesorskom snagom i potrošnjom energije, FunctionGemma koristi iznimno lagan dizajn. Zadržava Gemmin izvorni rječnik od 256 tisuća tokena, što omogućuje brzo parsiranje JSON podataka i kvalitetnu podršku za više jezika, uz vrlo nisku latenciju.
Model je već prilagođen ugrađenim razvojnim pločama poput NVIDIA Jetson Nano, standardnim pametnim telefonima i drugim edge uređajima. Zanimljivo je i to da FunctionGemma može djelovati kao lokalni “raspoređivač zadataka” – sama rješava jednostavne operacije, dok složeniju logiku po potrebi prepušta snažnijem modelu poput Gemma 3 27B.
Cijeli ekosustav alata za developere
Google je uz FunctionGemmu predstavio i kompletan ekosustav za razvoj. Model je već dostupan putem platformi kao što su Hugging Face i Kaggle, a može se dodatno trenirati pomoću alata poput Unsloth, Keras i NVIDIA NeMo.
Za inferenciju su podržani:
- LiteRT-LM
- vLLM
- Llama.cpp
- Ollama
Kako bi programerima dodatno olakšao početak, Google je objavio i praktične primjere, uključujući mini-igru TinyGarden te detaljne vodiče za “mobilno upravljanje”. Oni pokazuju kako pomoću prirodnog jezika upravljati virtualnom farmom ili stvarnim postavkama pametnog telefona.
AI agenti bez clouda
Sve to jasno pokazuje smjer u kojem Google ide: AI agenti koji rade lokalno, reagiraju brzo i ne ovise o stalnoj internetskoj vezi. FunctionGemma je još jedan korak prema pametnim telefonima koji će doslovno slušati, razumjeti i izvršavati naredbe – odmah, sigurno i privatno. Ako se ovaj pristup proširi na Android u širem smislu, vrlo je moguće da ćemo uskoro razgovarati s mobitelom ne kao s chatbotom, već kao s pravim digitalnim asistentom koji zna što treba učiniti – i to bez pitanja “jeste li sigurni?”.
