Google I/O 2024: LearnLM, Gemini 1.5 Flash, Gemini 1.5 Pro, Ask Photos, Gemma 2

Od 14. do 15. svibnja Google je održao konferenciju za razvojne programere “Google I/O” u Mountain Viewu u Kaliforniji, SAD. Ove godine predstavljeno je više nego ikada noviteta, a ovo su neki od njih…

LearnLM – poboljšano učenje uz pomoć umjetne inteligencije

Google je na I/O 2024 predstavio LearnLM, novi jezični model temeljen na Gemini, specifično dizajniran za potrebe edukativnih aplikacija. Model se oslanja na najnovija dostignuća u obrazovnim istraživanjima, što rezultira poboljšanim interaktivnim iskustvom u uslugama digitalnog učenja koje ga koriste.

Dodatno, Google je obznanio suradnju s Fakultetom za obrazovanje Sveučilišta Columbia, Državnim sveučilištem Arizona, Khan Collegeom i MIT-ovom inicijativom Raise na projektu LearnLM-a. Cilj projekta je stvoriti nova interaktivna iskustva učenja uz pomoć automatizirane generativne umjetne inteligencije. Ove inovacije mogu se primijeniti u uslugama poput YouTube-a, Google pretraživanja, te u edukativnim alatima koje su razvili programeri i obrazovne ustanove.

Google Chat sada besprijekorno funkcionira sa Slackom i Microsoft Teamsom

Objavljena plaćena verzija preglednika Google Chrome

Gemini 1.5 Flash – brža i učinkovitija umjetna inteligencija

Gemini 1.5 Flash, novi LLM model u obitelji umjetne inteligencije dizajniran da bude brži, učinkovitiji i pristupačniji programerima. Model nije namijenjen krajnjim korisnicima. Iako je “laganiji” verzije, zadržava snagu Pro modela, nasljeđujući multimodalne mogućnosti i veliki kontekstni prozor koji može istovremeno analizirati do milijun tokena (ekvivalent oko 1.500 stranica dokumenta ili 30.000 redaka koda).

“Gemini 1.5 Flash sjaji u zadacima kao što su sažimanje teksta, razgovori u chatu, generiranje titlova za slike i videozapise, izdvajanje podataka iz dugih dokumenata i tablica”, rekao je Demis Hassabis, izvršni direktor Google DeepMinda.

Gemini 1.5 Pro za napredne korisnike

Nakon najave u veljači, Gemini 1.5 Pro sada je dostupan pretplatnicima. Trenutno je to najmoćniji model u Googleovoj ponudi, nudeći napredne mogućnosti pisanja koda, rasuđivanja te audio i slikovne analize. Model ima kontekstni prozor od milijun tokena, a programeri mogu dobiti verziju s dva milijuna tokena. Do kraja godine, kontekstni prozor modela udvostručit će se na dva milijuna tokena, što će mu omogućiti obradu dva sata videa, 22 sata zvuka, preko 60.000 redaka koda ili više od 1,4 milijuna riječi istovremeno. Gemini 1.5 Pro je trenutno dostupan u javnom pregledu na Google AI Studio i Vertex AI.

Google Fotografije dobivaju integraciju Gemini

Izvršni direktor Googlea Sundar Pichai najavio je “Ask Photos”, novu značajku koja koristi Gemini AI kako bi korisnicima pomogla da intuitivnije pronađu i ponovno prožive svoje uspomene. Ova funkcija omogućuje postavljanje pitanja na prirodnom jeziku, odnosno odgovarajućih opisa. Primjerice, korisnici mogu pitati “Pokaži mi najbolju fotografiju svakog nacionalnog parka koji sam posjetio” ili “Koje sam teme koristio za rođendanske zabave svog djeteta u posljednjih nekoliko godina?” Za pružanje najrelevantnijih fotografija kao odgovor na upite, Gemini koristi svoje sposobnosti jezičnog razumijevanja, vizualnog pretraživanja i analize slika.

Istovremeno, Google naglašava da ova značajka neće utjecati na privatnost osobnog sadržaja. Relevantni interaktivni sadržaj se neće dodatno spremati, a korisnici neće biti filtrirani ili moderirani prilikom korištenja ove funkcije, osim u slučaju zlouporabe ili štete drugima. Osim toga, osobni podaci neće se koristiti za obuku drugih proizvoda umjetne inteligencije izvan Google Fotografija.

Međutim, funkcija Ask Photos s Geminijem u osnovi se provodi putem suradničkog računalstva u oblaku, pa uređaj mora biti spojen na internet. U početku će funkcija biti dostupna samo na engleskom jeziku pretplatnicima Google One usluge u SAD-u , a u narednim mjesecima se postupno uvoditi i drugim korisnicima na ostalim jezicima.

Gemma 2

Kao odgovor na zahtjev programera, Google je nadogradio novu verziju modela Gemma s 27 milijardi parametara u usporedbi s trenutnom. Novi model službeno će biti objavljen 6. lipnja. Google kaže da će NVIDIA optimizirati model za pokretanje na tvrtkinim GPU-ovima sljedeće generacije, a može učinkovito raditi na host 1 TPU-u i glavnom AI-u.

LearnLM – poboljšano učenje uz pomoć umjetne inteligencije

Google Chat sada besprijekorno funkcionira sa Slackom i Microsoft Teamsom

Objavljena plaćena verzija preglednika Google Chrome

Gemini 1.5 Flash – brža i učinkovitija umjetna inteligencija

Gemini 1.5 Pro za napredne korisnike

Google Fotografije dobivaju integraciju Gemini

Gemma 2

DRUGE NOVOSTI

Jednostavan oporavak Windowsa uz QNAP HDP Recovery Media Creator

Procurili detalji o Intel Core Ultra 400 procesorima: Nova Lake stiže s do 52 jezgre

Što je MCP i zašto ga prihvaćaju OpenAI, Google, Microsoft i drugi tehnološki divovi?

Apple ponovno preuzeo titulu najvrjednije tvrtke na svijetu, Nvidia izgubila vodeću poziciju