Gemini Live – Prirodni razgovori s umjetnom inteligencijom na pametnim telefonima
Google i OpenAI sudjelovali su u žestokoj utrci umjetne inteligencije tijekom prošle godine, no činilo se da su obje strane prvenstveno fokusirane na unos teksta, potom mogućnost pretraživanja slika i korištenja osnovnih glasovnih naredbi, dok ideja razgovora s virtualnim asistentima nije im bila bitna.
Ali, Google je naporno radio na Gemini Live, novom mobilnom iskustvo za prirodne razgovore sa svojom umjetnom inteligencijom. Ono što Gemini Live čini jedinstvenim je sposobnost govora vlastitim tempom, čak i prekidanje AI odgovora. U idealnom slučaju, to bi trebalo biti više kao razgovor s osobom, umjesto da samo dajete naredbe glasovnom asistentu ili postavljate pitanja generativnoj umjetnoj inteligenciji.
Hoće li Google Gemini biti doveden do iPhonea?
Gemini – najnoviji Googleov pokušaj da demonstrira svoju AI snagu
Gemini Live je na neki način evolucija Google Lensa, Googleove dugogodišnje platforme za računalni vid za analizu slika i videozapisa te Google asistenta, Googleovog virtualnog pomoćnika koji pokreće umjetnu inteligenciju, generira govor i prepoznaje na telefonima, pametnim zvučnicima i televizorima. Tehničke inovacije koje pokreću Gemini Live djelomično proizlaze iz projekta Astra, nove inicijative unutar DeepMinda za stvaranje aplikacija i “agenata” pokretanih umjetnom inteligencijom za multimodalno razumijevanje u stvarnom vremenu. Sposobnost “pamćenja” Gemini Live omogućena je arhitekturom modela na kojem se temelji – Gemini 1.5 Pro. Ima kontekstni prozor duži od prosjeka, što znači da može uzeti i urazumiti puno podataka, kao i sat vremena videozapisa.
