Google lansira Gemma: najmoćniji open-source AI model

·

Google lansira Gemma najmoćniji open ource AI model (1)

Google je napravio još jedan značajan potez u području velikih modela: lansirao je Gemma, lagani i napredni open-source model. Ime “Gemma” dolazi od latinske riječi “gemma”, što znači “dragulj”. Ovaj model ne samo da predstavlja značajan korak naprijed za Google u području umjetne inteligencije, već i donosi novu vitalnost zajednici otvorenog koda.

Gemma model nasljeđuje tehnološke i arhitektonske prednosti modela Gemini, AI velikog zatvorenog modela koji se izravno natječe s OpenAI-jevim ChatGPT-om (i gotovo je jednako moćan). Gemma je kompatibilan s mobilnim i IoT uređajima te se može izvoditi na prijenosnom računalu, radnoj stanici ili Google Cloudu. Integrira se s preuzimanjem Kaggle podataka u Google Colabu, lako se implementira na Vertex AI (opsežan skup MLOps alata) i Google Kubernetes Engine (GKE), te s popularnim alatima kao što su Hugging Face Transformers,  PyTorch, JAX i Keras 3.0. , MaxText i NVIDIA NeMo .

Google je surađivao s tvrtkom NVIDIA kako bi maksimalno povećao performanse Gemme, optimizirane za NVIDIA GPU. Proizvođač čipova i grafičkih kartica također je objavio da je pokrenuo optimizacije na svim svojim AI platformama.  Timovi iz Googlea i NVIDIA-e blisko su surađivali kako bi ubrzali performanse Gemme, Googleovog revolucionarnog novog modela otvorenog jezika, objašnjava NVIDIA.

Google lansira Gemma najmoćniji open ource AI model (2)

Gemma model dostupan je u dvije varijante:

  • 2B (2 milijarde parametara)
  • 7B (7 milijardi parametara)

Iako ova dva modela nisu Googleova najsuvremenija tehnologija, tvrtka kaže da se mogu natjecati s mnogim vrhunskim sustavima u industriji. Tvrde da je u 11 od 18 ključnih benchmark testova Gemma model nadmašio modele otvorenog koda s većim parametrima, kao što je Meta Llama-2, u području razumijevanja jezika, rasuđivanja i matematike. Što se tiče prosječne ocjene, Gemma-7B je postigao referentnu prosječnu ocjenu od 56,4, daleko nadmašujući Llama-13B (52,2) i Mistral-7B (54,0).

Usporedba referentnih rezultata između Gemme, Llame 2 i Mistrala

Usporedba referentnih rezultata

Responsible Generative AI Toolkit

Kako bi unaprijed obučeni model Gemma bio siguran i pouzdan, Google koristi automatiziranu tehnologiju za filtriranje određenih osobnih podataka i drugih osjetljivih podataka iz skupa za obuku. Osim toga, provodi se opsežno fino podešavanje i učenje pojačanja s ljudskim povratnim informacijama (RLHF) kako bi se uskladili model finog podešavanja instrukcija s odgovornim ponašanjem.

Google također nudi Responsible Artificial Intelligence Toolkit koji omogućuje programerima da izrade vlastita pravila ili popise zaustavnih riječi prilikom implementacije u svoje projekte. Također nudi alat za otklanjanje pogrešaka modela koji korisnicima omogućuje da istraže Gemmino ponašanje i isprave probleme.

Google lansira Gemma najmoćniji open ource AI model (3)

Google AI Gemini zadržava podatke 3 godine: briga o privatnosti ili standardna praksa?

Razotkriven Googleov interni AI jezični model Goose

Google ulaže 25 milijuna eura za obuku EU stanovnika AI vještina

Dostupnost

Oba modela bit će komercijalno licencirana bez obzira na veličinu tvrtke, broj korisnika i vrstu projekta, ali  ipak programeri mogu besplatno koristiti Gemmu u Kaggleu.