Apple redefinira AI trening: manji modeli, veća preciznost uz RubiCap pristup
Appleovi istraživači predstavili su novu metodu treniranja AI modela koja značajno smanjuje potrebnu veličinu modela uz istovremeno povećanje preciznosti i kvalitete rezultata. Riječ je o pristupu koji bi mogao promijeniti način razvoja vizualno-jezičnih sustava i ubrzati primjenu AI-a u stvarnim proizvodima.
Novi pristup generiranju opisa slika
RubiCap je novi RL okvir iz Applea i Sveučilišta Wisconsin–Madison. Prema radu, koristi učenje pojačanjem vođeno rubrikom za treniranje kompaktnih modela jezika vida koji generiraju točnije, detaljnije opise slika nego sustavi s do 72 milijarde parametara. Tzu-Heng Huang, Sirajul Salekin, Javier Movellan, Frederic Sala i Manjot Bilkhu autori su studije, koja je predana arXivu 10. ožujka. Ukratko, za razliku od klasičnih modela koji generiraju jedan opći opis slike, ovaj pristup detaljno opisuje pojedine objekte, regije i odnose unutar scene. Takva granularnost omogućuje dublje razumijevanje vizualnog sadržaja, što je ključno za napredne AI sustave poput pretraživanja slika, pristupačnosti i generativnih modela tekst-u-sliku.
Problem postojećih metoda
Dosadašnji pristupi suočavaju se s dva ključna izazova: visoki troškovi ručnog označavanja (anotacije) podataka visoke kvalitete i ograničena raznolikost i slaba generalizacija kod modela treniranih nadziranom destilacijom. Iako se sintetički podaci mogu generirati pomoću snažnih modela, rezultati često nisu dovoljno raznoliki ni robusni za kompleksne scenarije.
Kako funkcionira RubiCap
RubiCap uvodi kombinaciju više naprednih tehnika:
- korištenje skupova podataka s ukupno 50.000 slika
- generiranje više kandidatskih opisa pomoću modela poput Gemini 2.5 Pro i GPT-5
- treniranje vlastitog modela koji generira alternativne opise
- evaluacija kvalitete kroz sustav “rubrika” (kriterija)
- korištenje modela Qwen2.5-7B-Instruct za bodovanje i dodjelu nagrada u procesu učenja pojačanjem
Ovakav višeslojni pristup omogućuje modelu da uči ne samo iz podataka, već i iz strukturiranog vrednovanja kvalitete odgovora.
Rezultati: mali modeli, veliki pomak
Appleov tim razvio je tri verzije modela: RubiCap-2B, RubiCap-3B i RubiCap-7B. Unatoč relativno malom broju parametara, ovi modeli postižu vrhunske rezultate: nadmašuju postojeće metode, u nekim slučajevima pobjeđuju modele s čak 72 milijarde parametara, postižu najnižu stopu “halucinacija” i nude najvišu razinu preciznosti u slijepim testovima. Posebno je zanimljivo da modeli s oko 3 milijarde parametara u određenim benchmarkovima nadmašuju znatno veće sustave, što jasno pokazuje da veličina modela više nije presudan faktor.
Šire implikacije za AI industriju
Ovo istraživanje potvrđuje sve izraženiji trend u industriji: fokus se pomiče s “što veći model” na “što pametniji trening”. Za Apple, ovakav pristup ima jasan strateški smisao jer omogućuje implementaciju AI funkcija direktno na uređajima, smanjenje troškova infrastrukture ,poboljšanje privatnosti korisnika i veću energetsku učinkovitost. Istovremeno, RubiCap pokazuje da kombinacija učenja pojačanjem i pametno dizajniranih evaluacijskih kriterija može zamijeniti potrebu za ogromnim količinama podataka i masivnim modelima.
Zaključak
Appleov RubiCap predstavlja važan iskorak u razvoju AI modela jer demonstrira da je moguće postići vrhunske rezultate s manjim i učinkovitijim sustavima. U eri u kojoj troškovi treniranja velikih modela eksponencijalno rastu, ovakav pristup mogao bi postati novi standard u industriji. Drugim riječima, utrka više nije samo u veličini modela, već u kvaliteti metodologije treniranja.



