Apple redefinira AI trening: manji modeli, veća preciznost uz RubiCap pristup

Appleovi istraživači predstavili su novu metodu treniranja AI modela koja značajno smanjuje potrebnu veličinu modela uz istovremeno povećanje preciznosti i kvalitete rezultata. Riječ je o pristupu koji bi mogao promijeniti način razvoja vizualno-jezičnih sustava i ubrzati primjenu AI-a u stvarnim proizvodima.

Novi pristup generiranju opisa slika

RubiCap je novi RL okvir iz Applea i Sveučilišta Wisconsin–Madison. Prema radu, koristi učenje pojačanjem vođeno rubrikom za treniranje kompaktnih modela jezika vida koji generiraju točnije, detaljnije opise slika nego sustavi s do 72 milijarde parametara. Tzu-Heng Huang, Sirajul Salekin, Javier Movellan, Frederic Sala i Manjot Bilkhu autori su studije, koja je predana arXivu 10. ožujka. Ukratko, za razliku od klasičnih modela koji generiraju jedan opći opis slike, ovaj pristup detaljno opisuje pojedine objekte, regije i odnose unutar scene. Takva granularnost omogućuje dublje razumijevanje vizualnog sadržaja, što je ključno za napredne AI sustave poput pretraživanja slika, pristupačnosti i generativnih modela tekst-u-sliku.

Problem postojećih metoda

Dosadašnji pristupi suočavaju se s dva ključna izazova: visoki troškovi ručnog označavanja (anotacije) podataka visoke kvalitete i ograničena raznolikost i slaba generalizacija kod modela treniranih nadziranom destilacijom. Iako se sintetički podaci mogu generirati pomoću snažnih modela, rezultati često nisu dovoljno raznoliki ni robusni za kompleksne scenarije.

Kako funkcionira RubiCap

RubiCap uvodi kombinaciju više naprednih tehnika:

korištenje skupova podataka s ukupno 50.000 slika
generiranje više kandidatskih opisa pomoću modela poput Gemini 2.5 Pro i GPT-5
treniranje vlastitog modela koji generira alternativne opise
evaluacija kvalitete kroz sustav “rubrika” (kriterija)
korištenje modela Qwen2.5-7B-Instruct za bodovanje i dodjelu nagrada u procesu učenja pojačanjem

Ovakav višeslojni pristup omogućuje modelu da uči ne samo iz podataka, već i iz strukturiranog vrednovanja kvalitete odgovora.

Rezultati: mali modeli, veliki pomak

Appleov tim razvio je tri verzije modela: RubiCap-2B, RubiCap-3B i RubiCap-7B. Unatoč relativno malom broju parametara, ovi modeli postižu vrhunske rezultate: nadmašuju postojeće metode, u nekim slučajevima pobjeđuju modele s čak 72 milijarde parametara, postižu najnižu stopu “halucinacija” i nude najvišu razinu preciznosti u slijepim testovima. Posebno je zanimljivo da modeli s oko 3 milijarde parametara u određenim benchmarkovima nadmašuju znatno veće sustave, što jasno pokazuje da veličina modela više nije presudan faktor.

Šire implikacije za AI industriju

Ovo istraživanje potvrđuje sve izraženiji trend u industriji: fokus se pomiče s “što veći model” na “što pametniji trening”. Za Apple, ovakav pristup ima jasan strateški smisao jer omogućuje implementaciju AI funkcija direktno na uređajima, smanjenje troškova infrastrukture ,poboljšanje privatnosti korisnika i veću energetsku učinkovitost. Istovremeno, RubiCap pokazuje da kombinacija učenja pojačanjem i pametno dizajniranih evaluacijskih kriterija može zamijeniti potrebu za ogromnim količinama podataka i masivnim modelima.

Zaključak

Appleov RubiCap predstavlja važan iskorak u razvoju AI modela jer demonstrira da je moguće postići vrhunske rezultate s manjim i učinkovitijim sustavima. U eri u kojoj troškovi treniranja velikih modela eksponencijalno rastu, ovakav pristup mogao bi postati novi standard u industriji. Drugim riječima, utrka više nije samo u veličini modela, već u kvaliteti metodologije treniranja.

Novi pristup generiranju opisa slika

Problem postojećih metoda

Kako funkcionira RubiCap

Rezultati: mali modeli, veliki pomak

Šire implikacije za AI industriju

Zaključak

DRUGE NOVOSTI

Gamescom 2026 rasprodan mjesec dana prije početka – sav izložbeni prostor popunjen, stižu nova velika imena i premijere

NVIDIA i SEGA slave 30 godina inovacija, donoseći VIRTUA FIGHTER CROSSROADS na RTX Spark

Gears of War: E-Day izlazi 6. listopada s DLSS 4.5 i Ray Tracingom

Microsoft će implementirati procesore AMD Instinct i AMD EPYC sljedeće generacije u sklopu proširenja dugoročnog strateškog partnerstva dviju tvrtki