AI u stvarnom svijetu: Eksperiment Scale AI pokazuje ograničenja velikih modela
U Silicijskoj dolini, Scale AI je pokrenuo hrabar eksperiment kako bi testirao može li umjetna inteligencija raditi stvarne freelance poslove za plaću. Umjesto klasičnih kvizova i testova, AI modeli poput GPT-5, Claude i Gemini dobili su stvarne zadatke s Upworka, uključujući pisanje članaka, 3D dizajn, video uređivanje, arhitektonske projekte i izradu igara. Eksperiment, nazvan “Indeks rada na daljinu” (RLI), mjerio je ne teorijsku inteligenciju, već stvarnu sposobnost isporuke proizvoda.
Rezultati: razočaravajuće niska produktivnost
Ukupno 240 projekata (≈6.000 sati rada), a najbolji AI model dovršio je samo 6 zadataka (≈2,5% uspješnosti) i zaradio 1.720 USD — manje od 2% prosječnog prihoda freelancera.
Većina pogrešaka uključuje:
- Nisku kvalitetu proizvoda (45,6%)
- Nepotpune ili netočne formate (35,7%)
- Tehničke greške i oštećene datoteke (17,6%)
- Logičke/ vizualne nedosljednosti (14,8%)
Primjer: AI koji je trebao retuširati dijamantni prsten stvorio je dva nova prstena pogrešnih oblika, što je potpuni neuspjeh.
Gdje AI ipak funkcionira
AI pokazuje dobru učinkovitost u kreativnim zadacima (logotipi, jednostavni sadržaji, zvučni efekti) i osnovnoj obradi podataka. Odnosno, AI je dobar u jednostavnim i izoliranim zadacima, ali potpuno neuspješan u složenim, višestupanjskim projektima koji zahtijevaju koordinaciju alata i dosljednost.
Rad budućnosti: AI i ljudi surađuju
Na jednostavnim razinama (L1–L2), AI može odraditi 25–30% zadataka, usporedivo s radom novih zaposlenika dok na složenim razinama (L4–L5), uspješnost pada na ispod 5%. Primjena AI smanjuje potrebu za niskokvalificiranim radom (7,7% smanjenja u industrijama s ponavljajućim procesima), ali ljudi koji znaju koristiti AI postaju ključni. RLI eksperiment pokazuje da AI još ne može samostalno raditi. Pravi posao zahtijeva kombinaciju ljudske koordinacije i nadzora, ispravne uporabe AI alata i kontinuirane kontrole kvalitete.
Glavna lekcija: AI je vrlo pametan na papiru, ali u stvarnom svijetu još uvijek ne zamjenjuje ljude. Najvrednije vještine u budućem radnom okruženju bit će: upravljanje procesima, koordinacija i praćenje rada AI-a i integracija AI u stvarni workflow.
Jednostavno rečeno: AI obavlja do 30% poslova, ali ostatak mora čovjek osigurati.
