AI u stvarnom svijetu: Eksperiment Scale AI pokazuje ograničenja velikih modela

·

AI u stvarnom svijetu Eksperiment Scale AI pokazuje ograničenja velikih modela

U Silicijskoj dolini, Scale AI je pokrenuo hrabar eksperiment kako bi testirao može li umjetna inteligencija raditi stvarne freelance poslove za plaću. Umjesto klasičnih kvizova i testova, AI modeli poput GPT-5, Claude i Gemini dobili su stvarne zadatke s Upworka, uključujući pisanje članaka, 3D dizajn, video uređivanje, arhitektonske projekte i izradu igara. Eksperiment, nazvan “Indeks rada na daljinu” (RLI), mjerio je ne teorijsku inteligenciju, već stvarnu sposobnost isporuke proizvoda.

Rezultati: razočaravajuće niska produktivnost

Ukupno 240 projekata (≈6.000 sati rada), a  najbolji AI model dovršio je samo 6 zadataka (≈2,5% uspješnosti) i zaradio 1.720 USD — manje od 2% prosječnog prihoda freelancera.

Većina pogrešaka uključuje:

  • Nisku kvalitetu proizvoda (45,6%)
  • Nepotpune ili netočne formate (35,7%)
  • Tehničke greške i oštećene datoteke (17,6%)
  • Logičke/ vizualne nedosljednosti (14,8%)

Primjer: AI koji je trebao retuširati dijamantni prsten stvorio je dva nova prstena pogrešnih oblika, što je potpuni neuspjeh.

Gdje AI ipak funkcionira

AI pokazuje dobru učinkovitost u kreativnim zadacima (logotipi, jednostavni sadržaji, zvučni efekti) i osnovnoj obradi podataka. Odnosno,  AI je dobar u jednostavnim i izoliranim zadacima, ali potpuno neuspješan u složenim, višestupanjskim projektima koji zahtijevaju koordinaciju alata i dosljednost.

Rad budućnosti: AI i ljudi surađuju

Na jednostavnim razinama (L1–L2), AI može odraditi 25–30% zadataka, usporedivo s radom novih zaposlenika dok  na složenim razinama (L4–L5), uspješnost pada na ispod 5%. Primjena AI smanjuje potrebu za niskokvalificiranim radom (7,7% smanjenja u industrijama s ponavljajućim procesima), ali ljudi koji znaju koristiti AI postaju ključni. RLI eksperiment pokazuje da AI još ne može samostalno raditi. Pravi posao zahtijeva kombinaciju  ljudske koordinacije i nadzora, ispravne uporabe AI alata i kontinuirane kontrole kvalitete.

Glavna lekcija: AI je vrlo pametan na papiru, ali u stvarnom svijetu još uvijek ne zamjenjuje ljude. Najvrednije vještine u budućem radnom okruženju bit će: upravljanje procesima, koordinacija i praćenje rada AI-a i integracija AI u stvarni workflow.

Jednostavno rečeno: AI obavlja do 30% poslova, ali ostatak mora čovjek osigurati.