AI u stvarnom svijetu: Eksperiment Scale AI pokazuje ograničenja velikih modela

U Silicijskoj dolini, Scale AI je pokrenuo hrabar eksperiment kako bi testirao može li umjetna inteligencija raditi stvarne freelance poslove za plaću. Umjesto klasičnih kvizova i testova, AI modeli poput GPT-5, Claude i Gemini dobili su stvarne zadatke s Upworka, uključujući pisanje članaka, 3D dizajn, video uređivanje, arhitektonske projekte i izradu igara. Eksperiment, nazvan “Indeks rada na daljinu” (RLI), mjerio je ne teorijsku inteligenciju, već stvarnu sposobnost isporuke proizvoda.

Rezultati: razočaravajuće niska produktivnost

Ukupno 240 projekata (≈6.000 sati rada), a najbolji AI model dovršio je samo 6 zadataka (≈2,5% uspješnosti) i zaradio 1.720 USD — manje od 2% prosječnog prihoda freelancera.

Većina pogrešaka uključuje:

Nisku kvalitetu proizvoda (45,6%)
Nepotpune ili netočne formate (35,7%)
Tehničke greške i oštećene datoteke (17,6%)
Logičke/ vizualne nedosljednosti (14,8%)

Primjer: AI koji je trebao retuširati dijamantni prsten stvorio je dva nova prstena pogrešnih oblika, što je potpuni neuspjeh.

Gdje AI ipak funkcionira

AI pokazuje dobru učinkovitost u kreativnim zadacima (logotipi, jednostavni sadržaji, zvučni efekti) i osnovnoj obradi podataka. Odnosno, AI je dobar u jednostavnim i izoliranim zadacima, ali potpuno neuspješan u složenim, višestupanjskim projektima koji zahtijevaju koordinaciju alata i dosljednost.

Rad budućnosti: AI i ljudi surađuju

Na jednostavnim razinama (L1–L2), AI može odraditi 25–30% zadataka, usporedivo s radom novih zaposlenika dok na složenim razinama (L4–L5), uspješnost pada na ispod 5%. Primjena AI smanjuje potrebu za niskokvalificiranim radom (7,7% smanjenja u industrijama s ponavljajućim procesima), ali ljudi koji znaju koristiti AI postaju ključni. RLI eksperiment pokazuje da AI još ne može samostalno raditi. Pravi posao zahtijeva kombinaciju ljudske koordinacije i nadzora, ispravne uporabe AI alata i kontinuirane kontrole kvalitete.

Glavna lekcija: AI je vrlo pametan na papiru, ali u stvarnom svijetu još uvijek ne zamjenjuje ljude. Najvrednije vještine u budućem radnom okruženju bit će: upravljanje procesima, koordinacija i praćenje rada AI-a i integracija AI u stvarni workflow.

Jednostavno rečeno: AI obavlja do 30% poslova, ali ostatak mora čovjek osigurati.

Rezultati: razočaravajuće niska produktivnost

Gdje AI ipak funkcionira

Rad budućnosti: AI i ljudi surađuju

DRUGE NOVOSTI

Gamescom 2026 rasprodan mjesec dana prije početka – sav izložbeni prostor popunjen, stižu nova velika imena i premijere

NVIDIA i SEGA slave 30 godina inovacija, donoseći VIRTUA FIGHTER CROSSROADS na RTX Spark

Gears of War: E-Day izlazi 6. listopada s DLSS 4.5 i Ray Tracingom

Microsoft će implementirati procesore AMD Instinct i AMD EPYC sljedeće generacije u sklopu proširenja dugoročnog strateškog partnerstva dviju tvrtki