Apple je iznenada izravno “napao” ChatGPT, Gemini, Claude, DeepSeek: Šokantna najava istraživanja, tvrdeći da je “zaključivanje” umjetne inteligencije samo “iluzija”

·

Apple je iznenada izravno napao ChatGPT-4

Sam dan prije WWDC-a 2025., Apple je izbacio potpuno neočekivanu i pomalo provokativnu studiju pod nazivom “Iluzija razmišljanja”. U njoj tvrde da najnapredniji AI modeli današnjice – uključujući ChatGPT, Claude, Gemini i DeepSeek – zapravo uopće ne “zaključuju” niti stvarno razmišljaju. Umjesto toga, nazivaju ih samo “strojevima za predviđanje vjerojatnosti”. I da, to je direktan udarac na ono što mnogi nazivaju početkom ere umjetne opće inteligencije (AGI).

Direktno u glavu AI giganta

Apple se ovom studijom praktički frontalno zaletio u ideju da su današnji AI sustavi blizu nekoj stvarnoj inteligenciji. Meta-poruka je jasna: svi ti modeli koji nas ostavljaju bez daha zapravo možda samo dobro glume da znaju što rade. Štoviše, Apple kaže da je AGI i dalje daleko, puno dalje nego što mislimo – i to usred vremena kada većina industrije pumpa ogromna očekivanja. I tajming nije slučajan – studija je objavljena taman pred početak WWDC-a, u trenutku kad su očekivanja od Appleove vlastite AI inicijative (Apple Intelligence i Siri 2.0) prilično niska. Umjesto da dokažu da su bolji, odlučili su – srušiti sve druge.

Nova metoda testiranja: AI pod mikroskopom

Appleovi istraživači nisu koristili standardne testove iz matematike i logike – jer su ti, kažu, “zagađeni” time što su modeli već mogli naići na njih tijekom treniranja. Umjesto toga, osmislili su “čiste” zagonetke u strogo kontroliranim okruženjima:

  • Tower of Hanoi
  • Checkers Jumping
  • River Crossing
  • Blocks World

Zahvaljujući ovim zadacima, mogli su točno kontrolirati razinu težine problema i pratiti korake koje modeli poduzimaju – ne samo gledati je li rješenje točno, nego i kako su došli do njega. Zvuči školski, ali baš zato ima težinu.

Glavni nalazi: AI se brzo pogubi kad stvari postanu ozbiljne

I onda dolazi ono najzanimljivije. Studija otkriva nekoliko šokantnih i pomalo kontraintuitivnih stvari:

  • AI radi u tri režima: modeli se ponašaju potpuno različito ovisno o težini zadatka.
  • Jednostavne zadaće? “Glupi” modeli su bolji! Ispada da obični modeli (bez “naprednog zaključivanja”) bolje rješavaju osnovne probleme od sofisticiranijih. Kao da netko pokušava izračunati 2 + 2 koristeći kvadratne jednadžbe.
  • Srednje teški zadaci – jedina “slatka točka”: modeli s mogućnošću zaključivanja počinju pokazivati prednosti. Ali samo tu.
  • Teški problemi? Svi padaju. Kod složenih zadataka, svi modeli – i obični i “napredni” – doslovno se pogube. Točnost im padne gotovo na nulu.

AI zna kad ne zna – i prestane pokušavati (!)

Još bizarnije: kad modeli naiđu na granicu svojih mogućnosti, oni počinju odustajati. Čak i kad imaju dovoljno resursa za nastavak, jednostavno prestanu pokušavati razmišljati. Kao da shvate: “Okej, ne mogu dalje, idem fejkati nešto”. Ovo ponašanje potpuno je različito od ljudskog – ljudi se, kad zapnu, uglavnom još više trude. Također, čak i kad im se točno objasni kako da riješe problem, njihov uspjeh se ne povećava. To znači da ne razumiju zadatak ni logiku – nego samo prepoznaju obrasce koje su pokupili tijekom treninga.

“Pametni” modeli padaju na glupim stvarima

Jedan od najčudnijih dokaza: Claude 3.7 Sonnet može bez greške napraviti više od 100 poteza u složenoj igri Tower of Hanoi, ali padne nakon samo četiri poteza u jednostavnoj igri River Crossing. Dodaj još neku nasumičnu rečenicu u uputu – i učinkovitost mu može pasti i do 65%. To je kao da najbolji učenik škole padne test zato što je pitanje bilo neobično formulirano.

Ključna poruka: AGI nije ni blizu

Apple ovime šalje jasnu poruku: nema dokaza da trenutni AI modeli stvarno zaključuju. Oni nisu misaoni strojevi – već samo napredni prediktivni algoritmi koji pokušavaju pogoditi što bi se sljedeće moglo reći. Da, mogu generirati dugačke i pametno sročene odgovore – ali to nije isto kao stvarno razumijevanje. I zato je pitanje: jesmo li toliko hipnotizirani blještavim mogućnostima trenutnog AI-ja da ne vidimo koliko je to krhko? I je li AGI zapravo puno dalje nego što svi pričaju? Apple nam ovime sugerira da moramo spustiti loptu, prestati sanjariti i stvarno se zapitati: što AI danas stvarno može – i što ne može?

Izvornu verziju Appleovog izvješća možete pročitati ovdje.