ChatGPT vs Gemini: Tko vodi u AI svijetu i kako jedan trik može promijeniti igru

Na tržištu umjetne inteligencije danas postoji doslovno desetine tisuća alata, ali većina nas zapravo poznaje samo nekoliko njih. Dva najveća imena u igri su ChatGPT i Gemini, i mnogi se pitaju koji je bolji. Odgovor nije jednostavan jer oba sustava nude impresivne sposobnosti, stalno se nadograđuju i mogu gotovo sve što zamislite.

Kako usporediti AI koji stalno napreduje?

Prije nekoliko godina usporedbe velikih jezičnih modela bile su jasnije jer su razlike bile značajne, no danas su modeli poput ChatGPT-a i Geminija toliko sofisticirani da se razlika često svodi na stil odgovora i način komuniciranja. Odgovori AI-a nisu uvijek isti – isto pitanje može dati različite rezultate svaki put – a ton i osobnost chatbota lako se prilagođavaju vašim željama, što je posebno korisno kod ChatGPT-a.

Stručnjaci su izdvojili tri područja u kojima ChatGPT trenutno vodi, a koja jasno pokazuju njegovu snagu i svestranost:

1. Odgovaranje na znanstvena pitanja koja Google ne može riješiti

GPQA Diamond test procjenjuje koliko AI može razmišljati “izvan Googlea”. Uključuje pitanja iz fizike, kemije i biologije koja zahtijevaju primjenu znanstvenih koncepata i logike, a ne samo kopiranje odgovora s interneta. ChatGPT je na ovom testu blago ispred Geminija, s 92,4% točnih odgovora naspram 91,9%, što znači da kada trebate složene odgovore ili analizu, ChatGPT ima prednost.

2. Rješavanje stvarnih programskih problema

SWE-Bench Pro test pokazuje koliko AI može pomoći u pravom kodiranju – od razumijevanja nepoznate baze koda do rješavanja bugova i osmišljavanja rješenja. ChatGPT-5.2 riješio je 24% najzahtjevnijih izazova, dok je Gemini uspio riješiti samo 18%. Iako ti postoci ne zvuče visoko, test uključuje najteže zadatke, a ljudi u istom skupu rješavaju svih 100%. Dakle, ChatGPT je korak bliže tome da postane pouzdan digitalni kolega za programere.

3. Rješavanje apstraktnih .vizualnih zagonetki

ARC-AGI-2 benchmark mjeri sposobnost AI da uoči obrasce i primijeni ih na novi izazov. ChatGPT-5.2 Pro postigao je 54,2%, dok Gemini modeli ostaju iza, najjači s 31,1%. To znači da ChatGPT bolje “razmišlja vizualno” i može pomoći u rješavanju zadataka koji zahtijevaju apstraktno zaključivanje.

No, Gemini je iznenada skočio

Iako su ChatGPT-ove performanse impresivne, Googleov istraživački tim nedavno je otkrio jednostavan trik koji je dramatično povećao točnost Geminija – ponavljanje ulaznih pitanja. Bez dodatnih sposobnosti zaključivanja ili složenih taktika, Gemini je skočio s 21% na nevjerojatnih 97% točnosti.

Kako to funkcionira? Transformeri, arhitektura na kojoj se temelje ovi modeli, čitaju tekst s lijeva na desno i tehnički ne mogu “pogledati unatrag” na prethodne informacije, što ponekad dovodi do pogrešaka u kontekstu. Ponavljanjem pitanja model dobiva drugu priliku da kombinira sve informacije i donese točan odgovor, gotovo kao da “provjerava cijelu priču još jednom”.

Ovaj pristup ne usporava performanse, radi na manjim i bržim modelima, smanjuje troškove i pokazuje kako ponekad i najsuvremenija tehnologija može biti unaprijeđena jednostavnim rješenjem. Jedini caveat? Metoda najbolje radi kada nije potrebno složeno zaključivanje; za zadatke koji zahtijevaju višestepeno razmišljanje, naprednije tehnike još uvijek imaju prednost.

Zaključak

ChatGPT se i dalje ističe u složenim zadacima koji zahtijevaju logiku, znanje i kreativnost, bilo da je riječ o znanstvenim pitanjima, kodiranju ili apstraktnim zagonetkama, dok Gemini pokazuje da i jednostavne optimizacije poput ponavljanja pitanja mogu dramatično povećati njegovu učinkovitost. Ova dinamika pokazuje da AI sustavi stalno evoluiraju, a kombinacija sofisticiranih sposobnosti i pametnih trikova može otvoriti potpuno nove mogućnosti u stvarnom svijetu.

Kako usporediti AI koji stalno napreduje?

Stručnjaci su izdvojili tri područja u kojima ChatGPT trenutno vodi, a koja jasno pokazuju njegovu snagu i svestranost:

No, Gemini je iznenada skočio

Zaključak

DRUGE NOVOSTI

Gamescom 2026 rasprodan mjesec dana prije početka – sav izložbeni prostor popunjen, stižu nova velika imena i premijere

NVIDIA i SEGA slave 30 godina inovacija, donoseći VIRTUA FIGHTER CROSSROADS na RTX Spark

Gears of War: E-Day izlazi 6. listopada s DLSS 4.5 i Ray Tracingom

Microsoft će implementirati procesore AMD Instinct i AMD EPYC sljedeće generacije u sklopu proširenja dugoročnog strateškog partnerstva dviju tvrtki