Qwen2.5-Max još moćniji od DeepSeeka

·

Qwen2.5-Max

Pojava kineskog AI alata Qwen2.5-Max, koji je još moćniji od DeepSeeka, donijela je velike promjene u AI industriji, osobito jer radi učinkovitije od OpenAI-ovog ChatGPT-a. Qwen2.5-Max je najnoviji alat koji je predstavila Alibaba, a već je premašio DeepSeek-V3 u nekim testovima, pa čak i GPT-4o-0806 i Claude-3.5-Sonnet-1022 u određenim područjima.

U testovima, Qwen2.5-Max postigao je bolje rezultate u usporedbi s prethodnim modelima. Na primjer, u Arena-Hardu, koji ocjenjuje ljudske preferencije, Qwen2.5-Max je osvojio 89.4 boda, dok je DeepSeek-V3 imao 85.5 bodova. Međutim, u MMLU-Pro testu, koji ocjenjuje znanje na fakultetskoj razini, Claude Sonnet je bio bolji s 78.0 bodova, dok je Qwen2.5-Max postigao 76.1 bod. U drugim testovima, poput LiveCodeBencha, Qwen2.5-Max se također pokazao vrlo konkurentnim, ali je bio samo malo iza Claudea.

Qwen2.5-Max_1

Kao i DeepSeek, Qwen2.5-Max ima ograničenja u vezi s političkim komentarima. Na primjer, kada korisnici postave političko pitanje u Qwen Chatu, sustav ih obavještava o prekoračenju dopuštenih granica, ali slobodno odgovara na druga pitanja.

Iako Qwen2.5-Max pokazuje impresivne rezultate u raznim testovima, postoje i modeli poput GPT-4o i Claude koji nisu uključeni u testiranja zbog zatvorene prirode. Trenutno je Qwen2.5-Max dostupan putem API-ja za programere i može se koristiti u Qwen Chatu za krajnje korisnike, s funkcijama poput stvaranja slika i videozapisa, a uskoro će biti dostupna i opcija pretraživanja weba.

Zanimljivo je da će američke tehnološke tvrtke vjerojatno istraživati ovaj alat kako bi optimizirale svoje vlastite AI modele, s obzirom na njegovu snagu i napredak u odnosu na konkurenciju.