Izvršni direktor OpenAI-ja rijetko priznaje pogreške: DeepSeek je vrlo dobar model i razmotrit će praćenje otvorenog koda
Kao odgovor na natjecanje koje je donio DeepSeek-R1, OpenAI je službeno objavio o3-mini model, koji je ujedno i najnoviji i najisplativiji model u seriji zaključivanja OpenAI, a otvoren je za korištenje u ChatGPT-u i API-ju. Izvještava se da model osvježava SOTA-u u mjerilima kao što je matematički kod, a o3-mini (visok) je najbolji u točnosti i kalibracijskoj pogrešci u povezanim testovima.
Prema izvješćima, cijena o3-mini je 63% jeftinija od OpenAI o1-mini i 93% jeftinija od punokrvne verzije o1. Programeri mogu odabrati visoke, srednje i niske intenzitete zaključivanja prema svojim potrebama, omogućujući O3-mini da duboko razmišlja kada se bavi složenim problemima, balansirajući brzinu i točnost.
OpenAI je rekao da je izdavanje o3-mini još jedna važna prekretnica na putu prema potrazi za inteligentnom tehnologijom visokih performansi. Učinite visokokvalitetnu AI tehnologiju pristupačnijom optimiziranjem rasuđivanja u znanosti, tehnologiji, inženjerstvu i matematici uz održavanje niskih troškova.
Sam Altman, suosnivač i izvršni direktor OpenAI-ja, otkrio je u online Q&A nakon lansiranja o3-minija: “U nadolazećim tjednima bit će lansirana punokrvna verzija o3. ”
Govoreći o svom mišljenju o DeepSeeku, Altman je rekao: “To je doista vrlo dobar model. OpenAI će razviti bolji model, ali nećemo zadržati tako veliko vodstvo kao prethodnih godina.”
Altman je također priznao svoju pogrešku i rekao da OpenAI raspravlja o novoj strategiji otvorenog koda. “Osobno mislim da smo na pogrešnoj strani po ovom pitanju i da moramo smisliti drugačiju strategiju otvorenog koda. Ne drže svi u OpenAI-ju ovo stajalište i to nam trenutno nije glavni prioritet. ”
Nedavno je kineski proizvođač AI tehnologije DeepSeek lansirao dva AI modela otvorenog koda, V3 i R1, od kojih su oba potkopala percepciju industrije o “potražnji za AI računalnom snagom”. Konkretno, model zaključivanja DeepSeek-R1 ne samo da ima iste performanse kao OpenAI o1, već i trošak obuke koji zahtijeva može biti samo oko 1/20 potonjeg (samo 2048 H800 GPU-a trebalo je dva mjeseca da završe obuku, a koštalo je samo oko 5.58 milijuna američkih dolara), a cijena API-ja je samo oko 1/28 potonjeg, što je ekvivalentno smanjenju troškova korištenja od oko 97%.
Drugim riječima, DeepSeek koristi nenapredne AI čipove kako bi postigao učinak vrhunskih AI modela američkih proizvođača AI tehnologije. Smatra se da ovo postignuće predstavlja prijetnju vodstvu umjetne inteligencije u Sjedinjenim Državama, što ne samo da je izazvalo paniku među mnogim velikim proizvođačima modela kao što su OpenAI, Meta i Google, već je potaknulo i revalorizaciju vrijednosti tvrtki za AI čipove kao što je Nvidia i oštar pad cijena dionica.
Sudeći prema službenim podacima koje je objavio DeepSeek, trening njegovog DeepSeek-V3/R1 koristi samo oko 2080 NVIDIA H800 akceleratorskih kartica, a ulaganje u čip u ovom dijelu iznosi oko 40 milijuna američkih dolara. Ako su službeni podaci koje je objavio DeepSeek točni, a SemiAnalysisova analiza da gomilaju 60,000 NVIDIA GPU akceleratorskih kartica također je točna, onda to također znači da je DeepSeekov postojeći AI računalni hardver dovoljan da podrži njegovo naknadno istraživanje i razvoj više generacija moćnijih AI modela.
