OGLAS

AI balon ili GPU balon: Zašto tehnološko tržište sve više trguje hardverom, a ne modelima

·

Površno praćenje tehnoloških vijesti otkriva jasan trend u kojem tržišni lideri ulažu astronomske svote u infrastrukturu podatkovnih centara nove generacije. Prema podacima MarketWatcha, tehnološki giganti Alphabet, Amazon, Meta i Microsoft planiraju investirati čak 650 milijardi dolara u ovo područje samo tijekom 2026. godine, što je golem kapital usmjeren prema očuvanju vodećih pozicija na tržištu. Prije samo tri godine takvi iznosi nisu bili ni blizu u opticaju, a do ove dramatične promjene došlo je zbog tri ključna faktora:

  • Eksponencijalni rast parametara u modelima: Veliki jezični modeli postali su masivni do te mjere da se njihovo širenje odvija katastrofalnom brzinom. Dok je OpenAI 2018. godine predstavio GPT-1 sa svega 117 milijuna parametara, procjenjuje se da aktualni GPT-5.5 koristi između 8 i 10 bilijuna parametara, dok Gemini 3.1 Pro operira s 1,5 do 2 bilijuna parametara, što zahtijeva prelazak na kompleksne MoE (Mixture of Experts) arhitekture kako bi se ubrzalo izvršavanje koda.
  • Evolucija primjene i AI agenata: Dok je umjetna inteligencija u svojim počecima bila svedena na jednostavne chatbotove i bazične tekstualne generatore koji su djelovali više kao tehnološka igračka nego stvarni alat, danas se implementira posvuda. Sustavi autonomno programiraju, analiziraju goleme baze podataka, renderiraju videozapise visoke razlučivosti te kroz napredne AI agente samostalno izvršavaju kompleksne zadatke na operativnim sustavima, što zahtijeva neusporedivo veću procesorsku snagu.
  • Sazrijevanje za korporativni sektor: Velike korporacije, banke i financijske institucije u početku su bile skeptične prema AI rješenjima, no danas ih masovno integriraju u sustave kibernetičke sigurnosti, robotiku i optimizaciju poslovnih procesa, čime se generiraju stvarni prihodi i postavlja temelj za dugoročnu profitabilnost.

Zbog navedenih promjena, potražnja za grafičkim akceleratorima, serverskim reketima i memorijskim čipovima trenutačno drastično premašuje ponudu, što je proizvođačima NAND i DRAM memorije omogućilo podizanje cijena za tri do četiri puta, dok Nvidia ostvaruje povijesne prihode. U takvom tržišnom okruženju kvaliteta samog modela postaje sekundarna ako tvrtka nema dovoljno hardverskih resursa za obavljanje inferencije i glatko opsluživanje krajnjih korisnika.

Kraj ere subvencioniranja i prelazak na naplatu po tokenu

U prvoj fazi proboja umjetne inteligencije svi su ključni igrači trošili goleme količine kapitala kako bi privukli korisničku bazu, nudeći plaćene pretplate poput ChatGPT Plus, Anthropic Claude Pro ili Perplexity Pro po fiksnim cijenama od dvadesetak dolara mjesečno. Aktivni korisnici su kroz te pretplate trošili resurse koji bi kroz standardni API pristup vrijedili stostruko više, no tvrtke su svjesno preuzimale gubitke radi prikupljanja podataka za daljnji trening i stvaranja navika kod potrošača. Suprotno ranijim predviđanjima da će trošak inferencije s vremenom pasti zbog ekonomije skale, novi i inteligentniji modeli postali su još kompleksniji i skuplji za održavanje. To je potaknulo hiperskalere na promjenu strategije i prelazak na fazu povrata investicije, pa Microsoft u sklopu alata GitHub Copilot planira napustiti model fiksne pretplate i uvesti plaćanje prema stvarno potrošenim tokenima, dok drugi izdavači smanjuju limite i integriraju oglase.

Zarada na prodaji lopata tijekom zlatne groznice

Trenutačna situacija na tržištu hardvera potvrđuje staro ekonomsko pravilo da su tijekom zlatne groznice najbolje zarađivali prodavači lopata i alata, a ne sami tragači za zlatom. Izvrstan primjer obrata na tržištu predstavlja tvrtka Allbirds koja se bavila proizvodnjom obuće od ekoloških materijala i čija je imovina do početka 2026. godine pala na 39 milijuna dolara, nakon čega je uprava donijela radikalnu odluku da u potpunosti ugasi primarni biznis, preimenuje tvrtku u NewBird AI i sav kapital investira u kupnju GPU hardvera koji sada iznajmljuje kroz model “GPU-as-a-Service”.

Sličnu strategiju provodi i Elon Musk s tvrtkom xAI čiji masivni podatkovni centri, osim za pogon vlastitog modela Grok, služe kao profitabilna cloud infrastruktura za klijente trećih strana. Primjerice, tvrtka Anthropic potpisala je ugovor sa SpaceX-om kao matičnom tvrtkom xAI-ja, prema kojem će za pristup klasterima Colossus 1 i Colossus 2 plaćati 1,25 milijardi dolara mjesečno do 2029. godine, što će SpaceX-u donijeti 45 milijardi dolara prihoda, dok startupovi poput Cursora unajmljuju iste kapacitete za trening svojih najnovijih Composer 2.5 modela. Nvidia je apsolutni predvodnik ovog trenda te je fiskalnu godinu završila s prihodom od 216 milijardi dolara, pri čemu je sektor podatkovnih centara generirao nevjerojatnih 194 milijarde dolara, što dokazuje da gotovo devedeset posto ukupnih prihoda tvrtke dolazi izravno od AI procvata.

Razvoj vlastitog silicija kao imperativ neovisnosti

Kako bi smanjili ovisnost o Nvidijinom hardverskom monopolu i ublažili utjecaj njihove agresivne cjenovne politike, tehnološki giganti ubrzano razvijaju vlastita poluvodička rješenja. Google već uspješno koristi svoju liniju energetski učinkovitih TPU čipova šeste generacije na prilagođenoj ARM arhitekturi koji su optimizirani za strojno učenje i obradu neuronskih mreža. Amazon Web Services s druge strane razvija specijalizirane čipove Trainium2 za trening i Inferentia2 za inferenciju koje povezuje u masivne UltraCluster sustave od stotinu tisuća jedinica, a na kojima Anthropic trenira svoje najnovije Claude modele. Vlastite procesore već posjeduju ili aktivno razvijaju i tvrtke poput Microsofta, Huaweija, Tesle, Applea te OpenAI-ja.

Dok šira javnost promatra natjecanje tehnoloških divova kroz prizmu softverske inteligencije i mogućnosti chatbotova, stvarna i daleko surovija bitka odvija se iza kulisa u obliku borbe za hardversku infrastrukturu i stabilnost opskrbnog lanca.

OGLAS