Sedam stručnjaka “rastavilo” GTC 2026: novi AI narativ dovodi NVIDIA u defenzivu

·

NVIDIA napušta Kinu_ Jensen Huang zaustavlja proizvodnju H200 čipova i fokus prebacuje na Vera Rubin arhitekturu

Na konferenciji GTC 2026 dogodio se značajan zaokret u načinu na koji industrija promatra AI infrastrukturu. NVIDIA je implicitno priznala da GPU više nije univerzalno optimalno rješenje za sve faze umjetne inteligencije, osobito kada je riječ o rezoniranju i inferenciji, čime je dosadašnja narativna logika računalne snage temeljito redefinirana. U proteklom desetljeću NVIDIA je, oslanjajući se na CUDA ekosustav i Tensor jezgre, pozicionirala GPU kao središnji element AI računarstva, zadužen i za treniranje i za inferenciju. Međutim, ovogodišnji GTC jasno pokazuje promjenu fokusa s ideje “snažnijeg GPU-a” prema pitanju kako optimalno organizirati i orkestrirati računalnu snagu. Od platforme Vera Rubin, preko LPX inferencijskih rackova, pa sve do nadolazeće Feynman arhitekture, postaje očito da AI prelazi iz faze treniranja u fazu inferencije, dok se infrastruktura razvija iz opće namjene prema specijaliziranoj podjeli rada. Podatkovni centri sve se češće opisuju kao “AI tvornice”, a ključna metrika više nije performansa pojedinačnog čipa, već učinkovitost proizvodnje tokena.

Kraj GPU dominacije ili početak nove podjele rada

Izvršni direktor Jensen Huang naglasio je kako AI ubrzano prelazi iz ere treniranja modela u eru inferencije, pri čemu se cijeli tehnološki sloj mora iznova definirati. U tom kontekstu NVIDIA više ne pozicionira GPU kao jedini nosivi stup, već kao dio šireg heterogenog sustava koji uključuje CPU, LPU i druge specijalizirane akceleratore. Time se napušta koncept univerzalne računalne snage u korist slojevite arhitekture optimizirane za različite tipove zadataka.

Prema mišljenju industrijskih analitičara, LPU-ovi će imati važnu, ali zasad ograničenu ulogu, ponajprije zbog visoke cijene i složenosti implementacije, osobito zbog velikih količina integriranog SRAM-a koji značajno povećava troškove. Istodobno, GPU-i zadržavaju ključnu ulogu u zahtjevnim zadacima poput složene inferencije i generiranja sadržaja, dok se specijalizirani procesori koriste za zadatke s niskom latencijom.
Zaključak je jasan: budući podatkovni centri neće se oslanjati na jedan tip procesora, već na koordinirani rad više arhitektura.

CPU se vraća u središte AI infrastrukture

Jedan od najzanimljivijih pomaka na GTC-u je rastuća važnost CPU-a u AI sustavima. NVIDIA kroz vlastite CPU inicijative pokušava ojačati ulogu procesora kao ključnog elementa orkestracije unutar “AI tvornica”.
Stručnjaci ističu da CPU u ovoj novoj paradigmi nije konkurent GPU-u, već njegov koordinator jer upravlja zadacima poput raspoređivanja, izvršavanja alata i održavanja stanja sustava. Upravo zbog rasta agentičkog AI-ja očekuje se eksplozija potražnje za CPU resursima. Istovremeno, tradicionalna x86 arhitektura i dalje ostaje nezamjenjiva za opće namjene poput operativnih sustava i baza podataka, dok Arm i slične arhitekture dobivaju prostor u specijaliziranim AI scenarijima.

Token postaje nova “valuta” AI industrije

Jedna od najprovokativnijih teza s GTC-a jest da token postaje osnovna jedinica vrijednosti u AI ekonomiji. Prema Huangu, podatkovni centri više nisu pasivna infrastruktura, već aktivne “tvornice tokena”, gdje učinkovitost proizvodnje po vatu postaje ključna metrika. NVIDIA tvrdi da ima najniži trošak tokena na tržištu, što vidi kao ključnu konkurentsku prednost. Projekcije idu još dalje jer kompanija predviđa da bi prihodi od AI čipova mogli doseći čak bilijun dolara do 2027. godine. Analitičari naglašavaju da ova promjena označava prijelaz s fokusa na pojedinačne čipove prema optimizaciji cijelog sustava, gdje su energetska učinkovitost i ukupni throughput važniji od sirove snage.

NVLink 6 i CPO: inovacija ili znak zabrinutosti

Na infrastrukturnoj razini NVIDIA je predstavila novu generaciju NVLink interkonekcije te CPO (co-packaged optics) tehnologiju razvijenu u suradnji s TSMC. Cilj je omogućiti bržu i učinkovitiju komunikaciju između komponenti unutar podatkovnih centara, no stručnjaci upozoravaju da ove tehnologije dolaze s izazovima, uključujući visoke troškove, složeno održavanje i ograničenu iskoristivost u određenim scenarijima. Istodobno, konkurencija poput Google s vlastitim TPU rješenjima postiže konkurentne rezultate uz jednostavniju arhitekturu, što dodatno pojačava pritisak na Nvidijin kompleksni ekosustav.

OpenClaw i dolazak AaaS ere

NVIDIA je na GTC-u predstavila i OpenClaw, platformu koja cilja postati operativni sustav za agentičko računarstvo, usporediv s ulogom Linuxa u serverskom svijetu. Vizija je jasna: tradicionalni SaaS model postupno će ustupiti mjesto AaaS pristupu (Agent as a Service), gdje će AI agenti preuzeti velik dio poslovnih funkcija. Stručnjaci pritom naglašavaju da takvi sustavi nisu GPU-intenzivni, već primarno CPU-intenzivni jer uključuju orkestraciju, upravljanje stanjima i integraciju s vanjskim alatima. To dodatno potvrđuje trend rasta važnosti CPU-a u AI infrastrukturi.

Zaključak

GTC 2026 nije donio samo nove proizvode, već i duboku promjenu paradigme. NVIDIA više ne gradi priču oko dominacije GPU-a, već oko cjelovitog ekosustava i optimizacije na razini sustava. Iako kompanija i dalje ima snažnu tržišnu poziciju, stručnjaci upozoravaju da prelazak s “monopola računalne snage” na kompleksan ekosustav donosi nove izazove, uključujući veće troškove, složenost i jaču konkurenciju. Jedno je sigurno: era jednostavnih AI arhitektura je završila, a budućnost pripada onima koji uspiju najbolje orkestrirati heterogenu računalnu infrastrukturu.