Tko su vodeći proizvođači AI čipova?
Konkurencija na tržištu AI čipova više nije ograničena samo na GPU-ove, a TrendForce predviđa da će prilagođeni ASIC čipovi pružatelja cloud usluga do 2026. činiti značajan udio tržišta dok se očekuje rast isporuka za 44,6%, dok će isporuke GPU-a porasti za 16,1%, što pokazuje da operateri hiperskalnih podatkovnih centara sve više ulažu u razvoj vlastitih čipova.
NVIDIA je i dalje vodeći proizvođač AI čipova s dugom tradicijom u dizajnu GPU-a za videoigre, a njihovi DGX Spark stolni AI superračunari i čipovi temeljem arhitektura Ampere, Hopper i Blackwell koriste se za treniranje i inferenciju velikih AI modela u podatkovnim centrima, dok DGX Cloud i NVIDIA Dynamo omogućuju fleksibilan pristup GPU resursima i značajno ubrzavaju performanse AI modela, uključujući multimodalne i generativne sustave, čime NVIDIA gotovo monopolizira tržište cloud AI infrastrukture.
AMD se natječe s NVIDIA-om zahvaljujući svojim MI300 i MI350 serijama grafičkih kartica koje se koriste za treniranje i inferenciju AI modela, a akvizicije tvrtki poput Untether AI i Brium povećale su njihove mogućnosti u razvoju energetski učinkovitih AI inferencijskih čipova i optimizaciji softverskih performansi, dok softverski paket zahtijeva više konfiguracije u usporedbi s NVIDIA-inom CUDA platformom. Intel, kao dugogodišnji lider na tržištu CPU-a, razvija vlastite AI procesore poput Gaudi3 s integriranom AI-akceleracijom, iako se očekuje da će prihodi biti znatno manji od prihoda vodećih konkurenata. AWS proizvodi vlastite Tranium i Inferentia čipove koji se koriste za treniranje i inferenciju AI modela u njihovim podatkovnim centrima, dok Google razvija Cloud TPU, uključujući najnoviji Ironwood čip šeste generacije, s visokim paralelnim kapacitetom i energetskom učinkovitošću za LLM i MoE modele.
Alibaba proizvodi čipove poput Hanguang 800 namijenjene AI inferenciji, a IBM je lansirao AIU čipove temeljem Telum procesora za pokretanje platforme Watson.x, dok Groq razvija LPU arhitekture fokusirane na LLM inferenciju, a SambaNova Systems nudi SN40L čipove i AI platformu kao uslugu za masovne generativne AI zadatke. Cerebras je poznat po čipovima na razini wafer-a s milijunima AI jezgri, koji se koriste u istraživačkim laboratorijima i farmaceutskim projektima, dok d-matrica koristi računalstvo u memoriji umjesto von Neumannove arhitekture, što je nova i neprovjerena metoda.
Rebellions je južnokorejski startup fokusiran na LLM inferenciju i proizvodi Rebel-Quad čipove u suradnji sa Samsungom, a Tenstorrent razvija Wormhole čipove za servere i desktop rješenja, dok Eetched izrađuje ASIC čipove s ugrađenom arhitekturom transformatora, a Extropic istražuje termodinamičko računarstvo i Vaire se fokusira na reverzibilno računarstvo kako bi smanjio potrošnju energije kod AI zadataka. Apple razvija ACDC projekt za AI čipove namijenjene zaključivanju, dok Meta proizvodi MTIA čipove za treniranje i inferenciju svojih LLaMa modela, a Microsoft Azure radi na Maia 100 i novom Braga čipu za optimizaciju AI radnih opterećenja u svojim cloud uslugama. OpenAI u suradnji s Broadcomom i TSMC-om razvija vlastiti AI čip na 3nm procesu s ciljem masovne proizvodnje do 2026. godine.
