AMD RDNA arhitektura
Datum objave 22.06.2019 - Krešimir Matanović
AMD RDNA arhitektura
AMD će početkom sljedećeg mjeseca lansirati dvije nove grafičke kartice čiji su grafički procesori kodnog imena Navi sazdani na potpuno novoj RDNA (Radeon DNA) arhitekturi. RDNA zamjenjuje i nasljeđuje poznatu GCN staru sedam godina. Donosi velike arhitekturalne promjene i tamo gdje je GCN bila iznimno moćna, matematički proračuni, RDNA donosi novu filozofiju koja je primjerenija za igre. Detalje o RDNA arhitekturi smo iz prve ruke u Los Angelesu saznali od glavnog AMD-ovog GPU arhitekta Mikea Mantora.
No, prije dubinske analize koju nam je priredio Mike, David Wang, viši potpredsjednik Radeon Technologies grupe je prisutnima objasnio koju su viziju imali s novom arhitekturom.
AMD-ova je misija ugurati Radeon brand i RDNA arhitekturu svugdje, počevši od PC-a, Macova, preko konzola, pa do cloud i mobilnih uređaja. Za sada im to dobro i ide jer su predstavili nove Radeone za desktop računala, Radeon će biti u novim PlayStation i Xbox uređajima, u cloud ulaze preko Google Stadie i za kraj, Samsung je preuzeo RDNA za svoje mobilne SoC-eve. To sve je moguće jer je RDNA fleksibilna i skalabilna arhitektura na kojoj mogu biti sazdani procesori od par watta pa do stotinu watta.
RDNA ili Radeon DNA je novi gaming DNA AMD-a koji kombinira novi 7-nanometarski proizvodni proces za čipove, GDDR6 memoriju, podršku za PCIe 4.0 protokol, te novi multimedijski mehanizam i novi display mehanizam. Sve u svrhu poboljšavanja igračkog iskustva.
Arhitekturalno, RDNA donosi potpuno novi dizajn računskih jedinica, novu multi level hijerarhiju priručne memorije i poboljšani grafički cjevovod. Novi dizajn računskih jedinica (compute unit) donosi dva puta bržu obradu instrukcija, dual mode izvršavanje instrukcija i resource pooling. Računska je jedinica sada koordinirana kao radna grupa procesora. CU u RDNA i GCN-u se stoga ne može uspoređivati.
Ciljevi za novu arhitekturu su bili smanjenje latencije izvršavanja, povećanje single threaded performansi, i povećanje efikasnosti priručne memorije. 64 dretve (threada) se sada mogu grupirati u dva vala od po 32 koje onda izvršavaju dva SIMD- a, a te 32 instrukcije se izdaju u svakom taktu. Visoka je iskorištenost ALU jedinice, a na svim je nivoima ubrzan pristup priručnoj memoriji.
Nova arhitektura donosi i poboljšani Delta Color Compression. Grafički je cjevovod poboljšan, dobiveno je 25% povećanja IPC-a po taktu zbog optimizacija, uz smanjenje površine od 40%. Korišteno je inženjersko znanje i iskustvo iz procesorske Zen arhitekture, pa je uveden gate clocking što je dovelo i do povećanja efikasnosti za 12 %. Sve je to rezultiralo povećanjem efikasnosti od 50% u odnosu na prethodnu generaciju kada se uspoređuju čipovi iste power konfiguracije, pri čemu sami 7 nm proizvodni proces sudjeluje s oko 30 %. Uspoređujući Navi 10 i Vegu 64, prvi ima povećanje od 14% apsolutnih performansi, za 23 % manju potrošnju i upola manju površinu čipa.
Četiri su dosadašnje velike arhitekturalne promjene obilježile razdoblje najprije ATI-a, pa kasnije AMD-a, tj. Radeon tehnološke jedinice. Arhitektura fiksne je funkcije najprije zamijenjena arhitekturom jednostavnih vertex i pixel shadera koja je živjela od 2001. do 2007. godine, kada ju je zamijenila TeraScale arhitektura unificiranih shadera s VLIW (very long instruction word), namijenjena iskorištavanju visoke paralelizacije izvršavanja instrukcija (ILP) koja je živjela sve do GCN-a. GCN arhitektura je predstavljena 2012. kada je donijela RISC SIMT (reduced instruction set computer; single instruction, multiple thread) arhitekturu u potpunom kontrastu od VLIW-a. GCN je zahtijevala puno više tranzistora, no bila je nenadmašna u GPGPU komputacijama što su kao što znamo iskoristili mnogi “majneri”. Sada konačno ulazimo u petu eru s RDNA arhitekturom koja donosi velike promjene i čiji unificirani shaderi odrađuju i skalare (numerička vrijednost) i vektore (numerička vrijednost i smjer), istovremeno, u punoj SIMT ILP implementaciji.
GCN arhitektura je mogla obrađivati ili izvršavati šesnaest instrukcija istovremeno (ima četiri SIMD16 vektorske jedinice), no ne u jednom ciklusu takta, nego najčešće u četiri s iskoristivosti ALU-a od oko 25%. Kod kompliciranih je to kalkulacija u redu, no kod jednostavnijih računska jedinica i cijeli GPU postaju manje efikasni, i zahtijevaju odlično riješen scheduler i cjevovode kako bi bili u potpunosti iskorišteni. Odlično je to za GPGPU i velike proračune, no za igre baš i ne. Stoga su za unaprjeđivanje izvršavanja koda igara morali razviti drugačiji pristup i drugačiju arhitekturu.
RDNA koristi dvije SIMD32 jedinice, pa se val od 64 dretve dijeli na dva od 32 (Wave32) i izvršava u jednom taktu umjesto u četiri. Stoga je računska jedinica efikasnija, a aritmetičko-logička jedinica iskorištena u potpunosti cijelo vrijeme. Još jedan zanimljiv detalj je da su dvije računske jedinice sada dio istog sklopa te dijele resurse, pa mogu biti istovremeno iskorištene u većoj radnoj grupi čime se smanjuje latencija.
SIMD jedinica je u RDNA dakle povećana sa širine 16 na 32, redizajnirana je za bolje single thread performanse, ima dediciranu jedinicu za izdavanje instrukcija, dediciranu skalarnu jedinicu, poboljšanu arbitražu i dohvat, te Full Rate 32b ili Dual 16b ALU. Rezultati su skraćeno vrijeme za izvršavanje wavefronta (warp, val) i poboljšana efikasnost. Izvršna jedinica je tolerantnija na različit kod, a scheduler zna što se nalazi u priručnoj memoriji te se pokreće od strane kompajlera. Izvršavanje vala širine 32 se odvija u jednom taktu, zauzima manje priručne memorije, troši manje resursa za pokretanje (GPRS), više je SIMD-ova aktivirano istovremeno i općenito je manje posla pa se efikasnije skriva ukupna latencija mehanizma. Izvršavanje vala širine 64 instrukcije traje dva takta (nativno), smanjuje zastoje u ALU cjevovodu, povećava efikasnost i smanjuje (skriva) latencije.
Veliko je znanje iz dizajniranja CPU-a, konkretno Zen arhitekture korišteno u izradi nove RDNA arhitekture, pa je u GPU diviziju iz CPU divizije stigao Sam Naffziger koji je poznati “mikroarhitekt” i koji se posvetio low power inženjeringu. Uveli su neke od poznatih low power tehnologija u novu arhitekturu kao što je clock gating, ali u svemu najbitnija je nova multi-level arhitektura priručne memorije poznata iz CPU svijeta. Uvedena je L1 priručna memorije koja povećava propusnost arhitekture, smanjuje latenciju i potrošnju energije ali i pridonosi smanjenju zagušenja L2 memorije. Navi 10 XT čip donosi 40 compute jedinica u kojima je 80 skalar procesora, 2560 stream procesora i 160 64b bi-linearnih filter jedinica. L2 memorije je 4 MB, te je ukupno 512 KB L1.
Novi Delta Color Compression algoritam sada bolje kompresira, a novost je da shaderi mogu čitati i zapisivati kompresirane podatke iz ili u priručnu memoriju, isto tako kao što i display jedinica može čitati kompresirane podatke direktno iz priručne memorije čime se postiže veća efikasnost.
Poboljšanja na grafičkom mehanizmu uključuju četiri asinkrona compute mehanizma s priority tunnelingom, centralizirani geometrijski procesor s četiri primitive jedinice, s ravnomjernim upravljanjem – vertex reuse, primitive assembly, reset index, i ravnomjernom distribucijom pre i post teseliranja. Shader culling primitiva je po sistemu 4 out – 8 in. Asinkroni compute je poboljšan tunnelingom, koji zaustavlja pokretanje cjevovoda, dok ostali valovi nisu u potpunosti napustili cjevovode.
AMD tvrdi kako je u odnosu na GCN, RDNA 50% brža za istu snagu, tj. potrošnju električne energije. Ključni doprinos poboljšanju performansi je IPC (instructions per clock) ili kako to AMD opisuje “performance per clock enhancement”. Sljedeći veliki faktor je novi TSMC-ov 7 nanometarski proces koji je full node i s veličinom je tranzistora usporediv s Intelovim 10 nanometarskim procesom, a poboljšanja u frekvenciji (viši takt) i power menadžmentu su zaslužna za ostatak.
Navi 10 u odnosu na Vegu 64 donosi već spomenutih 14% povećanja apsolutnih performansi uz 23% smanjenja potrošnje. To je rezultiralo 50% višim performansama po utrošenom wattu energije. Navi 10 ima površinu od 251 milimetar kvadratni u odnosu na 495 milimetara kvadratnih koje ima Vega 10.
Novi grafički čipovi bazirani na RDNA donose i novi media te display mehanizam. Media mehanizam je osposobljen za neometani streaming, podržava H.264 4K150/8K30 dekodiranje i 4K90 kodiranje (twitch), zatim H.265 4K60 dekodiranje i 4K90 kodiranje, te VP9 4K60 (Youtube) dekodiranje. Display engine donosi podršku za Freesync 2 HDR, HDMI 2.0b i DisplayPort 1.4 HDR. Podržava i novu Display Stream Compression 1.2a tehnologiju, te podržava 4K 240 Hz, 4K 120 Hz i 8K HDR 60 Hz izlaze i to preko jednog kabela.
Za kraj pregleda nove RDNA arhitekture ponovit ćemo kako će se prva desktop dva proizvoda bazirana na njoj pojaviti već za nekoliko tjedana i to u obliku Radeon 5700 XT i 5700 grafičkih kartica čiji nam je dizajn i konfiguracija obznanjen na Next Horizon Gaming eventu. Kartice karakterizira poznati dizajn s turbinskim ventilatorom, a po prvi pute se uvode i tri različita takta – uz standardne base i boost, sada je tu i gaming vrijednost koju ćemo najčešće i vidjeti u igrama. AMD je obje kartice namijenio 1440p igranju uz tvrdnje kako su svaka brže od svojih konkurentica (RTX 2070 i 2060), a kako je to u stvarnom svijetu igara i testova, provjerit ćemo uskoro.
Nove će grafičke kartice koštati 379 i 449 USD, a u Los Angelesu je najavljena i specijalna verzija Radeona 5700 XT 50th Anniversary Edition koji ima slatne umetke na oklopu te potpus Lise Su. Ima nešto više frekvencije (1.680/1.803/1.980 MHz) i koštat će preporučenih 499 USD.
Forum
Objavljeno prije 4 minute
S.T.A.L.K.E.R. 2: Heart of ChornobylObjavljeno prije 5 minuta
Zimske jakneObjavljeno prije 50 minuta
Path of Exile 2Objavljeno prije 5 sati
SAMO LINKOVI na akcije, popuste i super niske cijene-isključivo informatička oprema!Objavljeno prije 5 sati
to trenutno igrate?Novosti
Što su veliki jezični modeli ili LLM?
Što je LLM? Veliki jezični modeli (LLM) su klasa temeljnih modela koji su obučeni na velikim količinama podataka kako bi pružili temeljne mogućnosti potrebne za pokretanje višestrukih slučajeva upotrebe i aplikacija te rješavanje velikog br... Pročitaj više
Šuška se da Google planira spojiti Chrome OS s Androidom, pa čak i stvoriti prijenosno računalo
Google ne samo da nastavlja poboljšavati Android sustav, već je također pokrenuo vlastiti Pixel Tablet, kodnog naziva Snowy, a sada se šuška da bi sljedeći korak mogao biti integracija Chrome OS-a za računala s Androidom. Ovaj potez navodno... Pročitaj više
Microsoft lansira Azure Integrated HSM, Azure Boost DPU i nove akceleratore za AI računalstvo na Ignite 2024
Na ovogodišnjem događaju Microsoft Ignite 2024, Microsoft je najavio niz novih tehnologija i inovacija koje imaju za cilj unaprijediti Azure usluge u oblaku, posebno u kontekstu sigurnosti podataka i računalnih resursa za umjetnu inteligenc... Pročitaj više
Google dodaje funkciju "memorije" u Gemini AI model za poboljšanje korisničkog iskustva
Google je najavio novu funkcionalnost za svoj Gemini Advanced AI model, koja omogućuje memoriju, odnosno sposobnost pamćenja prethodnih interakcija i preferencija korisnika. Ova funkcija, koja je trenutno dostupna samo za odabrane korisnike... Pročitaj više
Antimonopolska tužba između FTC-a i Mete uskoro će ići na suđenje, možda će morati razdvojiti Instagram i WhatsAppa
Antimonopolska tužba između Savezne trgovinske komisije (FTC) i Meta Platforms (bivši Facebook) u kojoj se istražuje spajanje Meta sa Instagramom i WhatsAppom mogla bi imati dalekosežne posljedice za tehnološku industriju, a suđenje koje je... Pročitaj više
Sve novosti