AMD RDNA arhitektura
Datum objave 22.06.2019 - Krešimir Matanović
AMD RDNA arhitektura
AMD će početkom sljedećeg mjeseca lansirati dvije nove grafičke kartice čiji su grafički procesori kodnog imena Navi sazdani na potpuno novoj RDNA (Radeon DNA) arhitekturi. RDNA zamjenjuje i nasljeđuje poznatu GCN staru sedam godina. Donosi velike arhitekturalne promjene i tamo gdje je GCN bila iznimno moćna, matematički proračuni, RDNA donosi novu filozofiju koja je primjerenija za igre. Detalje o RDNA arhitekturi smo iz prve ruke u Los Angelesu saznali od glavnog AMD-ovog GPU arhitekta Mikea Mantora.
No, prije dubinske analize koju nam je priredio Mike, David Wang, viši potpredsjednik Radeon Technologies grupe je prisutnima objasnio koju su viziju imali s novom arhitekturom.
AMD-ova je misija ugurati Radeon brand i RDNA arhitekturu svugdje, počevši od PC-a, Macova, preko konzola, pa do cloud i mobilnih uređaja. Za sada im to dobro i ide jer su predstavili nove Radeone za desktop računala, Radeon će biti u novim PlayStation i Xbox uređajima, u cloud ulaze preko Google Stadie i za kraj, Samsung je preuzeo RDNA za svoje mobilne SoC-eve. To sve je moguće jer je RDNA fleksibilna i skalabilna arhitektura na kojoj mogu biti sazdani procesori od par watta pa do stotinu watta.
RDNA ili Radeon DNA je novi gaming DNA AMD-a koji kombinira novi 7-nanometarski proizvodni proces za čipove, GDDR6 memoriju, podršku za PCIe 4.0 protokol, te novi multimedijski mehanizam i novi display mehanizam. Sve u svrhu poboljšavanja igračkog iskustva.
Arhitekturalno, RDNA donosi potpuno novi dizajn računskih jedinica, novu multi level hijerarhiju priručne memorije i poboljšani grafički cjevovod. Novi dizajn računskih jedinica (compute unit) donosi dva puta bržu obradu instrukcija, dual mode izvršavanje instrukcija i resource pooling. Računska je jedinica sada koordinirana kao radna grupa procesora. CU u RDNA i GCN-u se stoga ne može uspoređivati.
Ciljevi za novu arhitekturu su bili smanjenje latencije izvršavanja, povećanje single threaded performansi, i povećanje efikasnosti priručne memorije. 64 dretve (threada) se sada mogu grupirati u dva vala od po 32 koje onda izvršavaju dva SIMD- a, a te 32 instrukcije se izdaju u svakom taktu. Visoka je iskorištenost ALU jedinice, a na svim je nivoima ubrzan pristup priručnoj memoriji.
Nova arhitektura donosi i poboljšani Delta Color Compression. Grafički je cjevovod poboljšan, dobiveno je 25% povećanja IPC-a po taktu zbog optimizacija, uz smanjenje površine od 40%. Korišteno je inženjersko znanje i iskustvo iz procesorske Zen arhitekture, pa je uveden gate clocking što je dovelo i do povećanja efikasnosti za 12 %. Sve je to rezultiralo povećanjem efikasnosti od 50% u odnosu na prethodnu generaciju kada se uspoređuju čipovi iste power konfiguracije, pri čemu sami 7 nm proizvodni proces sudjeluje s oko 30 %. Uspoređujući Navi 10 i Vegu 64, prvi ima povećanje od 14% apsolutnih performansi, za 23 % manju potrošnju i upola manju površinu čipa.
Četiri su dosadašnje velike arhitekturalne promjene obilježile razdoblje najprije ATI-a, pa kasnije AMD-a, tj. Radeon tehnološke jedinice. Arhitektura fiksne je funkcije najprije zamijenjena arhitekturom jednostavnih vertex i pixel shadera koja je živjela od 2001. do 2007. godine, kada ju je zamijenila TeraScale arhitektura unificiranih shadera s VLIW (very long instruction word), namijenjena iskorištavanju visoke paralelizacije izvršavanja instrukcija (ILP) koja je živjela sve do GCN-a. GCN arhitektura je predstavljena 2012. kada je donijela RISC SIMT (reduced instruction set computer; single instruction, multiple thread) arhitekturu u potpunom kontrastu od VLIW-a. GCN je zahtijevala puno više tranzistora, no bila je nenadmašna u GPGPU komputacijama što su kao što znamo iskoristili mnogi “majneri”. Sada konačno ulazimo u petu eru s RDNA arhitekturom koja donosi velike promjene i čiji unificirani shaderi odrađuju i skalare (numerička vrijednost) i vektore (numerička vrijednost i smjer), istovremeno, u punoj SIMT ILP implementaciji.
GCN arhitektura je mogla obrađivati ili izvršavati šesnaest instrukcija istovremeno (ima četiri SIMD16 vektorske jedinice), no ne u jednom ciklusu takta, nego najčešće u četiri s iskoristivosti ALU-a od oko 25%. Kod kompliciranih je to kalkulacija u redu, no kod jednostavnijih računska jedinica i cijeli GPU postaju manje efikasni, i zahtijevaju odlično riješen scheduler i cjevovode kako bi bili u potpunosti iskorišteni. Odlično je to za GPGPU i velike proračune, no za igre baš i ne. Stoga su za unaprjeđivanje izvršavanja koda igara morali razviti drugačiji pristup i drugačiju arhitekturu.
RDNA koristi dvije SIMD32 jedinice, pa se val od 64 dretve dijeli na dva od 32 (Wave32) i izvršava u jednom taktu umjesto u četiri. Stoga je računska jedinica efikasnija, a aritmetičko-logička jedinica iskorištena u potpunosti cijelo vrijeme. Još jedan zanimljiv detalj je da su dvije računske jedinice sada dio istog sklopa te dijele resurse, pa mogu biti istovremeno iskorištene u većoj radnoj grupi čime se smanjuje latencija.
SIMD jedinica je u RDNA dakle povećana sa širine 16 na 32, redizajnirana je za bolje single thread performanse, ima dediciranu jedinicu za izdavanje instrukcija, dediciranu skalarnu jedinicu, poboljšanu arbitražu i dohvat, te Full Rate 32b ili Dual 16b ALU. Rezultati su skraćeno vrijeme za izvršavanje wavefronta (warp, val) i poboljšana efikasnost. Izvršna jedinica je tolerantnija na različit kod, a scheduler zna što se nalazi u priručnoj memoriji te se pokreće od strane kompajlera. Izvršavanje vala širine 32 se odvija u jednom taktu, zauzima manje priručne memorije, troši manje resursa za pokretanje (GPRS), više je SIMD-ova aktivirano istovremeno i općenito je manje posla pa se efikasnije skriva ukupna latencija mehanizma. Izvršavanje vala širine 64 instrukcije traje dva takta (nativno), smanjuje zastoje u ALU cjevovodu, povećava efikasnost i smanjuje (skriva) latencije.
Veliko je znanje iz dizajniranja CPU-a, konkretno Zen arhitekture korišteno u izradi nove RDNA arhitekture, pa je u GPU diviziju iz CPU divizije stigao Sam Naffziger koji je poznati “mikroarhitekt” i koji se posvetio low power inženjeringu. Uveli su neke od poznatih low power tehnologija u novu arhitekturu kao što je clock gating, ali u svemu najbitnija je nova multi-level arhitektura priručne memorije poznata iz CPU svijeta. Uvedena je L1 priručna memorije koja povećava propusnost arhitekture, smanjuje latenciju i potrošnju energije ali i pridonosi smanjenju zagušenja L2 memorije. Navi 10 XT čip donosi 40 compute jedinica u kojima je 80 skalar procesora, 2560 stream procesora i 160 64b bi-linearnih filter jedinica. L2 memorije je 4 MB, te je ukupno 512 KB L1.
Novi Delta Color Compression algoritam sada bolje kompresira, a novost je da shaderi mogu čitati i zapisivati kompresirane podatke iz ili u priručnu memoriju, isto tako kao što i display jedinica može čitati kompresirane podatke direktno iz priručne memorije čime se postiže veća efikasnost.
Poboljšanja na grafičkom mehanizmu uključuju četiri asinkrona compute mehanizma s priority tunnelingom, centralizirani geometrijski procesor s četiri primitive jedinice, s ravnomjernim upravljanjem – vertex reuse, primitive assembly, reset index, i ravnomjernom distribucijom pre i post teseliranja. Shader culling primitiva je po sistemu 4 out – 8 in. Asinkroni compute je poboljšan tunnelingom, koji zaustavlja pokretanje cjevovoda, dok ostali valovi nisu u potpunosti napustili cjevovode.
AMD tvrdi kako je u odnosu na GCN, RDNA 50% brža za istu snagu, tj. potrošnju električne energije. Ključni doprinos poboljšanju performansi je IPC (instructions per clock) ili kako to AMD opisuje “performance per clock enhancement”. Sljedeći veliki faktor je novi TSMC-ov 7 nanometarski proces koji je full node i s veličinom je tranzistora usporediv s Intelovim 10 nanometarskim procesom, a poboljšanja u frekvenciji (viši takt) i power menadžmentu su zaslužna za ostatak.
Navi 10 u odnosu na Vegu 64 donosi već spomenutih 14% povećanja apsolutnih performansi uz 23% smanjenja potrošnje. To je rezultiralo 50% višim performansama po utrošenom wattu energije. Navi 10 ima površinu od 251 milimetar kvadratni u odnosu na 495 milimetara kvadratnih koje ima Vega 10.
Novi grafički čipovi bazirani na RDNA donose i novi media te display mehanizam. Media mehanizam je osposobljen za neometani streaming, podržava H.264 4K150/8K30 dekodiranje i 4K90 kodiranje (twitch), zatim H.265 4K60 dekodiranje i 4K90 kodiranje, te VP9 4K60 (Youtube) dekodiranje. Display engine donosi podršku za Freesync 2 HDR, HDMI 2.0b i DisplayPort 1.4 HDR. Podržava i novu Display Stream Compression 1.2a tehnologiju, te podržava 4K 240 Hz, 4K 120 Hz i 8K HDR 60 Hz izlaze i to preko jednog kabela.
Za kraj pregleda nove RDNA arhitekture ponovit ćemo kako će se prva desktop dva proizvoda bazirana na njoj pojaviti već za nekoliko tjedana i to u obliku Radeon 5700 XT i 5700 grafičkih kartica čiji nam je dizajn i konfiguracija obznanjen na Next Horizon Gaming eventu. Kartice karakterizira poznati dizajn s turbinskim ventilatorom, a po prvi pute se uvode i tri različita takta – uz standardne base i boost, sada je tu i gaming vrijednost koju ćemo najčešće i vidjeti u igrama. AMD je obje kartice namijenio 1440p igranju uz tvrdnje kako su svaka brže od svojih konkurentica (RTX 2070 i 2060), a kako je to u stvarnom svijetu igara i testova, provjerit ćemo uskoro.
Nove će grafičke kartice koštati 379 i 449 USD, a u Los Angelesu je najavljena i specijalna verzija Radeona 5700 XT 50th Anniversary Edition koji ima slatne umetke na oklopu te potpus Lise Su. Ima nešto više frekvencije (1.680/1.803/1.980 MHz) i koštat će preporučenih 499 USD.
Forum
Objavljeno prije 13 minuta
Rasprava o akcijama, popustima i super niskim cijena-isključivo informatička oprema!Objavljeno prije 18 minuta
Kutak za trejdereObjavljeno prije 26 minuta
iPhone mobiteli - 2. dioObjavljeno prije 27 minuta
MSI Thin 15 B12UC audio problemObjavljeno prije 28 minuta
Serije - dojmovi, komentari i preporukeNovosti
Pomažemo vam odabrati najbolji laptop za svoje potrebe
U blagdansko vrijeme lako je pronaći laptop na popustu, ali kako u bogatoj ponudi odabrati onaj pravi? Pravi je trenutak da razveselite sebe ili svoje voljene dobrim laptopom. Iako se mnogi prilikom odlučivanja fokusiraju samo na glavne kom... Pročitaj više
Naučite 5 trikova za produljenje vijeka trajanja baterije
Mnogi ljudi žele prijeći na novi telefon jer se baterija prebrzo prazni, ali ako možete održavati bateriju zdravom u dobrom stanju, možete je koristiti dulje vrijeme. Ali kako točno možete održavati svoju bateriju zdravom? Stručnjak "3cTim... Pročitaj više
Otkriveno je da bi iPhone SE4 mogao biti preimenovan u iPhone 16e
Ne tako davno, mediji su razotkrili vijest o iPhoneu SE4. Kao jeftina verzija iPhonea, novi uređaj i dalje ima dobru pažnju. Međutim, najnovije vijesti pokazuju da je iPhone SE4 možda nestao i da bi ga trebalo preimenovati. Digitalni bloger... Pročitaj više
Intel Core Ultra 200H, 200U i Core 200H, 200U bit će predstavljeni na CES-u 2025
Bližimo se CES-u 2025. i počele su curiti vijesti o Intelovim novim CPU-ima koji će biti predstavljeni na događaju. Prethodno je Intel izdao dva CPU-a u seriji Core Ultra 200, CPU za prijenosno računalo Core Ultra 200V Lunar Lake i CPU za s... Pročitaj više
Nakon Elona Muska, Meta se također pridružila redovima sprječavanja OpenAI-ja da postane profitna tvrtka
Nakon što je Elon Musk podnio tužbu protiv OpenAI-ja, tvrdeći da je prekršio izvornu namjeru da se vodi javnim interesom kada je osnovan i postao tvrtka orijentirana na profit, Meta se također pridružila redovima podnošenja tužbe protiv Ope... Pročitaj više
Sve novosti