AMD Graphics Core Next & Southern Islands
Datum objave 28.12.2011 - Krešimir Matanović
Graphics Core Next
AMD nakon otprilike pet godina napokon iz temelja mijenja svoju GPU arhitekturu. Razlog tome je zastarjelost VLIW koncepta (najprije 5, zatim 4 u Cayman modelima), koji vrlo dobro radi s grafikom, no kod compute zadaća podbacuje zbog nemogućnosti stvaranja rasporeda unaprijed i nepostojanja dinamičkog raspoređivanja prilikom izvršavanja instrukcija. Nova arhitektura prelazi sa Streaming Processor arhitekture (četiri ALU-a (Radeon core), sa SFU-om i grananjem), na GCN arhitekturu sa tradicionalnim vektorskim 16-wide SIMD-om, tj. sa ILP-a (instruction level parallelism) na TLP (thread level parallelism). O samoj GCN arhitekturi ćemo detaljnije pisati kasnije u tekstu, a koncentrirajmo se za početak na GCN proizvode koje će AMD izbaciti u ovoj godini. Za razliku od Nvidije, AMD i ovaj put kreće od vrha i odmah predstavlja najjače modele iz nove Southern Islands porodice. Tako će počevši od siječnja 2012. godine na tržištu biti dostupan HD7970 model iz Tahiti segmenta, a odmah potom se očekuje i slabiji. Tahiti modeli su namijenjeni entuzijastima , dok će ih na tržište slijediti Pitcairn modeli namijenjeni svima željnim dobrih performansi po pristupačnijoj cijeni. I za kraj nam ostaju Cape Verde bazirani modeli, koji su namijenjeni nižem tržišnom segmentu. Što se pak "dvoglavog" Tahiti modela tiče, šuška se kako će na tržište izaći do kraja prvog kvartala 2012.
Nove Southern Islands proizvode osim nove GCN arhitekture, karakteriziraju i druge novosti. Jedna od njih je Eyefinity tehnologija druge generacije koja donosi niz poboljšanja dosadašnje tehnologije ali i neke novitete kao što je DDM Audio. Uz to je naravno i App Acceleration koji sada ima više smisla zbog GCN arhitekture i njenih dobrih GPGPU (General-purpose computing on graphics processing units) svojstava, a pod njega spadaju i Steady Video 2.0 te poboljšana UVD tehnologija. Novost je i prelazak sa 40 nm proizvodnog procesa predstavljenog prije dvije godine, na novi TSMC-ov 28 nm proizvodni proces, čime nastavljaju biti prvi s novim proizvodnim procesom još od 2005. godine i 90 nm. Southern Islands kartice će koristiti i PCEe sabirnicu treće generacije (3.0), koja ima bit rate od 8 Gigatransfera u jednoj sekundi a unazad je kompatibilna s postojećim PCIe standardima. Tu je i podrška za nadopunjeni Microsoftov DirectX 11.1 API, koji između ostalog donosi i WDDM 1.2 podršku. Novosti je kao što vidimo mnogo, a za početak krećemo s analizom GCN arhitekture.
Evolucija grafičkih procesora se prema AMD-u može podijeliti na tri ere. Prva je Fixed Function gdje su se API-ji sastojali od seta funkcijskih ulaznih točaka koje su se približno ili direktno mapirale na za njih dediciranu logiku u GPU-u. Posljednji takav API je bio DirectX 7.0, a hardver koji vežemo uz to razdoblje je prva serija Radeona (R100, RV200). Drugu eru je otvorio DirectX 8.0 s podrškom za shadere (ATI R200), a u trećoj se pojavljuje VLIW arhitektura paralelnih grafičkih jezgri. Sada AMD donosi novu Graphics Core Next arhitekturu koja donosi najnovije grafičke tehnologije zajedno sa visokim compute performansama. GCN donosi i nova rješenja za uštedu električne energije, optimizirana je za heterogene compute sisteme, skalabilna je te omogućava primjenu u Fusion sistemima.
Što ukratko novoga donosi GCN? Osnovni građevni blok je i dalje jedna ALU jedinica, no sada je osnovni radni blok GCN-a jedan 16-wide vektorski SIMD (Single Instruction Multiple Data). Jedan takav vektorski SIMD se sastoji naravno od 16 ALU jedinica, te jednog 64KB registra u kojem se drže podaci (ovaj SIMD ne treba miješati sa SIMD-om u Cayman arhitekturi). Vektorski je SIMD pak osnovni građevni blok najmanje neovisne funkcijske jedinice - CU-a (Compute Unit). Svaka se compute jedinica sastoji od četiri SIMD-a, hardverskog schedulera, jedinice grananja, L1 priručne memorije, lokalnog djelitelja podataka, četiri teksturne jedinice (svaka sa 4 load/store dohvatne jedinice) i specijalne skalarne jedinice (zadužena za aritnetičke operacije - uvjetne naredbe i transcendentalne operacije).
Kako sve radi? Jedna operacija i do 16 podatkovnih elemenata se dovode u vektorski SIMD te se procesuiraju u jednom taktu. Kao i kod ranije arhitekture, zapravo se dovodi jedan wavefront od 64 instrukcije pa je za izvršenje jednog wavefronta zapravo potrebno četiri takta, što opet znači da jedan CU u četiri takta odradi četiri wavefronta instrukcija. Fundamentalno, ovdje nastaje velika razlika u odnosu na VLIW arhitekturu. Gdje je VLIW paralelno obrađivao višestruke instrukcije iz istog wavefronta (paralelizacija na razini instrukcije), GCN izvršava jednu instrukciju iz višestrukih wavefrontova (paralelizacija na nivou threada). Tako je u slučaju postojanja ovisnih instrukcija, VLIW ostao neiskorišten i gasio pojedine ALU-e. Kod GCN-a se to neće događati upravo zbog činjenice da svaki SIMD izvršava pojedine instrukcije iz različitih wavefrontova. To ujedno znači kako će GCN sada imati visoke i konzistentne compute performanse, što VLIW nije mogao imati, dok će grafičke performanse više manje ostati jednake.
Ostatak je GPU-a ostao relazivno poznat. Frontend se sastoji od asinkronih naredbenih mehanizama i naredbenih procesora koji pune Compute jedinice, te dva geometry mehanizma. Iza CU-a se nalaze se rasteri (8 Render Back-endova - 32 color ROP-a po taktu i 128 Z/Stencil ROP-a po taktu), 768KB L2 priručne memorije, memorijski kontroleri (6 x 64 bitna kontrolera = 384 bita) i različite Fixed Function jedinice (video izlazi, PCIe kontroleri, UVD jedinica i Video Codec mehanizam (H.264 enkoder)). Sada kada smo barem malo razjasnili GCN, krenimo na konkretni proizvod - Tahiti.
Southern Islands
Tahiti je kodno ime za trenutno najmoćniji GCN bazirani GPU. Napravljen je na TSMC-ovom novom 28nm High-K procesu (sjetimo se da je prošle godine 32nm proces otkazan čime je preskočen polu-ciklus), površine je 365mm2 a sastoji se od impresivnih 4.3 milijarde tranzistora. Prethodnik, Cayman, imao je 2.64 milijarde tranzistora na površini od 389mm2. Tahiti ima čak 2048 stream procesora (ili ti ALU jedinica), koje su organizirane u 128 SIMD-ova, tj. 32 Compute jedinice. Grafička kartica koja je bazirana na najjačem Tahitiju i koja je lansirana 22.12 nosi ime HD7970. GPU na njoj radi na 925MHz, a prema onome što nam je AMD rekao overclocking je moguć i do 1.1GHz, pa čak i do 1.2GHz. Na kartici se nalazi čak 12 GDDR5 memorijskih čipova ukupnog kapaciteta 3GB koji rade na 5.5GBps, te komuniciraju preko spomenutih šest memorijskih kontrolera ukupne širine 384 bita. Time je ukupna teoretska propusnost visokih 264GB/s. Kartica ima dva dodatna priključka za napajanje (6 i 8 pinski), pa je ukupna snaga tako 300W. Video izlazi su po jedan DVI i HDMI te dva mini Display Porta. AMD Eyefinity 2.0 je podržan, a uz ostalo podržava do 6 monitora. Tu je i Fast HDMI tehnologija koja donosi 3GHz HDMI sučelje sa Frame packingom za Stereo 3D koje je u stanju "progurati" 1080p sliku pri 60Hz za svako oko (120Hz ukupno). Dosadašnjih 48Hz (24Hz za svako oko) bilo je sasvim dovoljno za video materijal, no ne i za gaming.
Kartica donosi poboljšan rashladni sistem s većom protočnosti zraka te nižom obećanom bukom. S obzirom da je buka bila velik problem kod AMD-ovih high-end kartica prošle generacije, nadamo se da je ovaj put to riješeno. Za snižavanje buke AMD je primjenio novi dizajn turbinskog ventilatora sa šire razmaknutim krilcima, a ujedno je i snižen broj okretaja na između 2000 i 2400 u jednoj minuti. I aluminijsko-bakreni hladnjak je doživio promjene, pa bi ukupne performanse trebale biti bolje. Baš kao i kod Cayman kartica i ova donosi dva BIOS-a i mogućnost izbora preko tipke smještene na vrhu kartice. Jedan je BIOS zaštićen i sa tvorničkim postavkama, a drugi je moguće zamijeniti sa custom vezrijom. Poboljšanja dolaze i u vidu snižavanja potrošnje prilikom stanja mirovanja, a AMD uvodi Zero Core Power tehnologiju. Ona tijekom tzv. long idle-a u potpunosti gasi karticu i snižava potrošnju na samo 3W (uključeni ostaju memory refresh i PCIe). Uz to, tijekom. statičkog ekrana (Active Idle), čipu se takt snižava na 27MHz, a potrošnja ne prelazi 15W.
AMD s novim karticama uvodi i novosti tipa Partially Resident Textures pri čemu se memorija grafike ponaša kao hardverski kontrolirana priručna memorija - podaci o teksturama se mogu slati na zahtjev. Ovime se poboljšava memorijska efikasnost i kvaliteta prikaza slike kod vrlo velikih i detaljnih tekstura. Iskorištavanje ove tehnologije se očekuje u igrama sljedeće generacije. Poboljšana je i kvaliteta filtriranja tekstura. Anisotropic algoritam je poboljšan, ima nove filtere, reducira ljeskanje artefakata, te je potpuno neovisan o kutu gledanja.
Eyefinity 2.0 donosi ujedinjenje Eyefinity i HD3D tehnologija, a Tahiti postaje prvi GPU koji sam može dati sliku na tri Stereo3D monitora koji koriste Display Port 3D tehnologiju. Novost je i Discrete Digital Multi-Point Audio koji eliminira problem streamanja samo jedog audio signala. HD7900 serija kartica je prva koja može simultano streamati višestruke neovisne audio signale, čime se otvaraju nove mogućnosti kod korištenja više monitora. Automatski je omogućeno da audio signal prati video signal ukoliko ga prebacujemo s jednog ekrana na drugi. Eyefinity donosi i nove mogućnosti konfiguriranja monitora (5x1 u portrait i landscape konfiguraciji), donosi fleksibilnu kompenzaciju okvira, 16k x 16k podršku, zatim podešavanje custom rezolucija, te ručno pozicioniranje Taskbar izbornika (s Catalystima 12.2 će ga biti moguće smjestiti npr. na centralni monitor pri čemu monitori okolo donose lijeve odnosno desne radne površine).
Pod AMD APP Acceleration tehnologiju spadaju dedicirani hardverski ubrzivači HD videa, poboljšane compute mogućnosti GPU-a čime se u potpunosti iskorištavaju nove "compute" aplikacije omogućene od strane APP SDK-a. Poboljšani UVD 3 donosi Multi-Wiev Codec i MPEG-4 / DivX podršku, a novost je i Dual stream HD+HD. Novost je Video Codec Engine, pod koji spada multi-stream hardverski H.264 enkoder, koji radi u dva moda - full fixed i hybrid (s compute funkcijom). VCE je u stanju enkodirati video materijal 1080p @ 60Hz kvalitete brzinom većom od "stvarnog vremena" i to vrlo efikasno u pogledu potrošnje energije.
Sve u svemu, AMD je novom generacijom grafičkih procesora i grafičkih kartica čini se ozbiljno zaprijetio Nvidiji i na frontu gdje su dosad bili najjači. Iako su grafičke performanse vrlo bitne, najveći se napad desio na compute polju. Tu su do sada gubili zbog drugačije (neefikasne) arhitekture i to je polje na kojem su najviše morali poraditi. Razvoj je doveo do nove GCN arhitekture, prve velike izmjene nakon pet godina, okrenute podjednako grafičkim i compute performansama. Dok sami ne testiramo HD7970 model nećemo znati koliko je konktretno bolja, no po recenzijama na internetu koje se pojavljuju od prošlog tjedna je vidljivo kako je kartica u igrama brža od GTX580 za u prosjeku 20%, te svakako drži korak s njom u compute performansama. Što se potrošnje tiče tu je znatno efikasnija, svakako hladnija u odnosu na prethodnicu no ujedno i jednako glasna. HD7970 na test nažalost nećemo dobiti sve do iza Nove godine, a tada (iza 9.siječnja), bi se trebala pojaviti i u prodaji po preporučenoj cijeni od 549 USD.