ATI Radeon HD5870 – neukroćena zvijer
Datum objave 23.09.2009 - Krešimir Matanović
Arhitektura
Glavni ciljevi dizajniranja novog grafičkog procesora kodnog
imena Cypress su bili potpuna hardverska i softverska integracija DX11 podrške
prije samog pojavljivanja API-a na tržištu, zatim maksimiziranje performansi
pod DX9, 10 i 10.1 API-ima, puna hardverska implementacija OpenCL1.0 i DirectCompute11 API-a,
dvostruki porast snage u odnosu na prethodnu seriju, te uvođenje Eyefinity
tehnogije kao i poboljšanje kvalitete prikaza. Nova TeraScale 2 arhitektura
tako donosi preko 2 TeraFLOPS-a procesorske snage (2.7 u slučaju HD5870 modela).
Prelazak na niži, 40nm proizvodni proces znači kako je sada na nešto veću
površinu bilo moguće "strpati" više nego duplo veći broj tranzistora
nego kod prethodne serije. RV770 je imao površinu od 263mm2, a u slučaju RV870
je ona 27% veća – 334mm2. U tih 334mm2 smješteno je
2.15 milijarde tranzistora što je povećanje od 125% (RV770 ih je imao 956
milijuna). To znači kako sada RV870 ima 20 SIMD (Single Instruction, Multiple
Data) jezgri od kojih svaka ima 16 thread procesora koji se pak svaki sastoji od
5 stream jezgri. Ukupno je to 1600 stream jezgri (shadera) što je duplo više
od RV770 čipa i čak pet puta više od RV670. Teksturnih jedinica je sada 80
(4 po SIMD jezgri). Propusnost tekstura je sada na 68 milijardi bilinearno
filtriranih teksela po sekundi, te do 272 milijardi 32-bitnih dohvata u sekundi.
I priručna memorija je doživjela promjene, L2 je udvostručen na 128kb po memorijskom
kontroleru, L1 priručna memorija ima do propusnost od 1TB/s, a komunikacija
između L1 i L2 se odvija brzinom od 435GB/s. Memorijsko sučelje i dalje podržava
GDDR5 memoriju te sada nudi maksimalni bandwidth od 153GB/s (115GB/s kod RV770).
AntiAliasing Resolve je povećan sa 64 na 128, a Z/Stencil sa 64 na 128. Poboljšano
je i dinamičko upravljanje snagom, koje spušta potrošnju kartice u stanju
mirovanja na svega 27W, dok pri maksimalnom optrećenju potrođnja ne bi smjela
prelaziti 188W (povećanje od 17% u odnosu na prethodnika). Tu je i hardverska
detekcija temperature napojnih regulatora kako bi se izbjeglo pregrijavanje.
Dodana je i ULPS (Ultra Low Power State) funkcija za multi-GPU konfiguracije.
Grafička jezgra ima dvostruki rasterizator i novu teselacijsku
jedinicu šeste generacije. Ona je programabilna preko DX11 Hulla i Domain
Shadera, ubačen je novi algoritam za smanjenje artefakata, a poboljšane su
performanse za konstantno ažuriranje buffera. Ubrzana je i Geometry Shading
funkcija, a i OpenGL podrška je doživjela izmjene (12-bitna subpiksel preciznost
i poboljšano renderiranje linija).
Thread procesori imaju 2.7 TeraFLOPS-a jednostruku i 544 GigaFLOPS-a
dvsotruku preciznost. Svaki od njih uključuje četiri stream jezgre i jednu
stream jezgru specijalne namjene, zatim jedinicu za grananje i registre opće
namjene. Dizajn donosi i povećanu inter-procesnu komunikaciju kroz niz poboljšanja.
Filtriranje tekstura je također doživjelo promjene, pa je tako Anisotropic
algoritam nov, i sada (kao na Nvidiji) nije ovisan o kutu gledanja (invarijantan
je) te nema pada performansi u odnosu na filter iz prethodne generacije. Poboljšan
je i LOD (level of detail) menadžment za višu kvalitetu. Render back-endovi
(ROP) su također izmjenjeni. Teksturne jedinice sada mogu čitati kompresirane
AntiAliasing buffere boje, a poboljšane su i CFAA performanse. Uzorkovanje
sjenčanja je povećano, kao i MRT (Multiple Render Targets, renderiranje više
neovisnih slika u jednom prolazu) performanse. Tu je i Supersample AA koji
je efikasnije implementiran a djeluje na shadere, teksture i rubove poligona,
te bez problema radi sa CFAA.
I memorijsko sučelje je doživjelo određene promjene. Okolina
memorijskog kontrolera je optimizirana, a dodan je EDC (Error Detection Code),
koji vrši CRC provjere na transferima podataka (poboljšana pouzdanost na višim
taktovima). GDDR5 je u mogućnosti doseći brzine od 5Gbps, a poboljšanjima
je omogućeno i brže mijenjanje napona i takta bez zastoja.
Sa strane Stream Computinga bitna je za napomenuti puna hadrverska
implementacija DirectCompute 11 i OpenCL 1.0 API-a, te usuglašenost sa
IEEE754-2008 standardom za računanje sa pomičnim zarezom. Novost je i Memory
Export Buffer koji spaja memorijske zapise te razmješta do 64 32-bitnih vrijednosti
po taktu. Dodane su i neke funkcionalnosti iznad OpenCL 1.0, kao što su 32-bitne
Atomic operacije, fleksibilno dijeljenje 32KB lokalnih podataka, dijeljenje
64KB globalnih podataka, globalna sinkronizacija kao i Pridodani/Potrošeni
bufferi.
Velika novost je i ATI Eyefinity tehnologija koja omogućava
spajanje do 6 30" monitora maksimalne rezolucije 7680×3200 ili masivnih
24.6 Megapiksela. Ovo je postignuto korištenjem fleksibilne arhitkture koja
podržava do šest 10-bitnih cjevovoda za monitore. Kombinacije koje se mogu
koristiti su praktički beskrajne, a neke od njih je moguće vidjeti i na slici
iznad. Po jednom GPU-u je moguće postaviti šest DisplayPort izlaza, a AMD
će u doglednoj budućnosti izbaciti i HD5870 Eyefinity6 Edition verziju kartice
sa 6 DisplayPortova. Ukoliko se pitate da li je HD5870 dovoljno moćna da zavrti
igru u 7680×3200, odgovor je da. AMD je to demonstrirao na primjeru WOW-a
koji se na toj rezoluciji vrtio u pristojnih 80-tak FPS-a, no dok sami ne
isprobamo nećemo im baš vjerovati Samsung će kao AMD-ov partner predstaviti
23" monitor rezolucije 1920×1080 koji ima ultra tanke stranice razvijen
specijalno za Eyefinity.
Forum
Objavljeno prije 17 minuta
Youtube premiumObjavljeno prije 19 minuta
LCDi, Plazme i ostali televizori - pročitaj prvi post prije postavljanja pitanjaObjavljeno prije 30 minuta
AMD Ryzen "ZEN5" (9000 CPU series) Info threadObjavljeno prije 44 minute
AutomobiliObjavljeno prije 49 minuta
PlayStation 5Novosti
Što su veliki jezični modeli ili LLM?
Što je LLM? Veliki jezični modeli (LLM) su klasa temeljnih modela koji su obučeni na velikim količinama podataka kako bi pružili temeljne mogućnosti potrebne za pokretanje višestrukih slučajeva upotrebe i aplikacija te rješavanje velikog br... Pročitaj više
Šuška se da Google planira spojiti Chrome OS s Androidom, pa čak i stvoriti prijenosno računalo
Google ne samo da nastavlja poboljšavati Android sustav, već je također pokrenuo vlastiti Pixel Tablet, kodnog naziva Snowy, a sada se šuška da bi sljedeći korak mogao biti integracija Chrome OS-a za računala s Androidom. Ovaj potez navodno... Pročitaj više
Microsoft lansira Azure Integrated HSM, Azure Boost DPU i nove akceleratore za AI računalstvo na Ignite 2024
Na ovogodišnjem događaju Microsoft Ignite 2024, Microsoft je najavio niz novih tehnologija i inovacija koje imaju za cilj unaprijediti Azure usluge u oblaku, posebno u kontekstu sigurnosti podataka i računalnih resursa za umjetnu inteligenc... Pročitaj više
Google dodaje funkciju "memorije" u Gemini AI model za poboljšanje korisničkog iskustva
Google je najavio novu funkcionalnost za svoj Gemini Advanced AI model, koja omogućuje memoriju, odnosno sposobnost pamćenja prethodnih interakcija i preferencija korisnika. Ova funkcija, koja je trenutno dostupna samo za odabrane korisnike... Pročitaj više
Antimonopolska tužba između FTC-a i Mete uskoro će ići na suđenje, možda će morati razdvojiti Instagram i WhatsAppa
Antimonopolska tužba između Savezne trgovinske komisije (FTC) i Meta Platforms (bivši Facebook) u kojoj se istražuje spajanje Meta sa Instagramom i WhatsAppom mogla bi imati dalekosežne posljedice za tehnološku industriju, a suđenje koje je... Pročitaj više
Sve novosti