Ampere arhitektura i RTX3000 serija

Palit_RTX_3080_3090_Gaming_Pro_1

Pred nama su dvije grafičke kartice koje je Nvidia s velikom pompom predstavila prošli mjesec, a koje su odmah po izlasku izazvale velike kontroverze. Za početak ponuda nije dovoljno velika, Samsung očito ima problema s yieldom na 8 nanometara, a k tome su još poneki proizvođači škrtarili na kvalitetnim kondenzatorima.

Ipak, nisu samo proizvođači krivi u zbrci između korištenja jeftinijih i lošijih tantalskih polimernih kondenzatora za filtriranje visokih frekvencija naponskih vodova za GPU, već dio krivnje snosi i Nvidia koja im nije dala dovoljno vremena za dizajn, ali ni testiranje jer dugo nisu imali pristup adekvatnim upravljačkim programima. I tu je nastala zbrka u kojoj je jedino Asus izašao kao proizvođač koji je jedini koristio sve bolje višeslojne keramičke kondenzatore. Bilo kako bilo, još jednom se pokazalo da proizvođači vole testirati živce svojih najvjernijih kupaca, tzv. early adoptera, koji su im ujedno i beta testeri. Ovaj puta ne samo za upravljačke programe nego i za hardver.

Palit_RTX_3080_3090_Gaming_Pro_2 Palit_RTX_3080_3090_Gaming_Pro_3

U pozadini se nove RTX 3080 krije još jedna zanimljiva priča, a to je ona o promjeni dobavljača, tj. proizvođača samih GPU-a, tj. grafičkih procesora. Već je neko vrijeme poznato da je Nvidia jednostavno odustala od TSMC-a i okrenula se Samsungu koji je u zadnjih godinu dana nabavljao strojeve za povećanje kapaciteta proizvodnje mikroprocesora u 8-nanometarskom procesu. Samsung ima i napredniji 5-nanometarski proces spreman, no on još ne daje odgovarajuće prinose po wafferu. Ni 8N Nvidia kako zovu ovaj proces nije sjajan čini se jer je ipak trebalo prilagoditi ga izradi ovih masivnih grafičkih procesora koji imaju 28 milijardi tranzistora na površini od 628 kvadratnih milimetara.

Palit_RTX_3080_3090_Gaming_Pro_4

Ti čipovi kodnog imena GA102 bazirani su na novoj Ampere mikroarhitekturi koja nasljeđuje dosadašnju Turing. U osnovi se ništa drastično nije promijenilo. I dalje se GPU sastoji od GPC-a ili Graphics Processing Clustera, svaki od kojih ima određeni broj SM-ova ili Streaming Multiprocesora. Svaki SM je podijeljen u četiri dijela koji svaki može obrađivati svoje podatke. Ono što je novo je da svaki od četiri dijela SM-a (ili četiri particije) u Ampere arhitekturi ima 16 FP32 CUDA jezgri, 16 FP32/INT CUDA jezgri, Tensor jezgru treće generacije, load/store jedinice i jedinicu specijalne funkcije. Stoga će te vidjeti podatak da GA102 ima 10.752 CUDA jezgre, dok je TU102 u RTX 2080 Ti imao 4.608. No, CUDA jezgre iz ove dvije arhitekture se ne mogu uspoređivati jer se sada drugačije sve zbraja.

Palit_RTX_3080_3090_Gaming_Pro_5

Svaki od četiri SM-a ima pristup dijeljenoj L1 memoriji te video memoriji, a unutar svakog se SM-a nalazi i jedna RayTracing jezgra druge generacije. Ukupno gledajući, jedan Streaming Multiprocesor dakle ima 64 FP32 i 64 32FP/INT jezgre (128 CUDA jezgri), četiri Turing jezgre i jednu RT jezgru. Količina priručne memorije je povećana pa GA102 ima 64KB teksturne L1 memorije po SM-u, 128KB L1 memorije po SM-u, te ukupno 6.144KB dijeljenje L2 memorije. GA102 ima i 336 teksturnih jedinica, 112 render back-endova te ukupno 84 SM-a sa 10.752 FP156 jedinice (168 FP64 jedinice i 5.120 INT32 jedinice). K tome svemu treba dodati i 336 tensor jezgri i 84 RayTrace jezgri. Ovi svi brojevi vrijede za puni GA102 čip koji se primjerice nalazi u RTX A40 ili RTX A600o proizvodima. Za potrebe RTX 3080 i 3090 GPU-a ti su brojevi nešto reducirani, no njima ćemo u opisu pojedinih kartica. Sirova snaga ovoga čipa se može iskazati u sljedećim brojevima – 30 TFLOPS-a FP32, do 58 ray-tracing TFLOPS-a, i do 238 tensor TFLOPS-a.

Palit_RTX_3080_3090_Gaming_Pro_6

Uz nove GPU-e dolazi i nova memorija – GDDR6X. Riječ je o Micronovim čipovima razvijenim specijalno za Nvidiju koji koriste PAM4 modulaciju koja poduplava broj podataka u istom ciklusu. To je podiglo data rate na visokih 19.5 Gbps kod RTX 3090 kartica. Nove RTX kartice serije 3000 donose podršku za PCIe 4.0 x16 sučelje čime hvataju korak za konkurencijom. DirectX 12 Ultimate (12_2), OpenGL 4.6, OpenCL 2.0 i Vulkan 1.2 API-e. Novost je i dodatak HDMI 2.1 standarda koji omogućava spajanje 8K@60Hz ekrana s jednim kabelom.

Palit GeForce RTX 3080 10 GB

Palit_RTX_3000_Gaming_Pro_1

Palit je za početak u svoj portfelj dodao četiri različita RTX 3080 modela – GameRock OC, GameRock, GamingPro OC i Gaming Pro. Nama je na test stigla OC verzija GamingPro verzije koja ima malo agresivnije tvorničke taktove. Palit je kod izrade kartice koristio kombinaciju skupljih višeslojnih keramičkih i jeftinijih tantalskih polimernih kondenzatora no problema ne bi smjelo biti jer su u međuvremenu izašli i 456.55 driveri koji rješavaju problem rušenja kartica (CTD – crash to desktop) kod frekvencija iznad 2.000 MHz.

Palit_RTX_3000_Gaming_Pro_2

Palit je za RTX 3000 seriju napravio potpuno novi dizajn hlađenja koji je vrlo masivan i zauzima dva i pol slota, a ukupne dimenzije kartice su 294 x 112 x 60 milimetara. Kartica je i solidno teška, te je masa je izvaganih 1.182 grama. Na relativno kratki je PCB nasađen ogroman hladnjak od aluminijskih listova sastavljen od dva dijela kroz koji prolaze dvije debele toplovodne cijevi, a na to su postavljena tri ventilatora koji se svi vrte u istom smjeru.

Ventilatori su promjera 80 milimetara, ne vrte se pod opterećenjem, a i kada se zavrte nisu pretjerano bučni. Izmjerili smo maksimalnih 41 dB pod najvećim opterećenjem na tvorničkim taktovima (oko 2.000 okretaja). Ispod hladnjaka se nalazi aluminijski okvir koji je i hladnjak i učvršćivač konstrukcije. Na stražnjoj se strani nalazi velika ploča od lijevanog metala koja ima saćastu strukturu na kraju za bolji prolaz toplog zraka. Poklopac ventilatora je plastičan, s metalnom ukrasnom pločicom.

Palit_RTX_3000_Gaming_Pro_3

Ispod haube se nalazi GA102 grafički procesor koji je za RTX 3080 kartice u konfiguraciji s 8.704 shadera (68 SM-a), 272 teksturne jedinice, 96 ROP-ova (render back-end), 272 Tensor jezgre i 69 RayTracing jezgri. L1 memorije je 128KB po SM-u, a L2 memorije je ukupno 5 MB. Nvidijini referentni modeli rade na 1.440 MHz osnovnog i 1.710 MHz boost takta, dok na ovoj Palitovoj kartici maksimalni boost takt iznosi 1.740 MHz, što i ne predstavlja veliki skok u taktu. Ipak, pregledom GPUZ loga smo utvrdili da je maksimalni boost takt ove kartice oko 2.010 MHz dok je prosjek kroz 11 igara ipak nešto nižih 1.884 MHz.

Memorije je 10 GB, GDDR6X je tipa i radi na 1.188 MHz. Zbog prirode GDDR6X memorije, tj. njenog načina rada data rate je vrlo visokih 19 Gbps uz propusnost od monstruoznih 760,3 GB/s – idealno za 4K rezoluciju. Memorija i GPU na RTX 3080 karticama komuniciraju preko 320-bitne sabirnice.

Palit_RTX_3000_Gaming_Pro_4

Nvidia je značajno povećala TDP/TBP ovih kartica u odnosu na prethodnu Turing generaciju, pa sada RTX 3080 ima deklarirani TBP čak 320 W. Preko PCIe 4.0 x16 sučelja je u stanju povući 75 W, a preko dva 8-pinska PCIe konektora još 300 W. Veliko je to povećanje u potrošnji, čak za trećinu i to je očito cijena koju se mora platiti za visoke performanse. Srećom, Palitovo je hlađenje solidno riješeno pa buka nije velika, a temperatura ne prelazi maksimalnih 72°C.

Napojna je jedinica 14-fazna s DrMos fazama i s dva OnSemijeva NCP81610 kontrolera kao što je vidljivo iz teardowna koji je napravio TechPowerUp. S tih fotografija vidimo da Palit koristi pet talnalnih polimer kondenzatora i skupinu manjih MLCC kondenzatora sa stražnje strane GPU-a, što se pokazalo kao adekvatno rješenje.

Palit_RTX_3000_Gaming_Pro_5

Kartica ima četiri video izlaza – tri su Display Porta 1.4a i jedan je novi i moderni HDMI 2.1. Preko DisplayPorta je moguće spojiti 4K@120Hz ekrane ili 8K@60Hz (do dva monitora). HDMI 2.1 je novi standard koji podržava veću propusnost i više rezolucije – 4K@144Hz i 8K@30Hz s jednim kabelom. Novi je NVENC/NVDEC video mehanizam, a sada podržava AV1 dekodiranje, uz nativno dekodiranje MPEG-2, VC1, VP8, VP9, H.264 i H.265 standarda koje je preneseno sa starijih kartica. RTX  3080 ne podržava SLI konfiguracije.

Palit_RTX_3000_Gaming_Pro_8

Palit je GamingPro modele opremio suptilnijim ARGB osvjetljenjem (ovdje možete vidjeti zašto je ovo suptilnije u odnosu na GameRock za kojeg nemamo lijepe riječi), a sve se kontrolira putem ThunderMaster aplikacije koja osim toga služi i za overclocking, promjenu načina rada ventilatora, nadzor parametara rada i ostale funkcije. Osvjetljenje je ograničeno i nudi se nekoliko opcija – GPU temperature, Still, Rainbow, Cycle, Breath i Strobe.