Palit GeForce GTX680 Jetstream – brza i efikasna
Datum objave 11.04.2012 - Krešimir Matanović
Kepler arhitektura
Fundamentalna razlika između Fermi arhitekture uvedene sa GTX480 karticama i naknadno korištene sa 5 serijom, i nove Kepler arhitekture je masivno povećanje broja CUDA jezgri (shadera). I dok smo kod Fermija imali duplo veći shader takt u odnosu na ostatak čipa, kod Keplera je broj shadera veći (1536 vs. 512), ali rade na istom taktu kao i ostatak čipa. Povećanje performansi tako kod Keplera dolazi iz znatno većeg broja CUDA jezgri te višeg radnog takta onoga što bi se kod Fermija zvalo "ostatka" čipa. U osnovi i dalje je to Fermi arhitektura - čip je organiziran u skalabilnu mrežu klastera za procesiranje grafike (Graphics Processing Clusters), Streaming Multiprocesore i memorijske kontrolere. Konkretno GK104 (čip koji pogoni GTX680 karticu), sastoji se od četiri GPC-a, osam Streaming Multiprocesora (SMX) nove generacije i četiri memorijska kontrolera. U GK104, svaki GPC ima dedicirani raster mehanizam i dvije SMX jedinice. S ukupno osam SMX-a od kojih svaki ima 192 CUDA jezgre, dolazimo do ukupnog broja od 1536 CUDA jezgri u čipu. Memorijski podsistem je doživio promjene koje su rezultirale u velikom povećanju brzine memorije. Na GTX680 karticama GDDR5 moduli rade na vrlo visokih 1502MHz (6008MHz efektivno), što je najveća brzina do sada. Uz svaki od četiri memorijska kontrolera širine 64 bita, nalazi se 128LB L2 priručne memorije i osam ROP jedinica (single color sample). Zbog povećanja broja jedinica došlo je i do povećanja broja tranzistora u GPU-u pa ih tako GK104 broji čak 3.54 milijarde, što je za oko pola milijarde više nego kod GF110 (Fermi) čipa. Inače, površina jezgre ovoga 28 nm čipa je samo 294 kvadratna milimetra, što je znatno manje od dosadašnjih 500+ mm2 high end čipova. Takt je čipa rastao sa 772MHz na 1006MHz (shader clock je kao što smo napisali izbačen), pa je zbog toga i većeg broja CUDA jezgri snaga čipa rasla gotovo dvostruko na 3090 GFLOPS-a. Teksturnih je jedinica sada duplo više - 128, a fill-rate je 128.8 Gigatexela/s što je za oko 160% više nego kod GF110.
SM je i dalje srce Nvidijine unified GPU arhitekture, gdje se nalazi većina hardverskih jedinica za obradu grafike. CUDA jezgre unutar SM-a obavljaju pixel/vertex/geometry sjenčanje i physics/compute kalkulacije. Teksturne jedinice izvode filtriranje tekstura, a load/store jedinice dohvaćaju i spremaju podatke u memoriju. Jedinice specijalne funkcije (SFU) odrađuju transcendentalne i instrukcije grafičke interpolacije, a na kraju PolyMorph mehanizam odrađuje dohvat vertx-a, teselaciju, viewport transformaciju, podešavanje atributa i stream output.
Novost kod GK104 je SM nove generacije nazvan SMX (sjetimo se Fermi je imao 16 SM-ova, dok Kepler ima 8 SMX-ova). SMX u odnosu na SM ima šest puta više CUDA jezgri (192), osam puta više jedinica specijalne namjene (32), dva puta više Load/Store jedinica (32), četiri puta više teksturnih jedinica (16), te dva puta više warp schedulera. Sav je ovaj ekstra hardver bio potreban kako bi se nadoknadilo ukidanje shader clocka, tj. kako bi se performanse dodatno povećale. Kako bi pak potrošnja energije ostala u razumnim granicama, svaka je procesorska jedinica dizajnirana tako da se poveća clock gating efikasnost. Još jedna bitna izmjena u SMX-u je novi PolyMorph Engine 2.0 koji se brine da visoki faktori teselacije imaju čim manji učinak na performanse renderiranja. Spomenuta L2 priručna memorija je također doživjela napredak, pa joj je tako propusnost povećana na 512 bita po taktu, a shared address operacija na jednu po taktu (prije 1/9 po taktu), te independent address operacija na 64 po taktu (prije 24).
Velika je novost i GPU Boost funkcija koja je omogućena aktivnim nadziranjem potrošnje. U svakodnevnom korištenju (igranje igara), kartica će rijetko kada doseći svoj TDP, pa su u Nvidiji odlučili omogućiti automatsko podizanje takta sa 1006MHz na 1058MHz kako bi performanse kartice podigli za otprilike 5%. U nekim slučajevima takt se može podići i iznad te vrijednosti, a u Nvidiji tvrde kako su mjerili i preko 1.1GHz testirajući aplikacije koje nisu toliko zahtjevne. Nvidijini su inženjeri izračunali kako TDP GTX680 kartice prilikom normalnog korištenja neće prelaziti 170W pa je to drastično poboljšanje u odnosu na GTX580 (maksimala je 195W). Novost koja dolazi s 300 driverima je i Adaptive Vsync koji automatski kontrolira vertikalnu sinkronizaciju. Ispod 60 FPS-a se Vsync gasi kako bi se spriječilo zastajkivanje slike (do sada smo uvijek ovu funkciju gasili), no kada prosječan FPS prijeđe brojku od 60 Vsync se pali kako bi se pri tako visokom framerateu eliminiralo neugodno pucanje ili deranje tekstura koje se dešava kada je Vsync isključen. Kako ovo radi u praksi ostaje nam za vidjeti.
Nvidijinu FXAA tehnologiju koja koristi CUDA jezgre kako bi smanjila vidljivi aliasing, od sada je moguće koristiti i preko Control Panela u R300 driverima, i to za gotovo sve igre a ne samo one u koje je FXAA uključen u razvoju. Prava je novost u filtriranju TXAA tehnologija, koja iskorištava visoke FP16 performanse kod GTX680 kartica. TXAA je mješavina hardverskog antialiasinga, custom CG filmskog stila rješavanja AA i opcionalne vremenske komponente za poboljšavanje kvalitete slike. TXAA je dostupna u dva moda rada, 1 i 2, pri čemu prva nudi vizualnu kvalitetu 8xMSAA uz 2xMSAA performanse, a druga nudi kvalitetu koja nadilazi 8xMSAA uz 4xMSAA performanse. Kao i FXAA, i TXAA će biti implementirana u nadolazeće naslove, a MechWarrior Online, Secret World, Eve Online, Borderlands 2, Unreal 4 Engine, BitSquid, Slant Six Games i Crytek su se do sada obvezali koristiti ju.
Svi Kepler GPU-i imaju novi display mehanizam, koji je napravljen za novu generaciju 4k i 3GHz HDMI monitora, zatim za multi-display igranje sa NVIDIA Surround tehnologijom, multi-stream audio, i poboljšano transkodiranje video materijala. Display mehanizam na GTX 680 kartici u mogućnosti je "pogoniti" do četiri monitora simultano, uz podršku za nativni Surround iz jedne GTX680 kartice. Sve GTX680 kartice se isporučuju sa dva dual-link DVI konektora, kao i HDMI te DisplayPort izlazima. Svi Kepler GPU-i podržavaju i novi hardverski video H.264 encoder NVEC. Prije Keplera, svo se video kodiranje odrađivalo softverski preko mreže CUDA jezgri što je povećavalo potrošnju. Korištenjem specijalne hardverske jedinice NVENC-a, potrošnja je smanjena a brzina povećana za gotovo četiri puta. Aplikacije sada tako mogu birati žele li koristiti NVENC ili tradicionalno softversko kodiranje. NVENC nudi kodiranjevideo materijala full HD rezolucije (1080p), do osam puta brže od realnog vremena, podržava H.264 Base, Main i High Profile Level 4.1 (isti kao i Blu-ray standard), Multiview Video Coding, te kodiranje do 4096x4096.
Palit GTX680 Jetstream
I dok je AMD svoju high-end HD7970 karticu odlučio u početku i preko partnera nuditi samo u osnovnom, referentnom, dizajnu, Nvidija je od početka partnerima dala otvorene ruke u dizajniranju barem hlađenja za kartice. Tako je Palit uz referentni model, predstavio i ovaj Jetstream koji osim što dolazi s drugačijim hlađenjem ima i malo tvornički podignute taktove. Kutija je moramo priznati odlično dizajnirana, uz minimalističku prednju stranicu, informativnu stražnju i otklopljivu prednju na kojoj možemo saznati sve zanimljive informacije o proizvodu te vidjeti i sam hladnjak na kartici kroz prozorčić.
Čini se kako ni Palit nije naročito izdašan po pitanju dodatne opreme baš kao i većina drugih proizvođača. Sve što će te u kutiji uz karticu naći je medij s upravljačkim programima i aplikacijama, upute za brzu instalaciju, jedan napojni kabel (2x6-pin u 1x8-pin), DVI-to-VGA adapter i DVI-to-HDMI adapter. Za jednu high-end karticu prilično mršav bundle.
Moramo priznati kako je ovaj Palitov Jetstream model jedan od ljepših koji smo u zadnje vrijeme vidjeli. Masivna "hauba" hlađenja pobojana je u elegantnu zlatno-crnu kombinaciju, a tri ventilatora inspirirana avionskim turbofan propelerima daju dojam moćnog i tihog hlađenja. Kartica je duga solidnih 27 cm, pri čemu je PCB dugačak oko 25.5 cm. Premda je hlađenje dual-slot tipa, njegova konstrukcija nadilazi taj drugi slot te je maksimalna debljina kartice na jednom dijelu preko 5 cm. Tri su ventilatora kao što smo rekli inspirirani lopaticama Turbofan motora, pa od tu i ime kartice Jetstream. Rubni su ventilatori promjera 8 cm, do je središnji veći za 1 cm. Svi su automatski kontrolirani, a središnji ima i plavo LED osvjetljenje koje nije prenapadno. Dva se rubna ventilatora vrte s lijeva na desno, dok se središnji okreće s desna na lijevo kako bi se eliminirala vrtloženja zraka. Ta tri ventilatora hlade veliki aluminijski hladnjak koji s bakrene jezgre na listiće toplinu prenosi putem četiri debele bakrene cijevi. Napajanje kartice je šest fazno s Dr.MOS driverima. GK104 čip na ovoj kartici radi na tvornički podignutom osnovnom taktu od 1085MHz uz mogućnost Turbo frekvencije od 1150MHz. Ovo karticu čini za oko 8% po pitanju GPU snage u odnosu na referentni model. GDDR5 memorije na ovoj kartici ima 2GB, a radi na taktu od 1575MHz, tj. 6300MHz efektivno. To je za oko 5% brže nego kod referentnog modela. Uz 256 bitnu sabirnicu (četiri 64 bitna kontrolera), maksimalna memorijska propusnost tako iznosi 201.6GB/s (referentni ima propusnost od 192.2GB/s).
Baš kao i referentni model i ova kartica ima dva dual-link DVI izlaza, te HDMI i DisplayPort izlaze. Tako je za razliku od GTX580 modela, prostor za ispuhivanje toplog zraka kraći za jedan DVI konektor. Kartica podržava 3-way SLI kombinaciju, a konektori su na uobičajenom mjestu. Da drugom su kraju dva PCIe Power konektora - jedan osam i jedan šest pinski. Palit za ovu karticu preporučuje minimalno napajanje od 550W sa mogućnošću isporuke 38A preko 12V voda. Kartica iam PCIe 3.0 sučelje, podržava DX11.1 i OpenGL 4.2 API-e, te standardne 3D Vision, 3D Vision Surround, CUDA i PhysX tehnologije.
Test sistem, način testiranja i overclocking
Test sistem
|
|
Način testiranja i overclocking
Karticu smo testirali na našem standardnom test stroju koji se sastoji od Asusove Sabertooth X58 ploče, Intelovog Core i7-980X procesora te ukupno šest gigabajta Exceleramove radne memorije u 3 x 2GB kombinaciji. Set benchmarka koji smo koristili poznat je iz naših ranijih testova, a dodali smo i neke novije naslove. Karticu smo usporedili s Gigabyteovom GTX580 SOC karticom kao prethodnicom, istom spuštenom na referentne taktove, te konkurentnim HD7970 modelom. U starijim naslovima kao i uvijek donosimo širi spektar modela za usporedbu. Test zagrijavanja i potrošnje smo proveli sa Battlefield 3 naslovom koji poprilično zagrije i optereti karticu. Kao i uvijek mjerena je potrošnja cijelog sistema. Što se GPGPU testova tiče, za sada smo koristili samo Media Espresso u verziji 6.5 Beta koji podržava NVENC tehnologiju.
Za overclocking nismo koristili neučinkovitu i ružnu aplikaciju koju Palit isporučuje već odličnu EVGA-inu Precision X. Uz podosta igranja s vrijednostima napona i frekvencija, zaključili smo kako je grafičkom procesoru sigurno dati 1.175V pri čemu smo Power Target dignuli na maksimalnih 150%. Frekvenciju procesora smo sa 1085MHz uspjeli podići na 1150MHz (sa boostom bi trebalo ići do 1215MHz). Nakon slabijeg OC-a procesora, ostali smo zatečeni brzinom memorije koja je s lakoćom potegla dodatnih 125MHz za ukupnih 1700MHz ili 6800MHz efektivno. Sve u svemu nije loše, a koliko će rasti performanse provjeriti ćemo testovima.
Rezultati testova - 1.dio
3DMark11 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GPU | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sudeći po sintetici, GTX680 je vrlo brza kartica. Na standardnim se taktovima približila dvoglavoj HD6990, a tvornički overclockirana ju debelo preskače. No, idemo pogledati kakva je u stvarnom životu.
Batman Arkham City |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF (PhysX High) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
Prvi naslov koji testiramo je odlično Arkham City, u kojem GTX680 pokazuje svoju punu snagu. Ispred GTX580 je dobrih 20%, a ispred HD7970 oko 27%. Kada uključimo fiziku, i to na najvišu razinu framerate opada na i dalje prihvatljivih 50-tak FPS-a, što je za oko 14% više nego kod GTX580 kartice.
Battlefield 3 |
||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
Battlefield 3 je vrlo popularan i najviše se igra, pa je bitno ocijeniti što može vaša kartica u njemu. Ispada da je za solidan gameplay svejedno da li imate HD7970, GTX580 ili GTX680 jer su podjednake, ali i izmjereni minimum od oko 40 FPS-a je odlična garancija za igrivost u maksimalnim detaljima. Kako bi bili fer recimo da je GTX680 od konkurentice HD7970 brža za oko 8%.
Crysis 2 |
||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF, DX11 | ||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||
I Crysis 2 je još uvijek vrlo aktualan, a vidimo kako je ovdje HD7970 čak i malo brža od GTX680. Jetstream je naprijed za par postotaka, no to ne mijenja na igrivosti.
DiRT 3 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
DiRT3 je debelo na strani Nvidijinih kartica, a porast performansi s GTX680 je izvrstan. Ponovno, igrivost je dobra sa svim karticama u grafu, no nova GTX680 ipak caruje.
F1 2011 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 (4xAA, 16xAF) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
I u F1 je situacija slična, s tim što GTX680 iz nekog razloga ne usijeva prijeći još uvijek vrlo brzu GTX580 SOC.
Heaven Benchmark |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF, Extreme Tess. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Teselacijske su performanse rasle i kod AMD-a i kod Nvidije i to se na ovome testu dobro vidi. GTX680 je premoćna i čak je 39% brža od GTX580 kartice. Od HD7970 konkurentice je brža za oko 18%.
Rezultati testova - 2.dio
Hard Reset Demo |
|||||||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF | |||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||
I u Hard Resetu je GTX680 jednostavno nadmoćna. Od HD7970 je brža za točno 16%, a od dobrano overclockirane GTX580 za oko 13.5%. Jetstream je ponovno par postotaka iznad.
Shogun 2 |
||||||||||||||||||||||||||||||||||||||||||||
1920x1080 @ 4xAA, 16xAF | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
Shogun je AMD-ov teritorij pa rezultati ne čude. HD7970 je za oko 7% brža od Jetstreama, te za oko 11.5% od standardne GTX680.
S.T.A.L.K.E.R. Call of Pripyat |
||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 @ 4xAA, 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
Dobro stari S.T.A.L.K.E.R. još se uvijek ne da iz našeg seta testova zbog toga što još uvijek daje dobar uvid u performanse kako starijih tako i novijih kartica. GTX680 je od svoje direktne konkurentice HD7970 brža za oko 19% što svakako nije malo, dok je za tek malo više brža od prethodnice GTX580. Jetstream donosi dodatno ubrzanje od oko 5%.
Overclocking |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3D Mark 11 (Performance) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
S.T.A.L.K.E.R. CoP (1920x1200 @ 4xAA, 16xAF) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Shogun 2 (1920x1080 @ 4xAA, 16xAF) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hard Reset (1920x1200 @ 4xAA, 16xAF) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
S obzirom da overclocking nije bio velik, nismo ni očekivali veliki porast performansi. U prosjeku je ubrzanje u igrama iznosilo oko 2-3% što i nije nešto pa skoro i da ne treba karticu dodatno forsirati. U odnosu na referentni je to model oko 8% što u konačnici i nije tako loše.
Cinebench 11.5 |
|||||||||||||||||||||||||||||||||||||||
OpenGL (fps) | |||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||
OpenGL performanse nisu jača strana GTX680 kartice. Napretka gotovo nikakvog nema s prelaskom sa GTX580 na GTX680 što bi moglo biti i do drivera. HD7970 je pak daleko naprijed.
Cyberlink MediaEspresso |
|||||||||||||||||||||||||||||||||||||||||||||||||
Time (s) | |||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||
GPGPU performanse su barem iz ovoga testa jača strana GTX680 kartice. Ubrzanje u odnosu na GTX580 je oko 26%, dok je konkurentica značajno sporija i od Intelovih procesora.
Potrošnja i zagrijavanje
Potrošnja |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Idle (W) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Load (W) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Dolazimo do još jedne jake strane GTX680 kartice. 345W je najveća vrijednost koju je zabilježio naš mjerač i ona je za oko 15W niža u odnosu na HD7970. U odnosu na GTX580 je to za odličnih 66W niže. Nvidija je ovaj put odradila odličan posao.
Temperature |
|||||||||||||||||||||||||||||||||||||||||||||
Idle (°C) | |||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||
Load (°C) | |||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||
Relativno tih i ne nametan Jetstream hladnjak dobro odrađuje posao. Tek kada overclockiramo ventilatori će se zavrtjeti brže i podići razinu buke, što se na tvorničkim taktovima gotovo nikad ne dešava. Vrlo dobar posao za Palit.
Zaključak
Palitov Jetstream kojeg nam je na test ustupio MSan, odlična je kartica koja je za jedan high end dovoljno tiha u radu, a pri tom ostaje i dovoljno hladna. Mane su joj slab bundle i tek nešto lošiji GPU overclock. Sve ostalo, od kvalitete izrade, korištenih materijala i ponajviše performansi je izvrsno. Porast od oko 4-5% u odnosu na referentni model nije drastično, no dobro dođe. Tek treba vidjeti je li i opravdan, kada cijena za naše tržište bude definirana. Referentni se Palitov model u domaćim trgovinama informatičke opreme može naći po cijeni od oko 4.050 kuna na više. No, količine su ograničene pa požurite.