Palit GeForce GTX680 Jetstream – brza i efikasna

Datum objave 11.04.2012 - Krešimir Matanović

Kepler arhitektura

Fundamentalna razlika između Fermi arhitekture uvedene sa GTX480 karticama i naknadno korištene sa 5 serijom, i nove Kepler arhitekture je masivno povećanje broja CUDA jezgri (shadera). I dok smo kod Fermija imali duplo veći shader takt u odnosu na ostatak čipa, kod Keplera je broj shadera veći (1536 vs. 512), ali rade na istom taktu kao i ostatak čipa. Povećanje performansi tako kod Keplera dolazi iz znatno većeg broja CUDA jezgri te višeg radnog takta onoga što bi se kod Fermija zvalo "ostatka" čipa. U osnovi i dalje je to Fermi arhitektura – čip je organiziran u skalabilnu mrežu klastera za procesiranje grafike (Graphics Processing Clusters), Streaming Multiprocesore i memorijske kontrolere. Konkretno GK104 (čip koji pogoni GTX680 karticu), sastoji se od četiri GPC-a, osam Streaming Multiprocesora (SMX) nove generacije i četiri memorijska kontrolera. U GK104, svaki GPC ima dedicirani raster mehanizam i dvije SMX jedinice. S ukupno osam SMX-a od kojih svaki ima 192 CUDA jezgre, dolazimo do ukupnog broja od 1536 CUDA jezgri u čipu. Memorijski podsistem je doživio promjene koje su rezultirale u velikom povećanju brzine memorije. Na GTX680 karticama GDDR5 moduli rade na vrlo visokih 1502MHz (6008MHz efektivno), što je najveća brzina do sada. Uz svaki od četiri memorijska kontrolera širine 64 bita, nalazi se 128LB L2 priručne memorije i osam ROP jedinica (single color sample). Zbog povećanja broja jedinica došlo je i do povećanja broja tranzistora u GPU-u pa ih tako GK104 broji čak 3.54 milijarde, što je za oko pola milijarde više nego kod GF110 (Fermi) čipa. Inače, površina jezgre ovoga 28 nm čipa je samo 294 kvadratna milimetra, što je znatno manje od dosadašnjih 500+ mm² high end čipova. Takt je čipa rastao sa 772MHz na 1006MHz (shader clock je kao što smo napisali izbačen), pa je zbog toga i većeg broja CUDA jezgri snaga čipa rasla gotovo dvostruko na 3090 GFLOPS-a. Teksturnih je jedinica sada duplo više – 128, a fill-rate je 128.8 Gigatexela/s što je za oko 160% više nego kod GF110.

SM je i dalje srce Nvidijine unified GPU arhitekture, gdje se nalazi većina hardverskih jedinica za obradu grafike. CUDA jezgre unutar SM-a obavljaju pixel/vertex/geometry sjenčanje i physics/compute kalkulacije. Teksturne jedinice izvode filtriranje tekstura, a load/store jedinice dohvaćaju i spremaju podatke u memoriju. Jedinice specijalne funkcije (SFU) odrađuju transcendentalne i instrukcije grafičke interpolacije, a na kraju PolyMorph mehanizam odrađuje dohvat vertx-a, teselaciju, viewport transformaciju, podešavanje atributa i stream output.
Novost kod GK104 je SM nove generacije nazvan SMX (sjetimo se Fermi je imao 16 SM-ova, dok Kepler ima 8 SMX-ova). SMX u odnosu na SM ima šest puta više CUDA jezgri (192), osam puta više jedinica specijalne namjene (32), dva puta više Load/Store jedinica (32), četiri puta više teksturnih jedinica (16), te dva puta više warp schedulera. Sav je ovaj ekstra hardver bio potreban kako bi se nadoknadilo ukidanje shader clocka, tj. kako bi se performanse dodatno povećale. Kako bi pak potrošnja energije ostala u razumnim granicama, svaka je procesorska jedinica dizajnirana tako da se poveća clock gating efikasnost. Još jedna bitna izmjena u SMX-u je novi PolyMorph Engine 2.0 koji se brine da visoki faktori teselacije imaju čim manji učinak na performanse renderiranja. Spomenuta L2 priručna memorija je također doživjela napredak, pa joj je tako propusnost povećana na 512 bita po taktu, a shared address operacija na jednu po taktu (prije 1/9 po taktu), te independent address operacija na 64 po taktu (prije 24).

Velika je novost i GPU Boost funkcija koja je omogućena aktivnim nadziranjem potrošnje. U svakodnevnom korištenju (igranje igara), kartica će rijetko kada doseći svoj TDP, pa su u Nvidiji odlučili omogućiti automatsko podizanje takta sa 1006MHz na 1058MHz kako bi performanse kartice podigli za otprilike 5%. U nekim slučajevima takt se može podići i iznad te vrijednosti, a u Nvidiji tvrde kako su mjerili i preko 1.1GHz testirajući aplikacije koje nisu toliko zahtjevne. Nvidijini su inženjeri izračunali kako TDP GTX680 kartice prilikom normalnog korištenja neće prelaziti 170W pa je to drastično poboljšanje u odnosu na GTX580 (maksimala je 195W). Novost koja dolazi s 300 driverima je i Adaptive Vsync koji automatski kontrolira vertikalnu sinkronizaciju. Ispod 60 FPS-a se Vsync gasi kako bi se spriječilo zastajkivanje slike (do sada smo uvijek ovu funkciju gasili), no kada prosječan FPS prijeđe brojku od 60 Vsync se pali kako bi se pri tako visokom framerateu eliminiralo neugodno pucanje ili deranje tekstura koje se dešava kada je Vsync isključen. Kako ovo radi u praksi ostaje nam za vidjeti.

Nvidijinu FXAA tehnologiju koja koristi CUDA jezgre kako bi smanjila vidljivi aliasing, od sada je moguće koristiti i preko Control Panela u R300 driverima, i to za gotovo sve igre a ne samo one u koje je FXAA uključen u razvoju. Prava je novost u filtriranju TXAA tehnologija, koja iskorištava visoke FP16 performanse kod GTX680 kartica. TXAA je mješavina hardverskog antialiasinga, custom CG filmskog stila rješavanja AA i opcionalne vremenske komponente za poboljšavanje kvalitete slike. TXAA je dostupna u dva moda rada, 1 i 2, pri čemu prva nudi vizualnu kvalitetu 8xMSAA uz 2xMSAA performanse, a druga nudi kvalitetu koja nadilazi 8xMSAA uz 4xMSAA performanse. Kao i FXAA, i TXAA će biti implementirana u nadolazeće naslove, a MechWarrior Online, Secret World, Eve Online, Borderlands 2, Unreal 4 Engine, BitSquid, Slant Six Games i Crytek su se do sada obvezali koristiti ju.

Svi Kepler GPU-i imaju novi display mehanizam, koji je napravljen za novu generaciju 4k i 3GHz HDMI monitora, zatim za multi-display igranje sa NVIDIA Surround tehnologijom, multi-stream audio, i poboljšano transkodiranje video materijala. Display mehanizam na GTX 680 kartici u mogućnosti je "pogoniti" do četiri monitora simultano, uz podršku za nativni Surround iz jedne GTX680 kartice. Sve GTX680 kartice se isporučuju sa dva dual-link DVI konektora, kao i HDMI te DisplayPort izlazima. Svi Kepler GPU-i podržavaju i novi hardverski video H.264 encoder NVEC. Prije Keplera, svo se video kodiranje odrađivalo softverski preko mreže CUDA jezgri što je povećavalo potrošnju. Korištenjem specijalne hardverske jedinice NVENC-a, potrošnja je smanjena a brzina povećana za gotovo četiri puta. Aplikacije sada tako mogu birati žele li koristiti NVENC ili tradicionalno softversko kodiranje. NVENC nudi kodiranjevideo materijala full HD rezolucije (1080p), do osam puta brže od realnog vremena, podržava H.264 Base, Main i High Profile Level 4.1 (isti kao i Blu-ray standard), Multiview Video Coding, te kodiranje do 4096×4096.

Isprintaj članak Vaš Komentar Top

Forum

Objavljeno prije 31 minuta

TES 4 Oblivion

Objavljeno prije 34 minute

LCDi, Plazme i ostali televizori - pročitaj prvi post prije postavljanja pitanja

Objavljeno prije 1 sat

Kućna struja, uzemljenje, osigurači, razvodi

Objavljeno prije 1 sat

Procjena: PS4 nije slim sw 9.04

Objavljeno prije 1 sat

Honor mobiteli

Novosti

Instagam otključava značajku Edit Grid God (Uredi mrežu)

Instagram je društvena platforma bez koje mnogi mladi ljudi ne mogu svaki dan. Posebno je glavno bojno polje za online "ljepotice" i dijeljenje prekrasnih fotografija i stvaranje fantastične tipografije. Prije nekog vremena, IG je promijeni... Pročitaj više

Microsoft potvrdio: korištenje klasične verzije Outlooka može učiniti prijenosno računalo vrućim

Ako se vaše prijenosno računalo iznenada zagrije, ventilator se divlje vrti ili čak baterija brzo gubi napajanje, problem možda nije u računalu, već u krivnji Outlooka. Microsoft je nedavno potvrdio da greška u klasičnoj verziji Outlooka na... Pročitaj više

Intelov Arrow Lake-S Refresh procesor stiže početkom sljedeće godine

Nedavno, prema relevantnim otkrićima, Intelov procesor za stolna računala sljedeće generacije Arrow Lake-S Refresh trebao bi debitirati početkom 2026. Procesor će i dalje biti kompatibilan s postojećim LGA1851 socketima, što znači da korisn... Pročitaj više

Google pretraživanje: Brzina i pouzdanost nikad se nisu promijenili

Google potvrđuje da je njegova glavna misija osigurati da je tražilica uvijek spremna poslužiti korisnike, od traženja rezultata nogometne utakmice koja je u tijeku do ažuriranja udarnih informacija o oluji. U postu na blogu, Google je nagl... Pročitaj više

Intel nova Lake-S sljedeće generacije imat će LGA-1954 priključak

Nedavno je otkriveno da bi Intelov procesor sljedeće generacije, Nova Lake-S, mogao koristiti potpuno novi socket. Ako je to istina, to možda nije dobra vijest za sve koji su upravo kupili matičnu ploču Intel 800 serije s podrškom za LGA-18... Pročitaj više

Sve novosti