Nvidia GeForce GTX750 Ti 2GB – Maxwell je stigao
Datum objave 18.02.2014 - Krešimir Matanović
Maxwell arhitektura i GTX750 Ti
Nvidia danas predstavlja svoj prvi izdanak nove grafičke arhitekture Maxwell. Ova arhitektura nasljeđuje sada već dvije godine staru Kepler arhitekturu, a glavni fokus u njenom dizajniranju je bio na izvlačenje maksimalnih performansi po utrošenom Wattu energije. Prvi izdanak ove arhitekture je grafički procesor kodnog imena GM107 koji je kako sam proizvođač tvrdi dizajniran za upotrebu u sistemima niske potrošnje kao što su prijenosnici i računala malenih dimenzija (SFF) koja se koriste za kućnu zabavu i gaming, a ciljaju i na upotrebu u Valveovom Steam Machine-u. Prva grafička kartica sa ovim procesorom je nazvana GTX750 Ti i upravo nju danas testiramo.
Po tvrdnjama i mjerenjima same Nvidije GTX750 Ti je u najgorem slučaju u novim naslovima oko 20% sporija od high-end kartice od prije par godina (GTX 480), a pri tom joj TDP nije viši od 60W. Ovo dovoljno govori o napretku tehnologije u zadnjih nekoliko godina, ali budimo fer i iznimnoj neučinkovitosti GF100 čipa i Fermi arhitekture. Sve to je ipak davno zaboravljeno jer je Kepler arhitektura bila vrlo uspješna, a Nvidia je sve napore usmjerila u dodatna poboljšanja u odnosu performansi po utrošenoj jedinici energije u razvoju nove Maxwell arhitekture.
Maxwell predstavlja potpuno novi dizajn Streaming Multiprocessor (SM) jedinice, sa poboljšanjima u particioniranju kontrolne logike, poboljšanom balansiranju opterećenja, uvođenjem "compiler-based" planiranja i promjenom broja izdanih instrukcija po taktu. Sve ovo SMM (Maxwell) arhitekturu čini efikasnijom od prethodne SMX (Kepler). SMM je omogućila povećanje broja Stream multiprocesora na pet u odnosu na samo dva kod SMX-a, sa samo 25% povećanja površine čipa. Uz to, SMM donosi i povećanje L2 priručne memorije sa 256KB u GK107 čipu na čak 2048KB u GM107, pri čemu se smanjuje broj upita prema DRAM-u na grafičkoj kartici što povećava performanse i smanjuje potrošnju. Konačni rezultat ovih promjena je prema proizvođačevim tvrdnjama dvostruko povećanje odnosa performansi i potrošnje naspram Kepler arhitekturi uz zadržani isti 28 nm proizvodni proces (TSMC).
Ugrubo gledano, Maxwell se ne razlikuje puno u odnosu na Kepler. I ovdje se višestruki SM-i nalaze unutar GPC-a (Graphics Processing Cluster), a svaki SM sadrži polimorfni mehanizam i teksturne jedinice, dok se raster mehanizam nalazi izvan, u samom GPC-u. ROP-ovi (16 komada) su poravnati sa L2 memorijom i memorijskim kontrolerima. Unutarnje promjene uključuju novi dizajn jedinica i crossbar struktura, optimizacije u protoku podataka, menadžmentu potrošnje energije itd.
Struktura GM107 grafičkog procesora je takva da sadrži pet Maxwell Streaming multiprocesora (SMM) te dva 64-bitna memorijska kontrolera (ukupno 128-bita) što je i puna implementacija čipa kakav se nalazi u GTX750 Ti kartici. Ukoliko se povuče paralela sa GK107 čipom Kepler arhitekture to znači kako je 25% povećanje površine donijelo 66.6% povećanja broja CUDA jezgri (640 vs. 384).
SMM arhitektura je tako posložena da daje 35% više performansi po jednoj CUDA jezgri kada su u pitanju shader-limitirani poslovi, što je posljedica različitih arhitekturalnih promjena. Arhitektura i algoritmi SM schedulera su iznova napisani kako bi bili inteligentniji i kako bi se izbjegli nepotrebni zastoji te smanjila utrošena energija po instrukciji potrebna za planiranje. Organizacijska struktura svakog SM-a se također promijenila - svako je sada particioniran u četiri zasebna procesna bloka, od kojih svaki ima svoj instrukcijski buffer, scheduler i 32 CUDA jezgre. Ovdje je tako napušten non-power-of-two broj CUDA jezgri pristup koji je bio kod Kepler arhitekture. Ovakvo particioniranje kod Maxwella je odvelo do pojednostavljenja dizajna i logike za planiranje pri čemu se štedi energija i smanjuje računska latencija.
Par procesnih blokova dijele četiri teksturne jedinice i teksturnu priručnu memoriju. Compute L1 cache funkcija se sada kombinira sa texture cache funkcijom, a dijeljena memorija je odvojena jedinica koja se dijeli preko sva četiri bloka (slično kao i kod G80 arhitekture). Ukupno gledajući se s ovim novim dizajnom postiglo to da je svaki Maxwell SM znatno manji od Kepler SM-a uz zadržanih 90% performansi. S obzirom da je broj SM-a u Maxwell arhitekturi povećan (pet naprema dva), rezultat je 66.6% više CUDA jezgri, 2.3 puta više shader performansi i oko 25% više teksturnih performansi u "peaku".
Keplerov NVENC blok za ubrzanje H.264 performansi je poboljšan kako bi pružio brzine kodiranja od 6-8X u odnosu na 4x real-time kod Keplera, te oko 8-10x brže dekodiranje. Maxwell donosi i novo GC5 low power sleep stanje koje smanjuje potrošnju kod laganijih poslova kao što je primjerice reprodukcija video materijala.
GeForce GTX750 Ti kartica je dizajnirana za igrače koji žele solidan gameplay modernih igara u 1080p rezoluciji (ili eventualno 1920x1200), s podešenjima grafičkih efekata od srednjih pa do viših vrijednosti. GM107 čip (1.87 milijardi tranzistora), koji kuca na ovoj kartici ima osnovni takt od 1020MHz a uz pomoć GPU Boost 2.0 tehnologije taj se takt podiže do 1085MHz. Memorijski podsistem dolazi u dvije izvedbe - sa 1 ili 2 GB GDDR5 memorije, pri čemu mi danas testiramo model sa više memorije. Brzina memorije je u oba slučaja 5.4Gbps (1350 MHz), sa 128-bitnom komunikacijom (dva 64-bitna memorijska kontrolera u GM107). Ovo rezultira memorijskom propusnošću od 86.4 GB/s.
Kartica svu potrebnu energiju za rad prima preko PCIe 3.0 sučelja a tipična potrošnja iznosi 60W. Dimenzijama je ova generička Nvidijina kartica vrlo malena i mjeri ispod 15 cm u dužinu, dok zbog valjkastog aluminijskog hladnjaka sa 60 mm ventilatorom zauzima dva slota. Uz danas testiranu GTX750 Ti karticu, Nvidia odmah predstavlja i GTX750 model koji je po taktovima i identičan Ti modelu sa izuzetkom manjeg broja CUDA jezgri - 512 vs. 640. Ova će se kartica opremati sa isključivo 1GB memorije, a TDP će joj iznositi 55W. Kartica ima dva dual-link DVI-a i jedan mini-HDMI pa će tek sa nekim od partnerskih modela dobiti i službenu podršku za G-SYNC.
Test sistem, način testiranja i overclocking
Test sistem
Test sistem :: Hardware |
Platforme |
Asus Rampage IV Extreme |
Procesor(i) |
Intel Core i7 3960X @ 4.5GHz |
Memorija |
4x 4GB DDR3 G.Skill @ 1866MHz |
Grafičke
kartice |
Nvidia GTX750Ti;Driveri: FW 334.69 |
Zvučna
kartica |
On Board |
Napajanje |
Thermaltake Grand 1.05kW |
Hard
disk(ovi) |
Intel DCS3500 480GB;OCZ Vector 150 120GB |
DVD-RW |
HP GSA-H60L |
|
Testni sistem :: Software |
OS |
Windows 7 Ultimate 64-bit SP1;Windows 8.1 |
Chipset
datoteke |
Intel 9.1.0.1007 |
DirectX
verzija |
11 |
3DMark |
2013, Firestrike |
Bioshock Infinite |
In game benchmark, DX11 |
Heaven Benchmark |
v.2.5 |
LuxxMark |
v.2.0, Room |
Hitman Absolution |
Very High |
Metro Last Light |
High, SSAO OFF, TESS. OFF |
Tomb Raider |
Ultimate & Ultra |
|
Način testiranja i overclocking
Naš standardni test sistem je već dobro poznat a baziran je na
Asusovoj Rampage IV Extreme ploči, Intelovom
i7-3960X procesoru i ukupno 16GB (4x 4GB)
G.Skillove radne memorije brzine 1866MHz. Način testiranja i broj
benchmarka je sličan testu R7 260 modela. Upravo su R7 260 i 260X i glavne konkurentice GTX750 i GTX750 Ti modela pa će u današnjem članku bii fokus na uporedbu X i Ti modela. U tablicama ćete vidjeti i rezultate ranije testiranih kartica. Uz standardan test
overclockinga proveli smo i testove zagrijavanja te potrošnje kroz nekoliko naslova, a kao i uvijek mjerena je potrošnja cijelog sistema. Vrijednosti buke koju spominjemo u članku smo dobili mjerenjem uz pomoć Nexus 4
smartphonea (Android 4.4.2) i SoundMeter aplikacije.
Overclockirali smo uz pomoć EVGA-inog Precision alata koji nam je omogućio maksimalno 135 MHz povećanje takta (što je kartica bez problema postigla), dok memoriju nismo previše forsirali i podigli smo ju za 51 MHz što se pokazalo optimalno. Rezultate povećanja takta ćete vidjeti u svim tablicama a za sada možemo reći kako povećanje potrošnje i pogotovo zagrijavanja nije bilo nimalo dramatično. Kartica se pri tom pokazala vrlo stabilnom. Napon GPU-a u trenucima mirovanja je iznosio 0.96V a pri opterećenju se penjao do 1.181V. GPU-Z je pri maksimalnim opterećenjima izmjerio i do 95W potrošnje energije. U trenutku mirovanja taktovi padaju na 135MHz za GPU i 202MHz za memoriju a potrošnja pada i do 1.3W. Kao i do sada Nvidia malčice "laže" o maksimalnom Boost taktu jer smo mi izmjerili konstantnih 1150MHz u radu, dok se prilikom overclockinga to penjalo i do 1284.6MHz.
Rezultati testova - prvi dio
[ichart headers="ID, FPS" title="3DMark Firestrike" htitle="FPS" labels="Nvidia GTX750Ti @ OC, Nvidia GTX750Ti, AMD R7 260X, Asus HD7790 DCU II OC, AMD R7 260 @ OC, Palit GTX650Ti @ OC, AMD R7 260, Palit GTX650Ti, XFX R7770 Black OC, Sapphire HD7730 1GB " values="4222,3870,3784,3736,3622,3308,3307,3004,2914,1642" colors="red, orange, blue, blue, blue, blue, blue, blue, blue, blue" height="600"]
Kao i uvijek otvaramo sa 3DMarkom u kojem je kako vidimo GTX750 Ti brža od svoje R7 260X suparnice. Overclocking donosi solidan pomak, no tek će nam igre otkriti prave dobitke.
[ichart headers="ID, FPS" title="Heaven Benchmark" htitle="1920x1200 @ 4xAA, 16xAF, Extreme Tess.(FPS)" labels="Nvidia GTX750Ti @ OC,Nvidia GTX750Ti,AMD R7 260 @ OC,Asus HD7790 DCU II OC,AMD R7 260X,Palit GTX650Ti @ OC,AMD R7 260,Palit GTX650Ti,XFX R7770 Black OC,AMD HD7770,Asus GTX650 DCU" values="31.9,29,25.2,25.1.25,23.6,23,21.3,21.2,19.3,15.8" colors="red, orange, blue, blue, blue, blue, blue, blue, blue, blue, blue" height="600"]
Jasno je kako Nvidia ima bolju teselacijsku jedinicu i kako će performanse u ovome benchmarku ići u korist GTX750 Ti kartice. Ponovno vidimo solidan pomak u performansama kada overclockiramo.
[ichart headers="ID, Rezultat" title="LuxMark v2.0" htitle="Rezultat" labels="AMD R7 260X @ OC,Nvidia GTX750 Ti @ OC,AMD R7 260X,Nvidia GTX750 Ti,AMD R7 260,Palit GTX650 Ti" values="717,657,644,597,544,138" colors="blue, red, blue, orange, blue, blue" height="600"]
Luxmark je zapravo test kojeg smo najviše htjeli isprobati da vidimo može li se Maxwell arhitektura po OpenCL performansama približiti GCN-u. Iz tablica je vidljiv ogroman napredak u odnosu na stariju generaciju, no i dalje malo zaostaje za AMD karticama.
[ichart headers="ID, FPS" title="Bioshock Infinite" htitle="1920 x 1200 (FPS)" labels="Nvidia GTX750Ti @ OC,AMD R7 260X @ OC,Nvidia GTX750Ti,AMD R7 260X,AMD R7 260 @ OC, Palit GTX650Ti @ OC,AMD R7 260,Palit GTX650Ti" values="58.68,55.59,54.27,49.76,49.19,44.12,40.86,40.48" colors="red,blue,orange,blue,blue, blue, blue" height="600"]
[ichart headers="ID, FPS" title="Bioshock Infinite" htitle="1920 x 1200 with DDOF (FPS)" labels="Nvidia GTX750Ti @ OC,Nvidia GTX750Ti,AMD R7 260X @ OC,AMD R7 260X, Palit GTX650Ti @ OC,AMD R7 260 @ OC,Palit GTX650Ti,AMD R7 260" values="46.49,43.09,39.91,35.84,35.1,32.37,31.93,28.93" colors="red,orange,blue,blue,blue, blue, blue,blue" height="600"]
Bioshock Infinite donosi veliku prednost GTX750 Ti kartici i bez uključivanja DDOF-a kada prednost još poraste.
[ichart headers="ID, FPS" title="Hitman Absolution" htitle="1920 x 1200 @ 4xAA (FPS)" labels="AMD R7 260X @ OC,Nvidia GTX750Ti @ OC,AMD R7 260X,Nvidia GTX750Ti,Asus HD7790 DCU II OC,AMD R7 260 @ OC,AMD R7 260,Palit GTX650Ti @ OC,Palit GTX650Ti" values="28.23,26.4,25.52,24.54,24.06,22.43,20.44,18.11,16.25" colors="blue,red,blue,orange,blue, blue, blue, blue, blue" height="600"]
[ichart headers="ID, FPS" title="Hitman Absolution" htitle="1920 x 1200 @ 0xAA (FPS)" labels="Nvidia GTX750Ti @ OC,AMD R7 260X @ OC,Nvidia GTX750Ti,AMD R7 260X,AMD R7 260 @ OC,AMD R7 260,Palit GTX650Ti @ OC,Palit GTX650Ti" values="47.2,44.85,43.94,40.73,38.47,34.86,34.55,31.01" colors="red,blue,orange,blue,blue,blue,blue,blue" height="600"]
Hitman daje prednost R7 260X kartici u slučaju kada imamo AA filter uključen, no pri 4x je igra ionako neigriva. Čim filter ugasimo framerate znatno skoči a u prvi plan izbija GTX750 Ti.
Rezultati testova - drugi dio
[ichart headers="ID,FPS" title="Tomb Raider" htitle="1920 x 1200 @ Ultra (FPS)" labels="AMD R7 260X @ OC,Nvidia GTX750Ti @ OC,AMD R7 260X,Nvidia GTX750Ti,AMD R7 260 @ OC,Asus HD7790 DCU II OC,Palit GTX650Ti @ OC,AMD R7 260,Palit GTX650Ti" values="49.3,48.0,44.4,44.1,42.3,41.5,40.5,37.9,36.6" colors="blue, red, blue, orange, blue, blue, blue, blue, blue" height="600"]
[ichart headers="ID,FPS" title="Tomb Raider" htitle="1920 x 1200 @ Ultimate (FPS)" labels="AMD R7 260X @ OC,Nvidia GTX750Ti @ OC,AMD R7 260X,Nvidia GTX750Ti,
Asus HD7790 DCU II OC,AMD R7 260 @ OC,AMD R7 260" values="32,30.2,28.5,27.4,23.1,21.2,19.3" colors="blue, red, blue, orange, blue, blue, blue" height="600"]
Tomb Raider preferira AMD-ove grafičke kartice, pa je 260X u oba slučaja ispred konkurentice. POrast performansi kod obje kartice je sasvim solidan.
[ichart headers="ID, Score" title="Potrošnja" htitle="Score" labels="Palit GTX650Ti, AMD R7 260, Asus HD7790 DCU II OC, AMD R7 260X, Nvidia GTX750Ti, Nvidia GTX750Ti @ OC, AMD R7 260X @ OC" values="198,209,241,252,259,262,265" colors="blue, blue, blue, blue, orange, red, blue" height="600"]
GTX750 Ti kako vidimo malo više troši energije od R7 260X, no s obzirom na ukupno ipak malo bolje performanse ima povoljniji odnos performansi po utoršenom Wattu. No, AMD-ova kartica ima malo veći porast potrošnje kod overclockinga.
[ichart headers="ID, Score" title="Temperature" htitle="Score" labels="Palit GTX650Ti, AMD R7 260X, Asus HD7790 DCU II OC, AMD R7 260, Nvidia GTX750Ti, Nvidia GTX750Ti @ OC, AMD R7 260X @ OC" values="57,65,65,66,71,72,75" colors="blue, blue, blue, blue, orange, red, blue" height="600"]
Maleni hladnjak nije najučinkovitiji zbog toga što ventilator dugo zadržava niži broj okretaja, no rezultat i nije tako loš, a prilikom overclockinga temperatura ne raste značajnije.
Zaključak
Nvidia je odradila odličan posao i svi možemo biti vrlo nestrpljivi kako će izgledati i kakve će performanse imati sljedeći Maxwell proizvodi. Nvidia je ovdje išla na sigurno i novu su arhitekturu predstavili sa manje kompleksnim čipom, napravljenim u starijem proizvodnom procesu. Prijelaz na 20 nm proizvodni proces trebao bi donijeti kompleksnije i jače čipove. Kada je riječ o GM107 čipu vidljivo je kako je postignut odličan napredak po pianju performansi i potrošnje koje su donijele arhitekturalne izmjene. GTX750 Ti je vrlo sposobna kartica, pogotovo u ovoj 2GB verziji i vrlo je lako potukla konkurentnu R7 260X karticu. Naravno, AMD ne spava i prije par dana su predstavili još jači R7 265 model koji bi trebao parirati i možda biti malo brži od GTX750 Ti no to nam tek ostaje za vidjeti. Overclocking potencijal malene kartice je sasvim solidan i pomak u performansama je zadovoljavajuć. Nvidia je obećala igrivost na 1080p i to su i ispunili, neke se naslove sasvim pristojno može igrati i pri višim detaljima uz isključenje Antialiasing filtera. Potrošnja je slična kao kod R7 260X uz veće performanse i tu je Nvidija još jednom pokazala nadmoć, a maleni i ne previše bučan hladnjak pojeftinjuje i proizvodnju.
Preporučene cijene za Hrvatsko tržište su 899 kuna za GTX750 (koju još trebamo testirati) dok je za ovu 2GB verziju GTX750 Ti kartice potrebno platiti preporučenih 1.099 kuna. S obzirom da cijene R 260X modela kreću već od 900 kuna bitka na tržištu će biti vrlo žestoka. Kada se situacija stabilizira i kada novi AMD model stigne na tržište zapravo će R7 265 biti konkurent ovoj GTX750 Ti, a 260X će biti konkurent GTX750 kartici. Bilo kako bilo, lijepo je znati kako se za oko 1.000 kuna moguće solidno igrati karticama iz oba suparnička kampa.