NVIDIA GeForce 8 – ponovo na vrhu
Datum objave 08.12.2006 - Denis Arunović
Uvod
Mnogo je vremena prošlo otkada je NVIDIA posljednji put radikalno promjenila arhitekturu svojih GPU-a. Točnije, to se zadnji put dogodilo s lansiranjem GeForce 6 serije grafičkih procesora. GeForce 7 koji je lansiran kasnije, bio je baziran na istoj arhitekturi, s manjim kozmetičkim promjenama. Sada je napokon došlo vrijeme za novu veliku promjenu, a njen nosioc je grafički procesor razvijan pod imenom G80. Novi GPU-a je zaista revolucionaran u svakom pogledu, a vjerojatno najzanimljiviji feature je kompatibilnost s novom, desetom generacijom Direct X API-a, no osim toga tu su i mnogi drugi zanimljivi detalji. Kako bi napravili dostojan pregled nove generacije NVIDIA-inih kartica, pozabavili smo se s referentnim modelom najsnažnije kartice iz cijele serije, GeForceom 8800 GTX, te s dva za nijansu slabija produkcijska modela – MSI-evim i BFG-evim GeForceom 8800 GTS. Nove smo kartice sučelili sa starim šampionima – GeForceom 7950 GX2 i Radeonom X1950 XTX.
Razvoj GeForce 8 arhitekture započet je prije čak četiri godine, a na njega je NVIDIA potrošila oko 400 milijuna dolara. Cilj je bio razviti grafički procesor nove generacije koji će biti kompatibilan s DirectX-om 10 i koji će u jednom potezu odbaciti sve probleme koji su mučili starije arhitekture. Rezultat ovih napora je G80 odnosno njegove produkcijske verzije GeForce 8800 GTX i GeForce 8800 GTS.
Glavne karakteristike nove arhitekture su:
- Puna kompatibilnost s DX10 što uključuje i SM 4.0 (G80 je iz istog razloga korišten kao referentna kartica za razvoj novog API-ja)
- 128 odnosno 96 Stream procesora – unificiranih shaderskih jedinica koje znaju raditi s pixel, vertex i geometry shaderima
- Lumenex Engine – podrška za nove AA modove, podrška za FP16 i FP32 render targets, podrška za istovremeno korištenje HDR-a i AA algoritama
- 10-bitni display output odnosno 10-bitni DAC-ovi – osjetno veći broj podržanih boja od 8-bitnih DAC-ova
- Quantum Effects – podrška za ubrzavanje fizikalnih efekata na GPU-u
- Pure Video HD – hardverska akceleracija HD video formata – H.264, VC-1, WMV/WMV-HD, MPEG-2 HD
Kao što vidimo, dizajn nove arhitekture je osjetno drukčiji od onog što se dalo naslutiti iz neslužbenih informacija koje su cirkulare mrežom svih mreža. Pričalo se da G80 neće imati hardverski unficirane shadere zato što takav dizajn nije dovoljno efikasan, već da će čip prema van biti unificiran kako bi bio kompatibilan s DX 10, dok će internoj dediciranoj logici (pixel i vertex shaderima) podatke dostavljati posebni interpreter instrukcija. Ovo se pokazalo kao varka koju je NVIDIA vjerojatno namjerno pustila u opticaj kako bi zamazala oči konkurenciji.
Prije nego što uđemo dublje u detalje arhitekture novog NVIDIA-inog GPU-a, treba spomenuti i njegove izuzetno impresivne fizičke karakteristike. G80 je do sada najkompleksniji i najveći procesor ikad plasiran na maloprodajno tržište. Čip je izrađen TSMC-ovim 90-nanometarskim procesom, a sastoji od se od oprilike 681 milijun tranzistora koji prekrivaju površinu od otprilike 484 kvadratna milimetra. Za usporedbu, Intelov Core 2 Duo procesor s četiri megabajta cachea se sastoji od "tričavih" 291 milijuna tranzistora. Masivni GPU-a pristupa memoriji preko 6 sabirnica širine 64-bita što će reći da je ukupna širina memorijske sabirnice čak 384 bita. Memorijski kontroler podržava sve poznate tipove GDDR memorije, od GDDR-a pa do GDDR4, no trenutno je uporabi 768 MB GDDR3 memorije koja radi na taktu od 900 MHz odnosno efektivno 1800 MHz. Osnovni takt G80 čipa je 575 MHz, no interno mnogi dijelovi GPU-a rade na osjetno višem taktu. Sve se ovo dakako odnosi na najjači model – GeForce 8800 GTX, dok slabija varijatna GTS ima nešto slabije specifikacije.
Arhitektura
Arhitekturalne promjene koje je sa sobom donio G80 zaista su vrlo radikalne. To je u prvom redu odmak od klasičnog shaderskog cjevovoda koji je u osnovi neizmjenjen već posljednjih 20-ak godina. Ovaj se klasični cjevovod može podijeliti u nekoliko koraka. Prvi korak je slanje podataka iz sistema odnosno drivera kojim upravlja procesor, na grafičku karticu gdje oni dolaze u vertex-shaderske jedinice. VS jedinice potom šalju podatke na triangle setup gdje se stvaraju primitive – trokuti, linije i točke. Primitive potom dolaze do pixel shadera gdje se obavlja rasterizacija i sjenčanje. Sljedeći korak su ROP jedinice gdje se obavlja završni Z-check, blending i anti-aliasing. Na kraju se ovi podaci zapisuju u frame buffer odnosno video memoriju iz koje se završeni frameovi dalje šalju na izlaz grafičke kartice odnosno ekran.
Klasični shaderski cjevovod je odbačen u korist nove, efikasnije arhitekture
Kod G80 klasičnog cjevovoda više nema. Nema niti dediciranih jedinica koje se brinu za pojedine faze obrade podataka. Umjesto njih tu su stream procesori, njih 128 grupiranih u osam grupa, koji rade na taktu od 1,35 GHz. Stream procesori više nisu vektorski, kao što je do sada bio slučaj s PS i VS jedinicama, već skalarni procesori. Premda su mnoge operacije pri obradi grafike inherentno vektorske, što je i glavni razlog zašto su do sada grafički čipovi bili bazirani na vektorskim jedinicama, NVIDIA-ini inženjeri su izračunali da veću efikasnost i bolje performanse mogu dobiti korištenjem 128 skalarnih procesora nego 32 četverokomponenta vektorska procesora.
SP-ovi, kako NVIDIA skraćeno zove svoje stream procesore, su multifunkionalni odnosno unificirani pa svaki od njih može odrađivati posao koji su prije odrađivali pixel i vertex shaderske jedinice. Uz to, znaju raditi i s novom vrstom geometry shadera koji su implementirani u DirectX-u 10. SP sam po sebi može istovremeno izvršavati MADD i MUL instrukcije (MADD+MUL/clock), a podržava FP format IEEE 754.
GeForce 8800 sa svojih 128 stream procesora
Zbog korištenja velikog broja brzih unificiranih shaderskih jedinica odnosno SP-ova, G80 je mnogo efikasniji od bilo koje dosadašnje arhitekture. Kakav god da je omjer PS i VS instrukcija u pojedinoj sceni, G80 se dinamički može prilagoditi mnogo efikasnije iskorištavajući dostupne hardverske resurse.
Particija od 16 SP-ova zajedno s jedinicama za teksturiranje, L1 i L2 cacheom
Kao što se može i naslutiti, podaci nakon ulaska u čip više ne prolaze kroz fiksni cjevovod već kruže u čipu zavisno o tome koliko ih je potrebno obrađivati. Nakon što jedan SP odradi svoj dio posla, vrijednosti se zapisuju na on-chip memoriju te ih potom sljedeći SP koristi kao ulazne podatke. Proces se ponavlja dok se ne izvrše sve potrebne instrukcije, bilo da je riječ o PS, VS ili pak GS operacijama. Upućeniji će u ovakvom pristupu prepoznati ATI-jev GPU R520 gdje je primjenjen sličan koncept threading, ali na manjoj skali s obzirom da ovaj grafički procesor ima manji broj dediciranih PS i VS jedinica.
Usporedni prikaz starog i novog principa rada grafičkog cjevovoda
Kako bi G80 sa svojim brojnim SP-ovima bio dovoljno efikasan pri obradi podataka, NVIDIA je implementirala još jedan feature poznat s ATI-jevih kartica – razdvajanje jedinica za matematiku i teksturiranje. Svrha ovog postupka je maskiranje latencija memorije budući da instrukcije koje čekaju na čitanje ili pisanje iz memorije više nisu zaglavljene u matematičkoj jedinici odnosno u jednom od SP-ova, već se "uspavljuju" odnosno zapisuju u cache. Kada podatak iz memorije postane dostupan, instrukcije se ponovo "bude" i šalju na prvi slobodan SP.
Prikaz rada jedinica za matematiku i teksturiranje na starim i novim GeForceovima
Još jedan feature koji osjetno poboljšava efikasnost i brzinu izršavanja instrukcija je napredno grananje. Upućeniji sigurno znaju kako je baš u dinamičkom grananju R520 odnosno R580 bio osjetno nadmoćniji od bilo koje kartice iz GeForce 7 serije. Razloga za to je u prvom redu granularnost. GeForce 7 je pri grananju ograničen na pakete od 880 piksela dok R520 radi s paketima od 16, a R580 s paketima od 48 piksela. GeForce 8 ide korak dalje te nudi granularnost od 16 (vertex operacije) do 32 piksela (pixel operacije) što novoj NVIDIA-inoj arhitekturi osigurava još jedan as iz rukava kad je riječ o performansama u nadolazećim naslovima.
Lumenex Engine – novi AA modovi
Premda starije verzije NVIDIA-inih kartica nisu imale problema s performansama, mnogi korisnici su im zamjerali nižu kvalitetu slike u odnosu na ekvivalentne kartice iz ATI-jevih pogona. NVIDIA je ove kritike shvatila vrlo ozbiljno te ih s G80 arhitekturom u potpunosti riješila, ali istovremeno i pomaknula granice kvalitete prikaza.
Pojednostavljeno rečeno, odgovor na NVIDIA-ine probleme nosi ime Lumenex Engine. Pod ovim brandom NVIDIA je upakirala nove vrste antialiasinga, podršku za FP32 format kroz cijeli proces obrade piksela , podršku za HDR u kombinaciji s antialiasingom te novi kvalitetniji anizotropni filter za teksture.
Što se tiče algoritama za antialiasing, odbačeni su stari 8xS i 16xS modovi, a dodani novi 8x, 8xQ, 16x i 16xQ. 8x i 16x modovi ne rade u sklopu klasičnog MSAA algoritma već koriste novu metodu CSAA odnosno Coverage Sample AntiAliasing. Nažalost, NVIDIA se u svojim tehničkim dokumentima nije potrudila opisati kako točno rade taj novi algoritam osim da u većini slučajeva rezultira kvalitetnijim prikazom u odnosu na 4x MSAA algoritam uz vrlo malen pad performansi.
Kod standardnog MSAA algoritma završna se boja piksela prikazanog na ekranu izračunava korištenjem nekoliko vrijednosti. S nekoliko točaka oko originalnog piksela uzimaju se uzorci boje, vrijednost Z-buffera za te točke te coverage sampleovi odnosno informacije o tome koji poligoni prekrivaju referentne točke za uzimanje color i Z sampleova. Vrijednosti boje i Z-buffera su osjetno zahtjevnije po pitanju fillratea grafičke kartice tako da proporcionalno s povećanjem broja korištenih vrijednosti padaju i performanse. NVIDIA-ini inženjeri su zaključili kako je bolje napraviti kompromis – koristiti manji broj color i Z-sampleova, ali istovremno uzeti veći broj coverage sampleova. CSAA algoritam rabi upravo ovu metodu kako bi se dobila kvalitetnija slika u odnosu na klasični MSAA algoritam, ali uz manji pad performansi.
Algoritam | 2x |
4x |
8x |
8xQ |
16x |
16xQ |
Texture/Shader uzorci | 1 |
1 |
1 |
1 |
1 |
1 |
Color/Z uzorci | 2 |
4 |
4 |
8 |
4 |
8 |
Coverage uzorci | 2 |
4 |
8 |
8 |
16 |
16 |
Kao što vidimo, standardni MSAA 4x algoritam koristi po četiri vrijednosti za boju i Z-buffer te četiri coverage samplea. Novi 8x mod koristi CSAA algoritam – premda se i dalje koriste četiri vrijednosti za boju i z-buffer, dva puta je povećan broj coverage sampleova. S 8xQ algoritmom opet se vraćamo na standardni MSAA dok je 16x mod koristi CSAA metodu zadržavajući jednak broj sampleova boje i Z-buffera kao kod 4x MSAA algoritma, no istovremeno koristi četiri puta više coverage sampleova. 16xQ mod opet standardni i vrlo zahtjevni MSAA algoritam s većim brojem svih sampleova.
Osim dodavanja novih AA algoritama odnosno modova, NVIDIA je kod G80 tvornički uključila u driverima korekciju gamme tijekom antialiasinga. Premda je ovaj feature bio dostupan i na GeForce 7 seriji GPU-a, korisnik ga je morao uključiti ručno. Još jedna novost je korištenje antialiasinga nezavisno o formatu što je rezultiralo mogućnošću uporabe AA algoritama u kombinaciji s HDR-om. Dakako, G80 podržava i oba TAA algoritma za zaglađivanje prozirnih tekstura.
Referentna slika korištena za usporedbu kvalitete AA algoritama
GeForce 7950 GX2
GeForce 8800 GTX
Radeon X1950 XTX
Klikom na ponuđene doći ćete do screenshotova koje smo koristili za usporedbu AA algoritama na testiranim karticama. Slike su u rezoluciji 1280x960, JPG format, tako da će trebati vremena da se učitaju. Preporučamo vam da ih skinete na računalo i za pregledavanje koristite alat FastStone ImageViewer. U browseru alata izaberite četiri slike mišem istovremeno držeći pritisnutu tipku Ctrl. Potom pritisnite tipku P što će rezultirati usporednim prikazom četiri odabrane slike.
Lumenex Engine - AF algoritmi
Stara je priča da starije verzije GeForce arhitekture imaju lošiji algoritam za anizotropno filtriranje u odnosu na Radeone. S obzirom da je ovaj nedostatak NVIDIA-i konstatno nabijan na nos, nije ni čudo da je napokon ispravljen. Štoviše, AF filter kod nove generacije čipova nudi čak i bolje filtriranje nego što smo to do sad imali prilike iskusiti na Radeonima. Tako je već sa standanim quality algoritmom filtriranje na GeForce 8 seriji prema kvaliteti vrlo slično onom koje nudi high quality algoritam na Radeonima. Kada pak uključimo high quality algoritam na GeForceu 8, filtriranje svojom kvalitetom nadilazi ono ponuđeno na modernim Radeon GPU-ima.
GF 8800 GTX vs. GF 7950 GX2 - Quality mod
GF 8800 GTX vs. GF 7950 GX2 - High Quality mod
GeForce 8800 GTX vs. Radeon X1950 XTX - Quality mod
GeForce 8800 GTX vs. Radeon X1950 XTX - High Quality mod
DirectX 10 prvi dio
Priča o GeForceu 8 ne bi bila potpuna bez da spomenemo DirectX 10. Kao i G80 čip, DirectX 10 također označava radikalan tehnološki korak naprijed, korak kojim se mnogi stari principi u potpunosti napuštaju. DX 10 je najavljen kao integralni dio Windowsa Vista i kao takav neće biti podržan u starijim verzijama Windows operativnog sistema.
Jedna od glavnih značajki nove verzije DirectX-a je smanjivanje ovisnosti o performansama procesora. Kao što znamo, DirectX API sam po sebi radi kao abstrakcijski sloj između grafičkog hardvera i softvera koji taj grafički hardver koristi. S obzirom da se DirectX brine za prevođenje naredbi iz softvera u oblik razumljiv hardveru, upravljanje grafičkim hardverom pomoću DirectX-a (ili drugog 3D API-ja kao što je OpenGL) nosi sa sobom opterećenje glavnog procesora u računalu. Procesor postaje "usko grlo" sistema, a ograničava broj objekata koji se mogu iscrtati na ekranu te ograničava broj jedinstvenih efekata koji se mogu primjeniti u pojedinoj 3D sceni.
Provjera valjanosti resursa mnogo je efikasnije izvedena na DirectX-u 10
DirectX 10 rješava problem prevelikog opterećenja procesora na tri načina. Prvi je smanjenje opterećenja procesora pri iscrtavanju objekata i naredbama za promjenu stanja objekata u sceni, što je rezultat redizajna jezgre 3D API-a. Drugi način je dodavanje novih mogućnosti čiji je cilj smanjenje ovisnosti brzine grafičkog podsistema o brzini glavnog procesora. Na kraju, dodane su nove metode kojima je moguće izvršavati više funkcija sa samom jednom naredbom.
Jezgra API-a je skresana u odnosu na DirectX 9 izbacivanjem podrške za fiksne funkcije koje se vuku još iz vremena DirectX-a 7. Provjera valjanosti resursa, proces koji je prilično procesorski zahtjevan, a izvodi se prije izvođenja svake naredbe za iscrtavanje, sada je mnogo optimalnije implementira. Provjera valjanosti za svaki se objekt izvodi samo jedanput – kada je objekt stvoren, a ne svaki put kada objekt treba biti iskorišten kao što je slučaj s DirectX-om 9.
Osjetno smanjenje iskorištenja procesora rezultirat će boljim performansama u modernim 3D aplikacijama
Tri su nove metode implementirane kako bi se smanjila ovisnost o procesoru. Prva je mogućnost spremanja tekstura u nizove. Prebacivanje između različitih tekstura inače sa sobom nosi par performansi. Do sad se izbjegavanje prebacivanja između tekstura svodilo na uporabu tekstura vrlo visoke rezolucije u koje bi zapravo bilo upakirano nekoliko manjih tekstura. Kod DX-a 10 je do 512 tekstura moguće spremiti u niz. Nove instrukcije omogućavaju shaderima da pristupaju indeksiranim teksturama u nizu, a kako ove instrukcije izvodi GPU-a, opterećenje procesora je osjetno smanjeno.
Predicated-iscrtavanje je efikasnija metoda izbjegavanja iscrtavanja objekata koji na će na ekranu biti zaklonjeni nekim drugim objektom. Premda je ova metoda i do sada bila implementirana, sada se izvodi isključivo pomoću GPU-a.
Treća metoda je implementacija funkcije pod imenom stream out. Stream out omogućava geometry i vertex shaderima da rezultate kalkulacije zapisuju u direktno u memoriju kako bi oni interno mogli ponovo biti iskorišteni kao ulazne vrijednosti. Dakako, ova metoda se zapravo ponajviše odnosi na arhitekture koje će biti DX10 kompatibilne, ali neće imati hardverski unificirane shadere. Jednostavniji oblik ove funkcije je već bio implementiran u DirectX-u 9, a zove se vertex texture fetch.
DirectX 10 drugi dio
Došli smo i do metoda koje su implementirane kako bi se grafičkom hardveru više posla moglo zadati samo jednom naredbom. S DirectX-om 9 su se za izmjenu stanja objekata na sceni koristile mnoge naredbe od kojih bi svaka radila opterećenje na procesoru. DirectX 10 rješava problem korištenjem dvaju novih konstrukcija pod imenom state objects i constant buffers.
State object su zapravo grupirane low level naredbe koje je programer prije morao rabiti ručno kako bi rekonfigurirao grafički cjevovod. DirectX 10 nudi ukupno pet state objekata – InputLayout, Sampler, Rasterizer, DepthStencil i Blend. Ove skupne naredbe zapravo objedinjuju osnovna stanja grafičkog cjevovoda koja se rabe pri izvođenju 3D grafike.
Constant buffers omogućava spremanje do 4096 konstanti u jednu funkcionalnu cjelinu kojom je moguće upravljati pozivom samo jedne funkcije. Konstante su inače predefinirane vrijednosti koje se koriste kao parametri pri izvođenju svih shaderskih programa. Primjer konstante su broj, intezitet, lokacija i boja izvora svijetla u sceni, budući da će izvori svijetla utjecati na izgled svih ostalih objekata. S obzirom da se ovakve konstantne vrijednosti (konstantne u kontekstu pojedine scene) mijenjaju tijekom izvođenja aplikacije, potrebno ih je mijenjati brojnim naredbama koje opet, svaka pojedinačno, generiraju opterećenje na procesoru zbog abstrakcijog sloja koji čini DirectX API. Constant buffer omogućava programerima da spreme hrpu konstantni u jednu cjelinu na koju je moguće utjecati samo jednom naredbom odnosno pozivom samo jedne funkcije.
Usporedni prikaz resursa dostupnih programerima s različitim verzijama DirectX-a
Dakako, novi DirectX ne bi bio to što jest bez novog shaderskog modela u verziji 4.0. Glavne novosti SM-a 4.0 je uvođenje nove vrste shadera koji se bavi manipulacijom primitiva pod imenom geometry shader, unificiranje shaderske arhitekture korištenjem unificiranog seta instrukcija i jednakih resursa za sve vrste shadera te na kraju povećanje resursa dostupnih programerima pri razvoju aplikacija.
S obzirom da smo o unificiranoj arhitekturi već dovoljno rekli opisujući arhitekturu novog NVIDIA-inog GPU-a, bacit ćemo se odmah na geometry shadere. GS-ovi su u DX10 grafičko cjevovodu smješteni između vertex shadera i rasterizacije, a omogućavaju napredno baratanje s primitivama – trokutima, točkama i linijama. Ono što je bitno naglasiti je da GS-ovi mogu stvarati i uništavati podatke koje su dobili od VS-ova što Microsoft naziva data amplification odnosno data minimization. Ovakva razina manipulacije s podacima unutar GPU-a nije bila moguća na starijem hardveru i API-ju, a otvara brojne mogućnost mnogo efikasnijeg izvršavanja efekata kao što su stencil shadows, dynamic cube maps i displacement mapping.
Geometry shaderi u kombinaciji sa stream out funkcijom omogućavaju da se na GPU-u vrlo efikasno izvršavaju i algoritmi koji nemaju veze s grafikom. Tu se u prvom redu misli na ubrzavanje fizike u igrama, ali i na algortime kakvi se npr. rabe u projektu GPGPU odnosno General Purpouse GPU computing.
Na kraju, spomenio da DirectX 10 nudi i efikasniji algoritam za zaglađivanje transparentnih tekstura. Premda su i ATI i NVIDIA već ponudili vlastita rješenja ovog problema, Microsoftova metoda rezultira jednako kvalitetnim prikazom no smanjenim padom performansi.
Referetni GeForce 8800 GTX
Nakon pregleda teoretskih mogućnosti nove NVIDIA-ine arhitekture, vrijeme je da vidimo kako je izveden konkretni hardver. Referentni GeForce 8800 GTX dobili smo u ruke prilično kasno što je i glavni razlog zašto ovaj članak o novoj generaciji kartica toliko kasni u odnosu na službeni datum lansiranje serije. Uz referentnu NVIDIA-inu karticu, na test nam istovremeno bio ponuđen i PNY-ev maloprodajni model novog GTX-a. Razlike među referentnom i PNY-evom karticom nema, izuzev različite naljepnice na hladnjaku. PNY-ev model nam je ustupila tvrtka LAB 2000, a kod njih ga je moguće nabaviti po cijeni od 4.999 kn.
Kartica i pol, kako god okrenuli
GeForce 8800 GTX je bez sumnje najveća grafička kartica koju smo ikad imali prilike vidjeti. Jedina veća kartica koju smo imali prilike vidjeti je inženjerski primjerak GeForcea 7950 GX2 korišten pri lansiranju Quad SLI-a. Doduše, kartica se u "divovskom" obliku nikad nije pojavila u prodaji pa 8800 GTX zapravo nema konkurenciju. Zbog izuzetne veličine, s naglaskom na dužinu, potencijalni kupci trebaju dobro razmisliti da li će uz karticu možda morati kupiti i novo kućište.
Što se pak karakteristika tiče, njih smo već spomenuli u uvodnom tekstu. Na velikom PCB-u smješten je G80 čip koji se sastoji od 681 milijun tranzistora od kojih većina rad na taktu od 1,35 GHz. Ipak, osnovni takt GPU-a je "samo" 575 MHz. Zanimljivo je spomenuti da G80 nema integrirane neke I/O funkcije. Sam čip s vanjskim svijetom može samostalno komunicirati samo preko PCI-E sabirnice, dok mu je za ostale funkcije potreban dodatni čip NVIO kojeg je NVIDIA smjestila između GPU-a i stražnjih konektora na kartici. Na ovaj način je napravljen kompromis između integriranja brojnih novih funkcija u GPU i proizvodnih troškova. Na GPU je povezano ukupno 768 MB GDDR3 memorije na radnom taktu od 1,8 GHz DDR. GPU i memorija komuniciraju preko 384-bitne sabirnice. Premda naizgled čudna, 384-bitna sabirnica se nalazi na pola puta između klasične 256-bitne i 512-bitne sabirnice, a NVIDIA-ini inženjeri su zaključili kako će im zlatna sredina dati najbolji omjer uloženo i dobiveno s obzirom na mogućnosti GPU-a.
Pogodite što je na vrhu
Dvostruko PCI-E napajanje je stvarnost
Velik GPU i puno memorije imaju svoj nusprodukt - potrošnju energije. Premda u NVIDIA-inim dokumentima nismo pronašli konkretne podatke o potrošnji kartice, prema informacijama koje do sad znamo rekli bi da je oko 150 do 160 vata. Tome u prilog govore i dvostruki PCI-E konektori za napajanje. Premda smo dvostruke konektore već imali prilike vidjeti prije na nekim karticama, one su uredno radile ako bi bio priključen samo jedan konektor. Kod 8800 GTX to nije slučaj - potrebno je priključiti oba konektora. Imajte na umu da kartica solidnu količinu energije vuče i iz same matične ploče preko PCI-E konektora - maksimalno 75 vata. Što se tiče podržanih napajanja, nismo bili primorani nabaviti nikakve kilovatne cirkuse. Kartica je uredno i bez ikakvih problema radila na starom dobrom Coolermasterovom RealPoweru od 550 vata. S obzirom da ovo napajanje ima samo jedan PCI-E konektor za grafičku karticu, drugi smo napravili pomoću adaptera.
Velik, ali izuzetno tih i moćan hladnjak
Ako ste se bojali da će velika potrošnja rezultirati problematičnih hlađenjem, grdno ste se prevarili. Kako već otprije znamo, NVIDIA jako dobro zna kako složiti hlađenje na high-end karticama. Na GTX-u je iskorišten vrlo masivni dvoslotni hladnjak koji prekriva sve čipove na kartici, a aktivno je hlađen turbinskim ventilatorom s promjenjivom brzinom okretaja. Hladnjak se odlično nosi s toplinom koju generira kartica i što je dosta važno, nije bučan čak niti pri opterećenju. Konkretne brojke oko zagrijavanja pogledat ćemo kasnije, ali zasad nam vjerujte da je hladnjak doista odličan.
Dupli SLI konektori
Još jedan kuriozitet na kartici su dupli SLI konektori koji će omogućiti povezivanje više od dvije kartice u SLI polje. Imajte na umu da NVIDIA prilično agresivno cilja na harversko ubrzavanje fizike u igrama putem GPU-a. Mogućnost je dostupna i na starijim karticama tako da pretpostavljamo da će korisnici dvije kartice u SLI polju iskoristiti za ubrzavanje grafike dok će treća, starija kartica biti iskorištena za ubrzavanje fizike. Doduše, još ništa nije službeno, ali dupli SLI konektori svakako nisu implementirani bez razloga.
Velikih novosti što se tiče konektora nema
Eto nas i do stražnjeg dijela kartice na kojem vidimo standarne konektore - dva dual-link DVI konektora koji podržavaju HDCP zaštitu, te TV-out izlaz. VIVO funkcije nisu implementirane, no na to smo već navikli.
MSI i BFG GeForce 8800 GTS
Ruku na srce, razmjerno malo ljudi će se odlučiti na kupovinu GeForce 8800 GTX kartica s obzirom da se radi o najbržem modelu koji sa sobom nosi i vrlo visoku cijenu. NVIDIA je svjesna ove činjenice pa je zajedno s GTX-om izdala i model namijenjen korisnicima s nešto plićim novčanikom (nešto plićim s obzirom da niti slabiji model nije baš jeftin) - GeForce 8800 GTS. Stariji se siguno sjećaju kada je NVIDIA posljednji put koristila sufiks GTS - bilo je to na GeForce 2 seriji GPU-a. Tada je model Ultra bio na vrhu hranidbenog lanca, dok je model GTS bio namijenje korisnicima koji su htjeli visoke performanse, ali uz razumniju cijenu.
Model GeForce 8800 GTS je skresana verzija GTX-a. Sama je kartica osjetno manja i veličinom je vrlo slična starijim karticama iz NVIDIA-ine i ATI-jeve ponude. GF 8800 GTS GPU tako ima manji broj stream procesora, 96 u odnosu na 128 kod GTX-a. Osnovni takt GPU-a je 500 MHz, dok mnogi interni dijelovi kucaju na taktu od 1,2 GHz. Memorijsko sučelje je također skresano s 384 na 320 bita, a ista je stvar s količinom memorije koja iznosti 640 MB.
MSI GeForce 8800 GTS
MSI GeForce 8800 GTS
O MSI-jevoj implementaciji GeForce 8800 GTS-a nema se što previše reći. Radi se o referentoj kartici na čiji je hladnjak naljepljena drugačija naljepnica. Taktovi GPU-a i memorije odgovaraju onima na referentoj kartici. Kao što vidimo, referetni GTS je zapravo smanjena verzija GTX-a. Osim dimenzija, razlika postoji jedino po pitanju PCI-E konektora za napajanje i SLI konektora - implementiran je samo jedan konektor od svake vrste. Hladnjak ima iste kvalitete u odnosu na onaj na GTX-u - vrlo je moćan, ali istovremeno tih.
Bundle nije ništa posebno
Paket opreme je sasvim očekivan i prilično konvencionalan. Osim TV-out kabela i adaptera za PCI-E napajanje i dva DVI/VGA adaptera, tu je još i puna verzija Serious Sama 2 te CD s CyberLinkovim aplikacijama Power2Cinema i Power2Go.
BFG GeForce 8800 GTS
BFG-ev GTS izgleda mrvicu "opasnije"
BFG-ev 8800 GTS nam priča jednaku priču kao MSI-jev primjerak. Ponovo je riječ o referentnoj kartici koja je modificirana naljepnica i tu priča praktički staje. Tvornički taktovi su također jednaki referentom modelu. Premda nam BFG-ev GTS izgleda bolje zbog agresivnijeg logoa, kada je kartica instalirana u računalo ionako ga nećemo vidjeti.
Majica s BFG-evim logom je prilično zanimljiv dodatak
Što se pak opreme tiče, BFG je jedan od onih proizvođača koji idu svojim putem. Tako bundlanih igara nema, no tu je cool crni T-shirt s BFG-em logom koji će vlasniku omogućiti da bude glavni baja u kvartu. Zanimljiv dodatak su također i teflonske podloge za miša, no nismo ih mogli isprobati pa nećemo komentirati koliko je ovaj dodatak zapravo dobar. Ostatak opreme je standardan - adapteri za napajanje i DVI izlaze, kabel za TV-out i CD s driverima.
Testni sistem i zagrijavanje
|
|
Testna konfiguracija za nove NVIDIA-ine kartice morala je biti zvijer pa je baza sistema Intelov Core 2 X6800 procesor u kombinaciji s dva gigabajta memorije. GeForceu 8800 GTX i GTS suprotstavili smo staru perjanicu NVIDIA-ine ponude, GeForce 7950 GX2, te trenutno najbrži Radeon - model X1950 XTX. Premda NVIDIA za testiranje novih kartica preporuča korištenje monitora visoke HD rezolucije, nama je nabavka takvog monitora trenutno ipak malo previsoka investicija. Testiranje smo izveli na 17-inčnom CRT monitoru s maksimalnom rezolucijom 1600x1200, no vjerujemo da većina čitatelja ovog članka niti ne rabi rezolucije koju su više od navedene.
Što se pak drivera tiče, stari i novi GeForceovi rabe potpuno drukčije verzije. Na karticama nove generacije više nije moguće rabiti staru verziju Control Panela već samo novu verziju koja je dizajnirana za Windows Vista. Novi Control Panel je kompliciranije koristiti ako ste iskusniji korisnik, a posebice ako ste navikli na staru verziju. Uz to, neke mogućnosti koje su bile automatski ponuđene sa starim Control Panelom, sada nije moguće koristiti bez instaliranja nTunea. Čak i nakon instaliranja nTunea neke stvari ne funkcioniraju kako treba, npr. praćenje temperature grafičke kartice. Sve u svemu se nadamo da će s budućim revizijama drivera ovi problemi biti riješeni jer zaista iritiraju.
Što se tiče problema s testnim aplikacijama, jedina crna ovca bio je Farcry. Igra je nedavno dobila novu zakrpu, verzija 1.4, no ipak smo naletjeli na probleme s GeForce 8 karticama. Uključivanje HDR-a u kombinaciji s AA algoritmom bi rezultiralo korupcijom prikaza, premda je Serious Sam 2 sasvim normalno radio s istim postavkama. Da li je problem do same igre ili pak do drivera nismo uspjeli saznati, no od oka bi rekli da je stvar ipak u NVIDIA-ji.
Novi driveri donijeli su i neke novosti što se tiče konfiguracije postavki 3D prikaza. Tako je automatski uključena korekcija gamme kod korištenja AA algoritama. Također je promijenjen način uključivanja AA postavki. Prije je bilo moguće forsirati isključenje AA, forsirati pojedine postavke kvalitete ili pak prepustiti konfiguraciju aplikaciji. Sada je pak dodan novi Enhanced mod s kojim se aplikaciji prepušta uključivanje odnosno isključivanje AA algoritma, no kvaliteta algoritma se diktira iz NVIDIA Control Panela.
Što se pak tiče postavki korištenih za testiranje, na NVIDIA-inim karticama smo rabili High Quality mod dok smo kod Radeona koristili High Quality AF algoritam.
Zagrijavanje
Prije nego što se bacimo na testiranje performansi, pogledajmo kako se hladnjaci na testiranim karticama nose s toplinom generiranom od strane GPU-a i memorije.
Grijanje |
||||||||||||||||||||||||||||||||||||||||||||||||||||
Idle (°C) | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Stress (°C) | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Temperaturna očitanja izvedena su preko drivera grafičke kartice, NVIDIA Control Panela odnosno Catalyst Control Panela. Najbolji posao obavlja hladnjak Radeonu, a najgori na GeForceu 7950 GX2. Premda GeForce 8800 GTX ima energetski najgladniji GPU i najviše memorije, hladnjak obavlja izvrstan posao. Smanjen takt GPU-a, skresani broj SP-ova te manja količina memorije osigurali su modelu GTS osjetno niže zagrijavanje.
3DMark06, X3 i Farcry
3DMark06 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Score | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SM2.0 Score - GT1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SM2.0 Score - GT2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HDR/SM 3.0 Score - HDR1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HDR/SM 3.0 Score - HDR2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Fill Rate - Single-Texturing | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Fill Rate - Multi-Texturing | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pixel Shader | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Vertex Shader - Simple | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Vertex Shader - Complex | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Shader Particles (SM3.0) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Perlin Noise (SM3.0) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Po običaju krenut ćemo s 3DMarkom06. GeForce 8 kartice dominiraju u svim testovima, a posebno se ističe GTX koji zaista pokazuje osjetno bolje performanse u odnosu na svog mlađeg brata. GX2 pokazuje nadmoć u testovima fillratea što i nije čudno s obzirom da je zapravo riječ o dva čipa koji rade zajedno preko SLI protokola. Najveća razlika u peformansama vidljiva je u Shader Particles testu koji je baziran na funkciji vertex texture fetch koju Radeon podržavaju samo teoretski, ali ne i u praksi. Kao što smo saznali u opisu novog DirectX-a, GeForce 8 SP-ovi podržavaju stream out funkciju koja je unaprijeđeni oblike vertex texture fetcha pa nije niti čudno da u ovom testu nove kartice gaze starije modele.
X3 Rolling Thunder |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x1024 @ 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 @ 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
X3 je prvi naslov koji nam daje uvid u performanse u realnim aplikacijama. GeForce 8800 GTX prema očekivanjima izbija na prvo mjesto. Na drugom mjestu je Radeon X1950 XTX, a u stopu ga slijedi GX2. GTS je pak na zadnjem mjestu što bas i nismo očekivali, ali što je tu je.
Farcry |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x1024 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
U Farcryu se situacija mijenja i Radeon pada na zadnje mjesto na grafikonu. Na prvom je i dalje 8800 GTX, a slijede ga GTS i GX2 s malom izmjenom pozicija paralelno s promjenom rezolucije. Kao što smo napomenuli u opisu testnog sistema, imali smo namjeru istestirati Farcry s uključenim HDR-om i AA algoritmima, ali su nove NVIDIA-ine kartice odbile poslušnost.
Call of Duty 2, F.E.A.R. i HL2 Lost Coast
Call of Duty 2 |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x1024 @ 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 @ 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Nastavljamo s igrama koje su bazirane na Direct3D API-u. Call of Duty 2 nam prikazuje sličnu situacija kao Farcry no u ovom slučaju igra nije toliko ograničena performansama procesora pa grafičke kartice s dužim "nogama" mogu pokazati bolje performanse. Iz istog razloga vidimo kako GTX ostavlja sve ostale testirane kartice u prašini iza sebe. Na drugom mjestu se pak nalazi GTS koji je nešto brži od kartica od prije prisutnih na tržištu. Ovakva pozicija GTS je puno zahvalnija s obzirom pri lansiranju nove generacije procesora uvijek očekujemo da će oslabljeni model nove perjanice pokazivati nešto bolje performanse od najbolje kartice stare generacije.
F.E.A.R. |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x960 @ 4xAA + 16x AF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 @ 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
U F.E.A.R.-u se na drugo mjesto ponovo penje GF 7950 GX2, ali i dalje je osjetno slabiji u odnosu na novi GTX. Treba ipak imati na umu da je GX2 u prednosti u odnosu na sve ostale testirane kartice s obzirom da rabi AF algoritam lošije kvalitete koji je zbog toga manje poguban za performanse. Novi GTX i GTS su pak u lošijoj poziciji budući da oba rade s visoko kvalitetnim AF algoritmom koji nudi bolji prikaz nego dosadašnji pojam kvalitete - Radeonov HQ AF algoritam.
HL 2 Lost Coast |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x1024 @ 4xAA + 16xAF + HDR | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 @ 4xAA + 16xAF + HDR | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Half Life 2 Lost Coast se pokazao kao priličan zalogaj za mogućnosti modernih grafičkih kartica. Skaliranje performansi je prilično zanimljivo te po prvi put vidimo kako obje kartice iz GeForce 8 serije dobrano odmiču od starijih modela. Na kraju grafikona se začudo smjestio GX2 kojem čini se baš ne odgovara forsiranje High Quality postavki u driverima. Valja naglasiti kako je ovo i prvi naslov u kojem se koristi HDR. Doduše, ne radi se o pravom HDR-u implementiranom preko FP16 ili FP32 formata, ali efekt i dalje izgleda odlično i rezultira popriličnim udarcem na performanse.
Serious Sam 2, TrackMania Nations
Serious Sam 2 |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x960 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x960 4xAA + 16xAF + HDR | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 4xAA + 16xAF + HDR | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Serious Sam 2 nam nudi mogućnost da napokon forsiramo pravi HDR. Test smo izvrtili prvo bez uključenog HDR-a i performanse su kao što vidimo vrlo slične onima koje smo vidjeli u ostalim testovima. Dominira 8800 GTX, dok na drugom mjestu GTS i GX2 izmjenjuju mjesta, zavisno o rezoluciji.
Drugi put smo test zavrtili na mnogo zahtjevniji način. Uz AA i AF algoritme uključili smo i HDR. GF 7950 GX2 ovaj feature ne podržava pa stoga njeni rezultati nisu unešeni. Što se pak tiče kartica koje su kompatibilne s ovakvim načinom testiranja, opet vidimo jako lijepo skalirane performanse. GTX nadmoćno drži prvo mjesto, a Radeon X1950 XTX zaostaje za popriličan broj sličica po sekundi - gotovo je dva puta sporiji od NVIDIA-ine nove kartice. Negdje na pola puta ugodno se smjestio GTS zadovoljivši se srebrnom medaljom.
Trackmania Nations |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x960 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
TrackMania Nations je novi test u našem repertoaru, a naslov smo odlučili isprobati zato što nam fali testova koji nisu FPS-ovi odnosno pucačine. Kao što vidimo, to nam baš i nije pošlo za rukom s obzirom da su rezultati ovog u najmanju ruku čudni. Kao prvo, GX2 ima potpuno nerealne performanse nadjačavajući za nekoliko puta sve ostale kartice na testu. Ako pak odbacimo rezultate GX2 kartice kao nemeritorne, opet nailazimo na čudnu situaciju - dok model GTX u nižoj rezoluciji nadjačava Radeon, Radeon ga unatoč lošijim teoretskim mogućnostima nadjačava u višoj rezoluciji gdje bi u teoriji GTX baš trebao "protegnuti noge".
Pacific Fighters i Quake IV
Pacific Fighters |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x960 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Dakako, morali smo se malo poigrati i s OpenGL aplikacijama premda ih je na tržištu sve manje i manje, barem što se tiče zabavnog softvera. Prvi je Pacific Fighers, zračna simulacija koja je između ostalog jedini softver koji je znao uporabiti vertex texture fetch funkciju implementiranu na starije GeForceove. Nažalost, Pacific Fighters je opako ograničen po pitanju procesora tako da skaliranja performansi baš i nema. Na prvom mjestu je naravno GTX, a Radeon na zadnjem, no razlike su doista male. Da bi Pacific Fighters imao bolje skaliranje rezultata trebao bi nam ili osjetno brži procesor koji ne bi predstavljao usko grlo sistema (koliko god da smješno zvuči, ali Core 2 X6800 u ovom slučaju doista jest usko grlo sistema) ili pak monitor s mnogo višom podržanom rezolucijom gdje bi grafičke kartice mogle pokazati svoje performanse mnogo bolje.
Quake IV |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x1024 @ 4xAA + 16x AF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 @ 4xAA + 16xAF | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Još jedan mnogo poznatiji OpenGL naslov je Quake IV u kojem su NVIDIA-ine kartice uvijek pokazivale osjetno bolje performanse od ekvivalentnih Radeona. To se događa i sad, pa je GTX na prvom mjestu, daleko ispred svih. GX2 opet pokazuje zube pa se nalazi na drugom mjestu, a tik ispod njega je GTS sa svojom osjetno kvalitetnijom slikom. Na zadnjem mjestu je prema očekivanju Radeon.
Antialiasing testovi
Znamo da nova GeForce serija donosi sa sobom nove AA algoritme, vidjeli smo kakav utjecaj ti algoritmi imaju na kvalitetu slike, ali još uvijek ne znamo kako utječu na performanse. Vrijeme je da riješimo i tu nepoznanicu. Glavni alati pri ovom testu AA performansi biti će nam Serious Sam 2 i HL2 Lost Coast. Uz to, Lost Coast će nam pomoći da vidimo kakav udarac na performanse ima korištenje AA algoritama koji zaglađuju transparentne teksture.
Serious Sam 2 - AA test |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 0xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 2xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 4xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 8xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 8xQ AA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 16xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 16xQ AA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Novi CSAA modovi zaglađivanja slike doista ne uzrokuju toliki pad performansi kao klasični MSAA modovi s ekvivalentnim brojem uzoraka. Dakako, ipak je riječ o svjesno načinjenom kompromisu, no s obzirom na to da je pad performansi pri korištenju CSAA modova relativno malen, a povećanje kvalitete prikaza u većini slučajeva prilično solidno (imajmo na umu da u najgorem slučaju CSAA mod nudi kvalitetu slike kao 4x MSAA algoritam), NVIDIN novi štos je prilično dobar.
HL2 Lost Coast - AA test |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 0xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 2xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 4xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 8xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 8xQ AA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 16xAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 16xQ AA | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
U Lost Coastu vidimo istu stvar, performanse pri korištenju CSAA modova padaju za oko 20% u odnosu na 4x MSAA algoritam. S obzirom da niti GTX niti GTS nemaju problema sa "žvakanjem" Lost Coasta na ovaj način, CSAA i ovaj put može dobiti našu toplu preporuku.
HL2 Lost Coast - Transp. AA |
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 2x TSAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 4x TSAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 8x TSAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 8xQ TSAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 16x TSAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
1600x1200 16xAF + 16xQ TSAA | ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Uključivanjem AA algoritma za zaglađivanje prozirnih tekstura odnosno Transparency AA kod NVIDIA-e te Adaptive AA kod ATI-a, performanse svih kartica padaju, no GeForce 8 modeli i dalje guraju naprijed prilično fino. Imajte na umu da su na svim karticama rabljeni najkvalitetniji algoritmi za zaglađivanje odnosno TSAA kod NVIDIA-e i Quality Adaptive AA kod ATI-a.
Overclockanje
Pregled performansi novih kartica ne možemo završiti bez da ih probamo overclockati. S obzirom da se radi o karticama s jednakim hlađenjem, koje uz to dolaze ih iste tvornice, pretpostavljali smo da će rezultati overclockanja biti vrlo slični. Nismo se prevarili.
GPU |
Memorija |
|
Referetni 8800 GTX | 575 MHz |
1800 MHz DDR |
Referetni 8800 GTS | 500 MHz |
1600 MHz DDR |
Overclockani 8800 GTX | 620 MHz |
2120 MHz DDR |
Overclockani MSI 8800 GTS |
630 MHz |
2060 MHz DDR |
Overclockani BFG 8800 GTS | 610 MHz |
2000 MHz DDR |
Rezultati overclockanja novi kartica su izuzetno dobri. Model GTX od kojeg se očekuje da je već tvornički nafrljen do kraja, dao se overclockirati za 45 MHz što se tiče GPU-a i 320 MHz što se tiče memorije. Oba slabija GTS pokazali su se još potentnijima pa je kod njih takt GPU-a narastao za punih 110 odnosno 130 MHz, a takt memorije za 400 odnosno 460 MHz. MSI-jeva kartica se bez sumnje pokazala kao najbolji overclocker, ali ove rezultate ipak treba uzeti sa zrncem soli. Naime, sve kartice su izašle iz iste tvornice tako da firme poput MSI-a i BFG-a ne mogu utjecati na njihov overclockerski potencijal. Ipak, rezultati su vrlo slični tako da sa sigurnošću možemo reći da su nove NVIDIA-ne kartice izvrsni overclockeri, pogotovo kad je riječ o modelu GTS.
Rezultati na povišenim taktovima
Overclock |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3DMark06 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
X3 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Farcry | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Serious Sam 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
F.E.A.R. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
COD2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HL2 Lost Coast | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Brojke govore same za sebe - na povišenim taktovima sve kartice prilično dobijaju na performansama. Također je jasno da je za iskorištavanje mogućnosti ovako moćnog hardvera praktički nužno imati monitor koji nudi HD rezoluciju budući da pri rezoluciji 1600x1200 ove kartice ne pokazuju svoj puni potencijal. Nažalost, veliki LCD monitori su danas još uvijek vrlo skupa roba.
Zaključak (conclusion)
Nema sumnje da je NVIDIA sa serijom GeForce 8 napravila izvrstan posao. S novim GPU-om ispravljeni su svi nedostatci koji su bili prisutni na karticama starije generacije, dok je istovremeno implementirana puna podršku za novi Microsoftov 3D API zajedno s moćnom i fleksibilnom arhitekturom čiji puni potencijal još relativno dugo vremena neće biti iskorišten. Unatoč arhitekturi koja je usmjerena na nadolazeće aplikacije, GeForce 8800 GTX i u postojećim naslovima ima performanse bez premca. Dakako, nije sve u performansama, ali ovu je lekciju NVIDIA jako dobro naučila ponudivši s GeForceom 8 kvalitetu slike kojoj ne može konkurirati niti jedna druga kartica na tržištu.
Visoke performanse, kvaliteta slike i napredna arhitektura donekle su zasjenjeni veličinom i potrošnjom kartice, no to su problemi koje NVIDIA praktički nije mogla izbjeći. Još jedna pozitivna stvar u cijeloj priči je to što je hlađenje ponovo izvrsno implementirano, pa kartica unatoč visokoj potrošnji nije niti bučna, a niti previše zagrijana. U prilog hlađenju i mogućnostima čipa govori i činjenica da smo i ovaj najsnažniji model uspjeli prilično solidno overclockati bez uporabe dodatnog hlađenja.
Ako vam je model GTX preskup (što nije ništa čudno), alternativa je kupovina modela GeForce 8800 GTS koji možemo nazvati mini verzijom modela GTX. Kartica je manja, manje energetski zahtjevna i jeftinija te nudi sve mogućnosti modela GTX uz nešto niže performanse. Premda se ne može mjeriti s modelom GTX, GTS nudi jednake ili bolje performanse od najjačih kartica prethodne generacije, bilo da je riječ o GeForceovima ili Radeonima. Ako ste fan overclockanja, model GTS je čak bolji izbor nego punokrvni GTX budući da smo obje testirane retail kartice, modele MSI-a i BFG-a, uspjeli overclockati na taktove koji su viši od onih na kojima radi referetni GeForce 8800 GTX. Čak niti na ovako visokim taktovima GTS ipak ne doseže performanse GTX-a budući da GPU ne raspolaže tolikim brojem stream procesora, a i memorijska sabirnica nije toliko široka kao na najsnažnijem modelu. No za time ne treba žaliti budući da GeForce 8800 GTS i ovako nudi jako puno.
Što se pak tiče konkretnog izbora kartice, sa sigurnošću vam možemo reći da nećete pogriješiti s odabirom kartice bilo kojeg branda. Sve one izlaze iz iste tvornice, a razlikuju se isključivo prema naljepnici na hladnjaku i setu opreme koja se isporučuje s karticom. Performanse, mogućnosti i overclockeri potencijal su kod svih kartica jednaki.
Na kraju, ostaje nam nadati se da će se uskoro pojaviti naslovi kompatibilni s DirectX-om 10 kako bi mogli isprobati sve mogućnosti koje nudi GeForce 8 serija. Pretpostavljamo da će do tada i ATI odnosno AMD oglasiti sa svojim DX10 kompatibilnim GPU-om. Ruku na srce, to im ne bi trebalo biti previše teško s obzirom da ATI-jev grafički čip koji pogoni Microsoftov Xbox 360 krasi unificirana shaderska arhitektura.
Conclusion
There is no doubt that NVIDIA did an excellent job with GeForce 8 series. With new GPU NVIDIA fixed all problems which plagued older GeForce cards, at the same time introducing full compatibility with DirectX 10 API in combination with powerful and flexible architecture whose full potential will not be exploited in the near future. Altough having architecture focused on high performance in future gaming titles, GeForce 8800 GTX offers peerless performance in all existing applications. Of course, raw performance is not the sole characteristic that defines a good GFX card, but NVIDIA learned much from past mistakes. GeForce 8 thus offers picture quality which can not be rivaled by any other card on the market.
High performance and picture quality coupled with advanced architecture are somewhat shadowed by sheer physical size and energy consumption of the card. Unfortunately these problems are practicaly unavoidable. Luckily, NVIDIA dealt very well with these compromises. Altough card consumes lots of energy and dissipates large amount of heat, excellent cooling solution keeps temperature of the card on a very acceptable level and at the same time generating very small amount of noise. One practical proof of the quality of cooling (and quality of GPU itself) is the fact that we managed to push GPU and memory clocks of the reference GeForce 8800 GTX by a solid margin without using any special equipment.
If you consider GTX model too pricey (and that is no suprise), there is an alternative - GeForce 8800 GTS which is basically a mini version of GeForce 8800 GTX. GTS is smaller, less energy hungry, cheaper and offers all features of GTX model but coupled with lower performance. Altough it can not compete with its older brother, GTS offer equal or better performance in comparison to older flagship cards, GeForce or Radeon. If you fancy overclocking, GTS is even a better choice than "pureblooded" GTX. In our test we managed to push clocks of both retail GTS cards (from MSI and BFG) higher than clock offered by reference GF 8800 GTX. Note that even such higly overclocked GTS can not match the performance of GTX on reference clocks because cheaper card has less stream processors and more narrow memory bus. Truth to say, this is not an issue because GeForce 8800 GTS packs quite a punch as it is.
As for practical choice of the card or better say brand of the card, you won't make a mistake by choosing any brand present of the market. Brand really doesn't matter as all GeForce 8800 GTX/GTS cards are made in the same factory - only difference is sticked on the cooler and equipment shipped in the retail package. Performance, features and overclocking potential are same on all cards, regardless of brand.
In the end, only thing we have to wait for is the arrival of DirectX 10 games so we can really test all features of GeForce 8 series. Presumably at the same time ATI/AMD will also launch its own DirectX 10 compatible GPU and GeForce 8 will get a real competition on the market. Truth to say, ATI shouldn't have too much problems with that considering the fact that Xenos GPU powering Microsoft Xbox 360 already sports unified shader architecture.