Intel Core i7 – arhitektura i performanse

Datum objave 03.11.2008 - Krešimir Matanović

Uvod i Nehalem arhitektura

16. rujna ove godine, dakle prije otprilike mjesec i pol dana prisustvovali smo workshopu kojeg je za novinare Intel organizirao u zračnoj luci u Munchenu. Tamo smo saznali informacije i vidjeli u akciji o njihovu novu mikroarhitekturu kodnog imena Nehalem. Pričali su nam o promjeni filozofije u dizajnu, novom "power manangementu", novim instrukcijama, povratku na Hyper Threading itd., tj. o stvarima koje su već duže vremena poznate, neke od jesenskog IDF-a, a neke i od prošle godine. No, ono što je bilo najzanimljivije je da su nam nove desktop i serverske procesore pokazali u akciji. Danas je konačno došlo vrijeme da i Vama predstavimo dijelove te nove arhitekture - nove desktop procesore i novi X58 čipset, te njihove performanse. Intel nam je na test poslao kit koji se sastoji od jednog Core i7-965 Extreme Edition i jednog Core i7-920 procesora, zatim Intelove DX58SO "Smackover" Extreme matične ploče, tri pločice Quimondine DDR3 1067MHz CL7 radne memorije, Intelovog SSD X25-M 80GB diska, Thermalrightovog Ultra-120 eXtreme RT hladnjaka i Intelovog DBA-A hladnjaka. U zadnji tren je stigla i Gigabyteova GA-EX58-UD5P ploča koju nažalost nismo stigli testirati, no zato ćemo Vam pokazati kako izgleda i koje su joj karakteristike.

 

Nehalem mikroarhitektura

Intel svoj model razvoja procesorske mikroarhitekture naziva "Tick-Tock", u kojem se izmjenjuje predstavljanje nove mikroarhitekture sa novim proizvodnim procesom. Prva Tock faza tj. nova mikroarhitektura su bili Conroe (Merom) procesori napravljeni u 65nm procesu, nakon kojih je uslijedila Tick faza tj. Penryn procesori napravljeni u 45nm procesu. Danas je red na novoj Tock fazi, tj. novoj mikroarhitekturi proizvedenoj na postojećem 45nm procesu. Sljedeći Tick će biti smanjivanje tog proizvodnog procesa u 32nm iz čega će proizaći novi Westmere procesori, a potpuno nova mikroarhitektura, tj. novi Tock će biti Sandy Bridge na 32nm. Danas ćemo se ipak zadržati na Nehalemu.

Ronak Singhal, glavni arhitekt Nehalem mikroarhitekture, otvorio je Munchenski workshop predstavljanjem arhitekturalnih novosti i novog power managementa Nehalema. Saznali smo kako će prvi procesori kodnog imena Bloomfield bazirani na Nehalem arhitekturi nositi marketinško ime Core i7, te kako će ih za početak biti tri. Svi će imati četiri jezgre i podržavati HyperThreading, što je bila jedna od značajki Pentium 4 procesora i njegove NetBurst arhitekture. Bloomfieldi su napravljeni u Intelovom 45nm proizvodnom procesu, imaju 731 milijun tranzistora, 8M trećestupanjske priručne memorije, podržavaju SSE4.2 instrukcije i možda najbitnije od svega imaju integrirani DDR3 memorijski kontroler (kao AMD-ovi procesori). O svemu tome detaljnije pročitajte u daljenjem tekstu, a u opisu ćemo krenuti od početka.

U dizajniranju nove arhitekture, vodili su se mišlju kako bi novi procesori trebali biti brzi kako u single-threaded tako i u multi-threaded aplikacijama, a kada se od njih ne zahtijeva snaga i brzina morali su biti štedljivi. Kao baza je naravno korištena poznata Core arhitektura, koja je kako znamo donijela radikalne promjene u odnosu na NetBurst. Na slici iznad vidimo kako izgleda i kako je podijeljen jedan Quad-Core Nehalem. Intel ga dijeli na "un-core" i "core" dio. Pod "un-core" spada L3 priručna memorija, I/O dijelovi, memorijski kontroler i dva QPI-a (Quick Path Interconnect). U slučaju Bloomfielda QPI je samo jedan, dok serverski čipovi imaju dva.

Trećina jedne jezgre otpada na L1 i L2 priručne memorije, trećina pripada izvršnom "out of order" dijelu, a preostalu trećinu zauzima dekoder, logika za predviđanje grananja, rukovanje memorijom i "paging". U odnosu na Core arhitekturu, Nehalemov front-end donosi poboljšanja u Macrofusionu, Loop Stream Detectoru (28 Micro-Opsa u odnosu na 18 kod Core-a, te uklanjanje dekodera) i u logici za predviđanje grananja (uvedeni L2 Branch Predictor i Advanced Renamed Return Stack Buffer (RSB)). Izvršni dio jezgre koji izvodi upravljanje i izvršavanje opercija je i dalje sposoban izvršiti 4 instrukcije po taktu, ima 128-bita široki SSE te Super Shuffle. Nehalem donosi povećani paralelizam ("out of order" struktura veća za 33% u odnosu na Conroe), poboljšani memorijski podsistem (nova TLB hijerarhija), brzi 16-bajtni "unaligned" pristup priručnoj memoriji te brža sinkronizacija primitiva (LOCK prefix, XCHG) što rezultira većom skalabilnošću.

Intelova Hyper-Threading tehnologija, poznata i kao SMT (Simultaneous Multi-Threading) se vratila, a oni se pak ponovno hvale svi njenim predostima. HT je sada učinkovitiji jer iskorištava izvršni mehanizam širine 4 instrukcije po taktu, kojeg konstantno puni sa višestrukim threadovima (dretvama), te skriva latenciju jedne dretve. Najviše ističu kako je HT najbolja funkcija po pitanju efikasnisti, jer ne zauzima puno mjesta na jezgri (minimalno povećanje logike), a znatno poboljšava performanse (u ovisnosti o aplikaciji). SMT na Nehalemu profitira dodatno zbog veće priručne memorije i povećane memorijske propusnosti čitave arhitekture.

Ustroj priručne memorije je doživio znatne promjene, a vrlo je sličan Phenomovom. Trostupanjski ustroj donosi 64KB L1 memorije (32KB instrukcijske + 32KB podatkovne), koja je usporena je u odnosu na arhitekturu Penryn procesora (4 ciklusa vs. 3 ciklusa). L2 memorije je sada "samo" 256KB po jezgri. Unificirana (instrukcijska i pdatkovna), 8-smjerna, te služi kao međuspremnik L3 memoriji (brzina je 10 ciklusa). Treći stupanj priručne memorije je i najzanimljiviji te ćemo se na njemu malo duže zadržati. Ukupno se 8MB L3 memorije se nalazi na "un-core" dijelu procesora i ona je dijeljena između svih jezgri. U slučaju prva tri Bloomfielda količina memorije je 8MB, a do povećanja će doći kada se poveća i broj jezgri. L3 memorija je uključiva, što znači da su i podaci iz L1 i L2 memorija u njoj (ukoliko podaci nisu u L3, CPU zna da nisu ni u L1, ni u L2 ni u jezgrama). Smisao iza ovoga je smanjivanje "core snoop" prometa što povećava performanse i smanjuje potrošnju energije. Ovaj "on-die snoop filter" će jako dobro doći prilikom povećanja broja jezgri.

Sljedeće velike novosti su odmak od klasične arhitekture FSB-a na novu QPI (QuickPath Interconnect) i integracija memorijskog kontrolera "on-die". Integrirani memorijski kontroler podržava DDR3 memoriju, do tri kanala po socketu, RDIMM i UDIMM te RAS značajke. To znači kako će te za potpuno iskorištenje velikog memorijskog bandwidtha Nehalema morati koristiti tri DDR3 memorijske pločice niskih latencija, a proizvođači su kao što već znamo počeli sa isporukom "triple-channel" kitova. Nehalem inicijalno podržava 1066MHz DDR3 memoriju, no putem overclockinga je moguće dobiti i više brzine. Ipak, postizanje viših brzina može ograničiti maksimalni napon od 1.6V koji smijemo "dati" memoriji. Znamo da današnji DDR3 kitovi za veće brzine zahtijevaju nerijetko i 2.0V, a s obzirom da je memorijski kontroler sada u procesoru nije preporučljivo podizati napon ovako visoko. Ubuduće će na tržište doći i procesori koji će imati samo dva aktivna memorijska kontrolera. Tu dolazimo i do činjenice kako će programeri sada morati brinuti i kako Intelovi sistemi sada imaju i Non-Uniform Memory Access (NUMA), što postaje bitno kod multi-socket setupa.

QPI zamjenjuje dosadašnji FSB, a vrlo je sličan Hyper Transport-u, te će serverski Nehalemi znatno profitirati zbog činjenice da je dosta softvera već prilagođeno AMD-ovoj serverskoj arhitekturi i HT-u. High-end Nehalemi će imati dva bi-direkcionalna QPI linka koji će u jednom smjeru raditi na brzini od 6.4GT/s, što znači da će ukupni bandwidth biti 25.6GT/s. Mainstream Nehalemi će imati samo jedan bi-direkcionalni QPI link.

Intel je sa novom arhitekturom poboljšao i virtualizacijske sposobnosti što će se posebno odraziti na serverske platforme. Sa Penrynom je Intel SSE4 instrukcijski set proširio na SSE4.1, a sada su sa Nehalemom dodali još instrukcija i nazvali ga SSE4.2 (znamo da naziv SSE5 koristi AMD).

Jednako zanimljiva novost je i integracija PCU (Power Control Unit) kontrolera i uklanjanje domino logike koja je korištena do sada. Na PCU je potrošeno oko 1 milijun tranzistora (toliko je imao Intel 486 procesor). PCU ima svoj firmware koji se u realnom vremenu brine o temperaturama, struji, snazi i zahtjevima operativnog sistema. Kao što je vidljivo sa slike, svakoj jezgri je dodijeljen jedan PLL, te stoga svaka može raditi na neovisnom taktu (kao i kod Phenoma) i naponu. Nehalemove jezgre mogu individualno biti kompletno ili skoro ugašene kada su u dubokim sleep stanjima, dok sa trenutnim procesorima to nije moguće. Drugim riječima, Nehalemova integrirana strujna vrata dozvoljavaju jednoj ili više jezgri da u operativnom stanju rade na nominalnoj voltaži, dok je preostalim neaktivnim jezgrama u potpunosti moguće prekinuti dovod struje. Duboko C6 stanje je dakle sada omogućeno za svaku jezgru, a kao dodatak tome, i "un-core" logiku je moguće poslati u C6, te time još više sniziti potrošnju. Izlazak iz ovako dubokih stanja traje dugo, i tu PCU stupa na scenu tako što prati situaciju i po potrebi ne dozvoljava odlazak u duboka C6 stanja. PCU dakle prati i zahtjeve OS-a, te može donijeti inteligentne odluke u koje stanje poslati jezgre, bez obzira što mu OS govori. Još jedna prednost ovakvog on-die power managementa je da se promjene napona ostvaruju puno brže, što dovodi do efikasnijeg iskorištavanja energije.

Posljednja novost vezana uz Nehalem mikroarhitekturu je Turbo Mode. Premda je to predstavljeno još sa mobilnim Penryn procesorima, na Nehalemima je sve naravno unaprijeđeno. Turbo Mode je sastavni dio Intelove Speed Step tehnologije i operativni sistem ju tretira kao još jedno P-stanje. Ukoliko se pokaže potreba za višim performansama Turbo Mode se uključuje i povišava frekvenciju jednoj ili dvjema jezgrama iznad nominalnih vrijednosti (mijenja množitelj), dok ostale dvije zadržavaju istu radnu frekvenciju ili mogu postati neaktivne. Ovo naravno ovisi o aplikaciji i koliko threadova koristi, no sve mora ostati unutar TDP-a. Ukoliko on naraste iznad 130W jezgrama se automatski snižava frekvencija. Kako to funkcionira u praksi pokazati ćemo Vam kasnije u tekstu. Sada krenimo na opis Bloomfield procesora koji su nam pristigli na test.

Core i7 i DX58SO "Smackover"

Intel Core i7

Od tri procesora koje će Intel službeno predstaviti kasnije u ovom mjesecu na test su nam stigla dva - Core i7-965 Extreme Edition i njegov sporiji i zaključani brat 920. S obzirom da Core i7 Extreme 965 ima otključan množitelj može odglumiti i srednji procesor iz ponude - model 940, te će te stoga u rezultatima testova vidjeti i ovaj procesor. Ovi procesori, bazirani na Nehalem arhitekturi, kao što smo rekli nose kodno ime Bloomfield, a tržišno Core i7. Sve tehnološke novitete smo nabrojali, a ponoviti ćemo kako se proizvode u Inteovom 45nm Hi-k Metal Gate proizvodnom procesu, kako imaju 731 milijun tranzistora i kako "sjede" na novom LGA socketu koji ima 1366 pinova. Razumljivo, više pinova zauzima i više mjesta pa su Core i7 procesori znatno veći nego njihovi prethodnici. Pakiranje procesora je dimenzija 60x82 mm (LGA775 je 58x61 mm), a pin pitch je 0.4mm (LGA je 0.43x0.46 mm). Procesori podržavaju Hyper-Threading tehnologiju, što znači da donose performanse 8 dretvi na 4 jezgre, donose Turbo Boost i 8MB L3 Smart Cache tehnologiju. Imaju integrirani memorijski kontroler sa podrškoma za DDR3 memoriju brzine 1067MHz, QPI tehnologiju za vezu sa X58 čipsetom itd. Potrebno je napomenuti kako svi imaju TDP od 130W.

Core i7-965 Extreme Edition je najbrži i najskuplji procesor iz ponude, a radi na brzini od 3.2GHz. Osnovno obilježje mu je što ima otključan množitelj te se lakše overclockira od procesora kojima je množitelj zaključan. Potrebno je napomenuti kako procesor od takt generatora dobiva baznih 133MHz. Tih 133MHz pomnoženih sa množiteljem 24 daje takt od 3.2GHz. U TurboModu prvoj jezgri se množitelj može automatski podići do 26, a ostalima na 25. Brzina QPI linka na najbržem procesoru je maksimalna tj. 6.4GT/s (3200MHz). Kada je ovaj procesor na ploči u BIOS-u se pojavljuju dodatne opcije za promjenu množitelja, podizanje TDP-a, TDC-a ili pak omogućavanje zaobilaženja limita struje regulatora snage CPU-a. O ovim postavkama ćemo više reći kada na red dođe overclocking.

Core i7-920 ima množitelj zaključan na brojci 20, te mu je stoga radna frekvencija 2.67Ghz. Kod ovog procesora sporiji je i QPI link koji radi na 4.8GT/s (2400MHz). Tvrdnja da ovaj procesor ima zaključan množitelj i nije u potpunosti istinita. U TurboModu, prvoj jezgri ovog procesora automatski se množitelj podiže na 22, dok preostalima tri ide na 21. Ove funkcije su potpuno automatske i nama nedostupne u BIOS-u za razliku od EE procesora. Kako smo spomenuli ranije, za potrebe testiranja smo EE model pretvorili u 940 model, koji po defaultu množitelj ima zaključan na 22 i radi na taktu od 2.93GHz.

Na gornjoj slici vidimo kako funkcionira Turbo Mod kada je u pitanju 965 EE procesor. Vidimo kako je množitelj skočio na 26, pri čemu je takt porastao na 3.46GHz. No to vrijedi samo za prvu jezgru, dok se ostalima množitelj podiže samo za 1. Ovo se naravno događa samo ukoliko procesor ne prelazi svoj TDP-od 130W

 

Intel DX58SO "Smackover"

Sa novim procesorima i njihovim novim pakiranjima iz Intela stiže i novi čipset te novi socket. IOH nosi ime X58 te se značajno razlikuje od svojeg prethodnika X48. Naravno najbitnija novost je preseljenje memorijskog kontrolera na CPU. X58 (northbridge) se tako brine o 36 PCIe linija koje mogu biti konfigurirana kao 1x16, 2x16 ili pak 4x8 (uz ostale kombinacije), a sa procesorom je povezan preko 25.6GB/s QPI linka. ICH (southbrige) je dobro poznati ICH10R koji ima 676 pinova i dolazi u PBGA pakiranju. On se brine o SATA, USB, LAN i ostalim sistemskim sučeljima, a sa IOH-om je spojen preko 2GB/s DMI linka. Na sve njih je vezan generator takta 133MHz.

Nama je ploča kodnog imena "Smackover" stigla u bulk verziji, odnosno bez ikakvog bundlea (osim drivera i Back Panel limića), a kada dođe u prodaju pakiranje bi trebalo izgledati kao na gornjoj slici. Intel je za kutiju odabrao crnu boju koja karakterizira proizvode iz njihove Extreme serije.

DX58SO ploča je napravljena na crnom 8-slojnom PCB-u u ATX formatu. U potpunosti je "Legacy Free", što znači da nema PS/2, serijskih ili pak paralelnih portova, baš kao i nedavno testirana Intelova DG45ID ploča. Podržava dual PCIe x16 konfiguracije te diskretni TPM v1.2. Za raspodjeljivanje 133MHz takta procesoru, ICH-u i IOH-u brine se takt generator CK505 firme Silego Semiconductors. Vidimo kako se layout razlikuje znatno od dosadašnjih ploča baziranih na Intelovim čipsetima. Procesor i regulacija njegovog napajanja pomaknuta je u sredinu ploče, dok su memorijski utori prebačeni na sami vrh. Intel ovakvo postavljanje memorijskih slotova opravdava objašnjenjem kako je ta pozicija bolja za hlađenje, a ujedno je i centrirana te približena procesoru što ima utjecaja na frekvanciju i latencije. Northbridge ja pak pomaknut u desno prema samom rubu ploče. Hlađenje je u potpunosti pasivno te je izvedeno bez upotrebe toplovodnih cijevi. Plavo obojani aluminijski blokovi se nalaze na PWM regulatorima, northbridgeu i southbridgeu. Primjećujemo i kako su kondenzatori oko vitalnih dijelova (regulacija napona procesora, memorije i NB-a) Solid State, dok su za manje vitalne dijelove ploče korišteni standardni elektrolitski.

Na prvoj gornjoj slici možemo vidjeti kako izgleda IOH, odnosno X58 Express čip. Napajanje je 6-fazno, razvučenije je provedeno kroz više slojeva PCB-a nego do sada. Mehanizam za pričvršćivanje procesora na pinove je kao što vidimo sa slike znatno drugačiji od onoga na LGA775. Zbog većeg procesora, većih hladnjaka i mehanizam mora biti robustan, te ga je stoga bilo potrebno i dodatno učvrstiti. Na poleđini ploče se nalazi metalna pločica debljine 2.5mm koja je vijcima vezana za mehanizam. Novi mehanizam zahtjeva i minimalnu debljinu PCB-a koja mora biti između 1.57mm i 2.54mm. Sve ovo je rezultiralo i činjenicom da hladnjaci sada moraju imati drugačije kopče nego do sada.

Intel je na ovoj ploči koristio 4 memorijska slota, umjesto 6 koliko će biti kod nekih drugih proizvođača. Ovo opravdavaju time kako 4 slota osiguravaju glađe i kraće "rutanje" podataka. Na ploči se nalaze dva PCIe slota koji oba rade u punoj x16 brzini, a ploča podržava AMD-ovi CrossFireX tehnologiju. Ploča ima i jedan PCIe x4, dva PCIe x1 te jedan PCI utor. Tri od šest SATA konektora (Intel Matrix Storage, podrška za RAID 0, 1, 5 10), koji su se smjestili na desnom rubu ploče, u slučaju korištenja dugih grafičkih kartica postaje neupotrebljivo pa to svakako uzimamo kao manu ovom layoutu. Nezgodan je i položaj 8-pinskog konektora, koji je svoje mjesto pronašao iza hladnjaka northbridgea. Na backplateu se nalaze dva eSATA konektora, čak osam USB2.0 konektora (ICH10R ih podržava ukupno 12), zatim jedan Firewire i jedan gigabitni LAN (Intel 82567) RJ45 konektor. Tu je i pet 3.5mm analognih audio priključaka i jedan optički S/PDIF (7.1 HD Audio).

Gigabyte GA-X58-UD5P, hladnjaci, memorija i SSD

Gigabyte GA-X58-UD5P

Prva stvar koju primjećujemo je kako ova ploča koristi nedavno predstavljenu Gigabyteovu Ultra Durable 3 tehnologiju. To znači kako su a izradu korišteni japanski solid state kondenzatori, Lower RDS(on) MOSFET-i, prigušnice sa feritnom jezgrom, unutrašnji bakreni sloj u PCB-u itd. Layout je vrlo dobar, a za pohvalu je činjenica kako su svi SATA konektori postavljeni vodoravno, pa neće biti problema prilikom korištenja dugačkih grafičkih kartica. Memorijskih slotova ima 6 što zanči da se može koristiti do 16GB radne memorije. Za zvuk se brine Realtek-ov AL889a čip, dok je za mrežni dio odgovoran Realtek RTL 81110 čip.

Hlađenje je izvedeno pasivno u kombinaciji aluminijskih hladnjaka i toplovodnih cijevi, te vjerujemo kako je učinkovitije nego na Intelovoj ploči. No, i PWM dio je znatno kompleksniji nego na Intelovoj ploči. Gigabyte koristi 12-faznu regulaciju napona za procesor, koji ima podršku za VRD 11.1 te već standardni DES.

Najzanimljiviji detalji vezani uz ovu ploču su svakako podrška za 3 Way SLI i CrossFireX što korisniku otvara šire mogućnosti nego što je to bio slučaj do sada. Na slici iznad možete vidjeti 3 Way SLI konektor koji Gigabyte bundla uz ovu ploču. Nažalost, ovaj inženjerski primjerak Gigabyteove X58 ploče je stigao prekasno kako bi ju isprobali sa novim procesorima. Vjerujemo kako ćemo uskoro osigurati jedan Bloomfield procesor, pa će te moći više saznati o karakteristikama i prvenstveno performansama ove Gigabyteove ploče. Inače Gigabyte priprema tri modela X58 ploča - GA-X58-EXTREME, GA-X58-UD5P i GA-X58-UD5.

 

Hladnjaci, memorija i SSD

Intelov referentni hladnjak za Nehalema je zadržao istu visinu kao i onaj za Conroea, no narastao je u svim ostalim smjerovima. Ventilator je narastao za 10mm, a zadržana je ista potrošnja elektirčne energije. Masa hladnjaka je 550 grama, a u našim testovoma ćemo provjeriti koliko je efikasan i da li je u stanju adekvatno hladiti nove procesore. Montaža je kao što je to bio slučaj i kod prethodnika, vrlo jednostavna.

Thermalrightov Ultra-120 eXtreme hladnjak je znatno masivniji od Intelovog, koristi čak šest topovodnih cijevi te 120mm ventilator. Jasno je i vrapcima na grani kako će ovakva konstrukcija biti znatno efikasnija od Intelovog BOX hladnjaka. Montaža je jednostavna, a hladnjak pomoću četiri vijka pričvrščujemo za metalnu pločicu sa donje strane ploče.

Intel se odlučio uz ovaj kit poslati tri Quimondine DIMM pločice ukupnog kapaciteta 3GB. Ova DDR3 memorija radi na 1066MHz, sa latencijama 7-7-7-20 pri 1.5V. Tko želi više performanse treba znati kako Quimonda nudi i memoriju brzine 1333MHz (8-8-8 ili 9-9-9) koja također radi na 1.5V. Sve ove kitove je moguće nabaviti u 3 ili 6GB kapacitetima.

SSD se definitivno probija na tržište, a Intel je odlučio poslati vrlo brzi X25-M model koji je napravljen u MLC tehnologiji. Kapacitet mu je 80GB, a teoretske performanse su 250MB/s za čitanje i 70MB/s za pisanje. Koliko je stvarno brz provjerili smo mjerenjem performansi, a rezultate svakako provjerite u nastavku članka.

Test sistem, način testiranja i overclocking

Test sistem:

Test sistem :: Hardware
Platforme

Intel DX58SO "Smackover" Extreme,

BIOS: 2624;

DFI LanParty UT X48-T3RS;

BIOS: GDA02

Procesor(i)

Intel Core i7-965 EE;

Intel Core i7-920;

Intel Core 2 Quad QX9770

Memorija

2x 1 GB AData DDR3 1600 CAS 7-7-7-20 T1;

3x 1GB Quimonda DDR3 1067 CAS 7-7-7-20 T2

Grafičke kartice

AMD ATi Radeon HD4870X2;

Catalyst 8.10 (Far Cry 2 fix)

Muzička kartica

On Board

Hard disk(ovi)

Intel SATA SSD X25-M 80GB MLC;

Hitachi 500GB SATA II

DVD-RW HP GSA-H60L

Testni sistem :: Software
OS Windows Vista Ultimate 32-bit SP1
Chipset datoteke

Intel INF 9.1.0.1007;

DirectX verzija 10.1

PCMark Vantage

v 1.0.0;

3DMark Vantage

v.1.0.1

Lavalys Everest Ultimate

v.4.60.1500

7-Zip v.4.57 (2007-12-06)
Blender v.2.48a
Cinebench R10
Adobe Photoshop CS3
Microsoft Excel 2007
XviD4PSP v.5.036
Super PI v.1.5XS
Call of Duty 4: Modern Warfare v.1.6
Crysis Warhead  
Far Cry 2  
World in Conflict

v.1.009

 

Način testiranja i overclocking

Testiranja je kao i uvijek odrađeno u našem labu, a od dodatne opreme smo koristili mjerač potrošnje električne energije. Napajanje je bilo Thermaltakeovo snage 1.2kW, a monitor je bio Lenovov model LX220. Nastojali smo koristiti programe koji su u stanju iskoristiti više jezgri ili threadova kako bi iskorištenost procesora bila što veća. Operativni sustav je kao i uvijek bila Windows Vista sa instaliranim SP1, a korišteni su najnoviji Intelovi čipset driveri. Za usporedbu sa Bloomfield procesorima smo koristili posljednji Intelov Extreme procesor iz Penryn porodice koji radi na brzini od 3.2GHz - baš kao i Core i7-965 EE. Njega smo smjestili na DFI-evu UT X48-T3RS ploču, a koristili smo AData-inu DDR3 1600MHz memoriju. Sve igre su bile zakrpane najnovijim zakrpama, a testirali smo ih na dvije rezolucije. Na nižoj, gdje bi procesor mogao postati usko grlo i na višoj gdje se zahtjevaju odlične ukupne performanse sistema. Mjerili smo i potrošnju čitavog sustava, te zagrijavanje procesora na oba isporučena hladnjaka. Napominjemo kako smo kod provođenja svih testova isključili Turbo Mod te su procesori radili na svojim referentnim taktovima. Ono što smo ostavili za neki drugi test (prvenstveno zbog nedostatka vremena) je dobitak u performansama korištenjem Hyper-Threadinga.

Programi kao što je Cinebench R10 koriste svih osam threadova pa to onda u Windows Task Manageru izgleda ovako.

Overclocking se u slučaju 920 modela vrši na klasičan način - podizanjem baznog takta, pri čemu se mora voditi briga i o brzini memorije te njenom naponu. Nakon dosta istraživanja, korištenja raznih opcija i podizanja napona procesoru, northbridgeu i QPI-u stabilna maksimala koju smo uspjeli postići je vrlo dobrih 182MHz za bazni takt, što je rezultiralo brzinom QPI-a od 3296.8MHz te procesora 3662.9MHz. Memorijski djelitelj je u ovom slučaju bio snižen na jedinu nižu vrijednost, tj. 800MHz, a overclock je rezultirao brzinom memorije od 1099MHz pri naponu od 1.56V. Sve u svemu najsporiji Bloomfield procesor smo uspjeli stabilno natjerati na takt viši za 37% od referentnog što uopće nije loše :)

U slučaju otključanog Extreme modela čitava priča sa overclockingom je puno jednostavnija, no zahtjeva i ponešto drugačiji pristup. U BIOS-u je najprije potrebno podesiti parametre koji se nalaze u Intel Turbo Boost izborniku. prije svega je potrebno podići vrijednost limita TDC-a sa 110A na 300A te TDP-a sa 130W na 300W kako PCU ne bi automatski snizio frekvencije kada vrijednosti dođu tvornički postavljenih granica. Zatim je potrebno uključiti "override" limita struje naponskog regulatora te podići množitelje svakoj pojedinoj jezgri na željenu vrijednost. Premda Intel tvrdi kako ovaj procesor bez problema postiže vrijednosti iznad 4GHz, nama nije uspjelo postići stabilan rad ni na okruglih 4GHz, odnosno množiteljima postavljenim na 30. Kako nismo htjeli pretjerivati sa naponom, zadovoljili smo se sa konačnih i vrlo stabilnih 3.92GHz. Naravno da ćemo limite ovog procesora isprobati i na nekoj drugoj ploči čim nam se za to ukaže prilika - vjerujemo kako je u ovoj priči krivac lošijeg rezultata upravo bila DX58SO ploča.

Testovi - 1. dio

3DMark Vantage

CPU
Core i7-965 Extreme Edition
20294
  
Core i7-940
18884
  
Core i7-920
17212
  
Core 2 Quad Extreme QX9770
13338
  
 
055001100016500220
00
 

Već u prvom provedenom testu, doduše sintetičkom, novi Core i7 procesori pokazuju zube i postižu znatno više vrijednosti od najjačeg procesora iz prijašnje generacije. Jedva čekamo "prave" testove da vidimo koliko su zaista brzi.

PCMark Vantage

Suite
Core i7-965 Extreme Edition
6505
  
Core i7-940
6208
  
Core 2 Quad Extreme QX9770
5549
  
Core i7-920
5524
  
 
0350070
00
 

Najslabiji Core i7 procesor je u ovom slučaju ostvario vrlo sličan rezultat kao i QX9770 procesor, dok preostala dva modela iz nove serije bježe naprijed. Napomenuti ćemo kako je ovaj test vršen sa klasičnim tvrdim diskom, te kako se vrijednosti penju debelo iznad 10000 u slučaju korišenja Intelovog SSD-a.

Blender

Time (sec)
Core i7-965 Extreme Edition
55,82
  
Core i7-940
61,01
  
Core i7-920
66,1
  
Core 2 Quad Extreme QX9770
67,64
  
 
0357
0
 

Prvi "pravi" test dokazuje kako su novi procesori vrlo brzi. Blender je besplatni programčić nizozemskih autora kojeg možemo koristiti za modeliranje i renderiranje 3D animacija i grafike. U ovom slučaju riječ je o Character Model Renderingu, tj. 6.9MB "teškom" workloadu renderinga leteće vjeverice.

Cinebench R10

Rendering x CPU (CB-CPU)
Core i7-965 Extreme Edition
15716
  
Core i7-940
14716
  
Core i7-920
13122
  
Core 2 Quad Extreme QX9770
12603
  
 
04000800012000160
00
 

Dobro nam poznati Cinebench koji je baziran je na Cinema 4D softveru, također koristi svih 8 threadova pa nije ni čudo kako su rezultati Core i7 procesora znatno viši.

Photoshop CS3

Time (sec)
Core i7-965 Extreme Edition
79,6
  
Core i7-940
85,8
  
Core 2 Quad Extreme QX9770
90,1
  
Core i7-920
93,6
  
 
02040608010
0
 

Photoshop CS3 također voli nove procesore, no ovdje najslabiji 920 ipak malo kaska za QX9770 modelom. Čini se kako CS3 ipak voli malo viši takt od broja threadova.

Excel 2007 Monte Carlo

Time (sec)
Core i7-965 Extreme Edition
13,76
  
Core i7-940
14,72
  
Core i7-920
16,3
  
Core 2 Quad Extreme QX9770
16,96
  
 
0 91
8
 

Već je ranije dokazano kako Excel 2007 zna raditi sa višejezgrenim procesorima te stoga ovakvi rezultati ne čude. Ovaj workload izvršava Europsku Put and Call procjenu opcija (ugovori o kupovini ili prodaji dionica po određenoj vrijednosti) za Black-Scholes cjenik opcija koristeći Monte Carlo simulaciju. Workload simulira izračune obnovljene proračunske tablice sa ulaznim parametrima i rekalkulira procjenu opcija. U ovom slučaju izvršavamo oko 300,000 iteracija Monte Carlo simulacije. Dodatno, workload koristi Excelove funkcije pretraživanja kako bi usporedio cijenu iz modela sa prijašnjim cjenama u 50000 redaka za razumijevanje konvergencije.

Xvid4PSP

Time (sec)
Core i7-965 Extreme Edition
187
  
Core i7-940
203
  
Core i7-920
222
  
Core 2 Quad Extreme QX9770
229
  
 
06012018024
0
 

XviD4PSP je besplatan alat kojim smo transkodirali jedan video velikog formata u manji (koristeći h.264), pogodan za reprodukciju na iPOD Touch uređaju. Ovaj program ne koristi svih osam threadova, no svejedno novi procesori posao odrađuju znatno brže.

7-Zip

Score (MIPS)
Core i7-965 Extreme Edition
16874
  
Core i7-940
15689
  
Core i7-920
14341
  
Core 2 Quad Extreme QX9770
11266
  
 
08500170
00
 

Svi znamo za što koristimo ovaj alat, i također je poznato kao on voli višejezgrene procesore. Za našim Core i7 procesorima je jednostavno poludio, a prikazani rezultati su dokaz toga.

Everest MEM

Read (MB/s)
Core i7-965 Extreme Edition
14913
  
Core i7-920
13046
  
 
0500010000150
00
 
Write (MB/s)
Core i7-965 Extreme Edition
15400
  
Core i7-920
12355
  
 
04000800012000160
00
 
Copy (MB/s)
Core i7-965 Extreme Edition
15908
  
Core i7-920
12117
  
 
04000800012000160
00
 
Latency (ms)
Core i7-965 Extreme Edition
37,9
  
Core i7-920
42,3
  
 
0 5101520253035404
5
 

S obzirom da je riječ o trokanalnom memorijskom setupu, visoki memorijski bandwidth je bio i očekivan. Ove već visoke brojke, dodatno će porasti kako se na tržištu budu pojavljivali brži memorijski kitovi koji će biti u stanju raditi na 1.5 - 1.6V.

Everest HDD

Average read (MB/s)
Intel SSD 80GB
227,76
  
Hitachi Deskstar 500GB SATAII
60,8
  
 
011523
0
 
Average write (MB/s)
Intel SSD 80GB
66
  
Hitachi Deskstar 500GB SATAII
58,7
  
 
0357
0
 
Access time (ms)
Intel SSD 80GB
0,66
  
Hitachi Deskstar 500GB SATAII
14,5
  
 
0 5101
5
 
 

Znatno veća brzina SSD-a u odnosu na klasični tvrdi disk je bila očekivana i potkrijepljena činjenicom kako je riječ o vrlo brzom MLC disku. Izmjerene vrijednosti su vrlo blizu onima koje Intel reklamira i sa ovim diskom se stvarno osjeća ubrzanje u svakodnevnom radu. Budućnost je definitivno tu.

Testovi - 2. dio i overclocking performanse

Call of Duty 4

1280x1024 (FPS)
Core i7-965 Extreme Edition
200,1
  
Core i7-940
187
  
Core 2 Quad Extreme QX9770
181,8
  
Core i7-920
172,6
  
 
010120
2
 
1920x1200 (FPS)
Core 2 Quad Extreme QX9770
121,1
  
Core i7-965 Extreme Edition
119,9
  
Core i7-940
118,1
  
Core i7-920
116
  
 
06112
2
 

Za drugi dio testova ostavili smo neke starije i neke novije naslove računalnih igara. Prva na redu je dobra stara COD4 igra, koja na nižoj rezoluciji pokazuje svu snagu Core i7 procesora, dok na višoj svi zaostaju za procesorom starije generacije.

Crysis Warhead

1280x1024 (FPS)
Core i7-965 Extreme Edition
39
  
Core i7-940
38
  
Core 2 Quad Extreme QX9770
35
  
Core i7-920
34
  
 
01020304
0
 
1920x1200 (FPS)
Core 2 Quad Extreme QX9770
34
  
Core i7-965 Extreme Edition
34
  
Core i7-940
34
  
Core i7-920
30
  
 
0 510152025303
5
 

Kao što se i u prethodnoj igri pokazalo, novi procesori imaju veće sirove performanse od starijeg modela. Na višoj rezoluciji čitav sistem postaje "usko grlo" te je vidljivo kako 920 modelu nedostaje koji megahertz više.

Far Cry 2

1280x1024 (FPS)
Core i7-965 Extreme Edition
77,4
  
Core i7-940
73,7
  
Core 2 Quad Extreme QX9770
71,5
  
Core i7-920
66,1
  
 
02040608
0
 
1920x1200 (FPS)
Core i7-965 Extreme Edition
71,3
  
Core 2 Quad Extreme QX9770
70,3
  
Core i7-940
68,7
  
Core i7-920
63,1
  
 
02040608
0
 

Far Cry 2 benchmark samo potvrđuje već prije viđeni scenarij. Na višim rezolucijama, 940 i 920 procesorima nedostaju megahertzi, jer igre i dalje ne koriste više od jedne ili dvije jezgre/threada.

World in Conflict

1280x1024 (FPS)
Core i7-965 Extreme Edition
64
  
Core i7-940
63
  
Core 2 Quad Extreme QX9770
62
  
Core i7-920
58
  
 
01020304050607
0
 
1920x1200 (FPS)
Core i7-965 Extreme Edition
58
  
Core i7-940
58
  
Core 2 Quad Extreme QX9770
55
  
Core i7-920
53
  
 
010203040506
0
 

Ovo je jedina testirana igra koja i na višoj rezoluciji prednost daje sporijem procesoru. No, WIC je s druge strane oduvijek bila čudna igra i benchmark.

Zagrijavanje

Core i7 965 Idle (°C)
Thermalright Ultra 120 eXtreme
32
  
BOX cooler
38
  
 
01020304
0
 
Core i7 956 Load (°C)
Thermalright Ultra 120 eXtreme
60
  
BOX cooler
78
  
 
02040608
0
 

Kao što smo i prije napomenuli, isprobali smo oba priložena hladnjaka i došli do zaključka (kao i nebrojeno puta do sada) da je Intelov hladnjak bolje ostaviti u kutiji.

Potrošnja

Idle (W)
Core i7-920
190
  
Core i7-965 Extreme Edition
207
  
Core 2 Quad Extreme QX9770
215
  
 
05511016522
0
 
Load (W)
Core i7-920
280
  
Core i7-965 Extreme Edition
303
  
Core 2 Quad Extreme QX9770
314
  
 
08016024032
0
 
 

Pozitivno je vidjeti kako je nova generacija osim pomaka u performansama i mogućnostima donijela i sniženje potrošnje električne energije. U svakom slučaju dobro došla promjena.

 

Overclocking performanse

3DMark Vantage

CPU
Core i7-965 EE @ 3.92GHz
23637
  
Core i7-965 EE @ 3.20GHz
20294
  
 
060001200018000240
00
 

Overclocking performanse smo ovaj puta odlučili provesti u svega par testova, te ih izbaciti van iz ostalih grafova jer vjerujemo kako postignutih 3.92GHz za 965 model nije nije njegova maksimala. Ipak, razlike u prvom testu su osjetne.

PCMark Vantage

Suite
Core i7-965 EE @ 3.92GHz
10334
  
Core i7-965 EE @ 3.20GHz
9859
  
 
05200104
00
 

Ovi Vantage rezultati su postignuti sa SSD diskom, te su stoga znatno viši od onih prikazanih ranije. Ovdje overclocking nije donio značajnu razliku u konačnom rezultatu.

Super PI

Time (s)
Core i7-965 EE @ 3.92GHz
10,641
  
Core i7-965 EE @ 3.20GHz
12,987
  
 
06,51
3
 

SuperPI smo koristili iz razloga jer smo primjetili vrlo dobre rezultate procesora u "sub" 4GHz području. Ubrzanje kod overclockinga je ovdje vrlo primjetno.

7-Zip

Score (MIPS)
Core i7-965 EE @ 3.92GHz
19297
  
Core i7-965 EE @ 3.20GHz
16875
  
 
050001000015000200
00
 

7-Zip performanse vrlo dobro skaliraju sa povećanjem frekvencije i pitanje je vremena kada ćemo vidjeti brojke iznad 20000 MIPS-a.

Cinebench R10

Rendering x CPU (CB-CPU)
Core i7-965 EE @ 3.92GHz
18457
  
Core i7-965 EE @ 3.20GHz
15716
  
 
050001000015000200
00
 
 

I Cinebench je također još jedna od aplikacija čije performanse vrlo dobro skaliraju povećanjem takta procesora.

Zaključak - Conclusion

Zaključak

Kao što smo vidjeli iz današnjeg članka Nehalem arhitektura donosi mnogo novosti i logičan je korak naprijed u odnosu na Conroe arhitekturu. U njenom razvoju se značajno mislilo na serversku primjenu i povećanje preformansi na tom polju, a to je donijelo napredak i u svakodnevnim "desktop" performansama. Svakako najbitnije novosti su integrirani trokanalni DDR3 memorijski kontroler, poboljšani power management koji je kao što smo vidjeli rezultirao manjom portošnom energije, povratak Hyper-Threadinga te uvođenje Turbo Boost tehnologije. Još uvijek je na tržištu premalo aplikacija koje mogu iskoristiti sve prednosti ovih tehnologija, no taj broj se svakako povećava, a i sam Intel preko svog Software Solutions Group odjela na to značajno utječe. Ukupne performanse Core i7 procesora su jako dobre, što je vidljivo i iz direktne usporedbe sa modelom kojeg nasljeđuju, a i overclocking potencijal je jako dobar. Iz svega viđenog jedino možemo zaključiti kako svakako zaslužuju našu preporuku. Tržišno predstavljanje ovih procesora će se desiti kasnije tijekom ovog mjeseca a cijene za tisuću komada će se kretati od 284USD za Core i7-920, preko 562USD za Core i7-940 pa do visokih 999USD za Core i7-965 Extreme Edition procesor. Maloprodajne cijene još nisu poznate, no na našem tržištu ne treba očekivati cijenu znatno nižu od 1000 € za 965 model.

Sljedeći korak je svakako snižavanje proizvodnog procesa i uvođenje octo-core procesora. No, tada će to nadamo se biti potkrijepljeno i sa većom količinom odgovarajućeg softvera koji će znati iskoristiti svu tu silnu moć. Sa konkurentske strane se također vrlo skoro očekuje predstavljanje nove serverske Shangai arhitekture iz kojih će proizaći i novi desktop procesori kodnog imena Deneb. Što nam je to AMD pripremio trebali bi svi skupa ubrzo saznati.

 

Conclusion

As we have seen from today`s article, Nehalem microarchitecture is a rather big and a very logical step forward from Conroe microarchitecture. It was designed to increase performance on the server side, and that brought a nice bump in desktop performance also. Biggest news is definitely integrated memory controller, improved power management system (which resulted in lower overall power consumption), resurrection of Hyper-Threading and Turbo Boost technology. There are still too few applications that can utilize all that power and technologies but that number is definitely growing. And Intel`s Software Solutions Group is helping with that also. Overall Core i7 performance is very good, which can be seen from direct comparison with its older Penryn brother. Overclocking potential is also very good, and we can only recommend Core i7 CPUs. Official Core i7 launch will be later in November, with 1kU pricing as follows: Core i7-965 Extreme Edition processor will cost $ 999, Core i7-940 processor $ 562, and Core i7-920 processor $ 284.

Next step is 32nm manufacturing process and octo-core CPUs. When they come to market, we hope there will be more applications which can utilize all that power. As for the competition, AMD is preparing its Shangai server platform from which Deneb desktop CPUs should derive. We should find soon enough what’s cooking in their kitchen.