Intel Core i7 – arhitektura i performanse
Datum objave 03.11.2008 - Krešimir Matanović
Uvod i Nehalem arhitektura
Nehalem mikroarhitektura
Intel svoj model razvoja procesorske mikroarhitekture naziva "Tick-Tock", u kojem se izmjenjuje predstavljanje nove mikroarhitekture sa novim proizvodnim procesom. Prva Tock faza tj. nova mikroarhitektura su bili Conroe (Merom) procesori napravljeni u 65nm procesu, nakon kojih je uslijedila Tick faza tj. Penryn procesori napravljeni u 45nm procesu. Danas je red na novoj Tock fazi, tj. novoj mikroarhitekturi proizvedenoj na postojećem 45nm procesu. Sljedeći Tick će biti smanjivanje tog proizvodnog procesa u 32nm iz čega će proizaći novi Westmere procesori, a potpuno nova mikroarhitektura, tj. novi Tock će biti Sandy Bridge na 32nm. Danas ćemo se ipak zadržati na Nehalemu.
Ronak Singhal, glavni arhitekt Nehalem mikroarhitekture, otvorio je Munchenski workshop predstavljanjem arhitekturalnih novosti i novog power managementa Nehalema. Saznali smo kako će prvi procesori kodnog imena Bloomfield bazirani na Nehalem arhitekturi nositi marketinško ime Core i7, te kako će ih za početak biti tri. Svi će imati četiri jezgre i podržavati HyperThreading, što je bila jedna od značajki Pentium 4 procesora i njegove NetBurst arhitekture. Bloomfieldi su napravljeni u Intelovom 45nm proizvodnom procesu, imaju 731 milijun tranzistora, 8M trećestupanjske priručne memorije, podržavaju SSE4.2 instrukcije i možda najbitnije od svega imaju integrirani DDR3 memorijski kontroler (kao AMD-ovi procesori). O svemu tome detaljnije pročitajte u daljenjem tekstu, a u opisu ćemo krenuti od početka.
U dizajniranju nove arhitekture, vodili su se mišlju kako bi novi procesori trebali biti brzi kako u single-threaded tako i u multi-threaded aplikacijama, a kada se od njih ne zahtijeva snaga i brzina morali su biti štedljivi. Kao baza je naravno korištena poznata Core arhitektura, koja je kako znamo donijela radikalne promjene u odnosu na NetBurst. Na slici iznad vidimo kako izgleda i kako je podijeljen jedan Quad-Core Nehalem. Intel ga dijeli na "un-core" i "core" dio. Pod "un-core" spada L3 priručna memorija, I/O dijelovi, memorijski kontroler i dva QPI-a (Quick Path Interconnect). U slučaju Bloomfielda QPI je samo jedan, dok serverski čipovi imaju dva.
Trećina jedne jezgre otpada na L1 i L2 priručne memorije, trećina pripada izvršnom "out of order" dijelu, a preostalu trećinu zauzima dekoder, logika za predviđanje grananja, rukovanje memorijom i "paging". U odnosu na Core arhitekturu, Nehalemov front-end donosi poboljšanja u Macrofusionu, Loop Stream Detectoru (28 Micro-Opsa u odnosu na 18 kod Core-a, te uklanjanje dekodera) i u logici za predviđanje grananja (uvedeni L2 Branch Predictor i Advanced Renamed Return Stack Buffer (RSB)). Izvršni dio jezgre koji izvodi upravljanje i izvršavanje opercija je i dalje sposoban izvršiti 4 instrukcije po taktu, ima 128-bita široki SSE te Super Shuffle. Nehalem donosi povećani paralelizam ("out of order" struktura veća za 33% u odnosu na Conroe), poboljšani memorijski podsistem (nova TLB hijerarhija), brzi 16-bajtni "unaligned" pristup priručnoj memoriji te brža sinkronizacija primitiva (LOCK prefix, XCHG) što rezultira većom skalabilnošću.
Intelova Hyper-Threading tehnologija, poznata i kao SMT (Simultaneous Multi-Threading) se vratila, a oni se pak ponovno hvale svi njenim predostima. HT je sada učinkovitiji jer iskorištava izvršni mehanizam širine 4 instrukcije po taktu, kojeg konstantno puni sa višestrukim threadovima (dretvama), te skriva latenciju jedne dretve. Najviše ističu kako je HT najbolja funkcija po pitanju efikasnisti, jer ne zauzima puno mjesta na jezgri (minimalno povećanje logike), a znatno poboljšava performanse (u ovisnosti o aplikaciji). SMT na Nehalemu profitira dodatno zbog veće priručne memorije i povećane memorijske propusnosti čitave arhitekture.
Ustroj priručne memorije je doživio znatne promjene, a vrlo je sličan Phenomovom. Trostupanjski ustroj donosi 64KB L1 memorije (32KB instrukcijske + 32KB podatkovne), koja je usporena je u odnosu na arhitekturu Penryn procesora (4 ciklusa vs. 3 ciklusa). L2 memorije je sada "samo" 256KB po jezgri. Unificirana (instrukcijska i pdatkovna), 8-smjerna, te služi kao međuspremnik L3 memoriji (brzina je 10 ciklusa). Treći stupanj priručne memorije je i najzanimljiviji te ćemo se na njemu malo duže zadržati. Ukupno se 8MB L3 memorije se nalazi na "un-core" dijelu procesora i ona je dijeljena između svih jezgri. U slučaju prva tri Bloomfielda količina memorije je 8MB, a do povećanja će doći kada se poveća i broj jezgri. L3 memorija je uključiva, što znači da su i podaci iz L1 i L2 memorija u njoj (ukoliko podaci nisu u L3, CPU zna da nisu ni u L1, ni u L2 ni u jezgrama). Smisao iza ovoga je smanjivanje "core snoop" prometa što povećava performanse i smanjuje potrošnju energije. Ovaj "on-die snoop filter" će jako dobro doći prilikom povećanja broja jezgri.
Sljedeće velike novosti su odmak od klasične arhitekture FSB-a na novu QPI (QuickPath Interconnect) i integracija memorijskog kontrolera "on-die". Integrirani memorijski kontroler podržava DDR3 memoriju, do tri kanala po socketu, RDIMM i UDIMM te RAS značajke. To znači kako će te za potpuno iskorištenje velikog memorijskog bandwidtha Nehalema morati koristiti tri DDR3 memorijske pločice niskih latencija, a proizvođači su kao što već znamo počeli sa isporukom "triple-channel" kitova. Nehalem inicijalno podržava 1066MHz DDR3 memoriju, no putem overclockinga je moguće dobiti i više brzine. Ipak, postizanje viših brzina može ograničiti maksimalni napon od 1.6V koji smijemo "dati" memoriji. Znamo da današnji DDR3 kitovi za veće brzine zahtijevaju nerijetko i 2.0V, a s obzirom da je memorijski kontroler sada u procesoru nije preporučljivo podizati napon ovako visoko. Ubuduće će na tržište doći i procesori koji će imati samo dva aktivna memorijska kontrolera. Tu dolazimo i do činjenice kako će programeri sada morati brinuti i kako Intelovi sistemi sada imaju i Non-Uniform Memory Access (NUMA), što postaje bitno kod multi-socket setupa.
QPI zamjenjuje dosadašnji FSB, a vrlo je sličan Hyper Transport-u, te će serverski Nehalemi znatno profitirati zbog činjenice da je dosta softvera već prilagođeno AMD-ovoj serverskoj arhitekturi i HT-u. High-end Nehalemi će imati dva bi-direkcionalna QPI linka koji će u jednom smjeru raditi na brzini od 6.4GT/s, što znači da će ukupni bandwidth biti 25.6GT/s. Mainstream Nehalemi će imati samo jedan bi-direkcionalni QPI link.
Intel je sa novom arhitekturom poboljšao i virtualizacijske sposobnosti što će se posebno odraziti na serverske platforme. Sa Penrynom je Intel SSE4 instrukcijski set proširio na SSE4.1, a sada su sa Nehalemom dodali još instrukcija i nazvali ga SSE4.2 (znamo da naziv SSE5 koristi AMD).
Jednako zanimljiva novost je i integracija PCU (Power Control Unit) kontrolera i uklanjanje domino logike koja je korištena do sada. Na PCU je potrošeno oko 1 milijun tranzistora (toliko je imao Intel 486 procesor). PCU ima svoj firmware koji se u realnom vremenu brine o temperaturama, struji, snazi i zahtjevima operativnog sistema. Kao što je vidljivo sa slike, svakoj jezgri je dodijeljen jedan PLL, te stoga svaka može raditi na neovisnom taktu (kao i kod Phenoma) i naponu. Nehalemove jezgre mogu individualno biti kompletno ili skoro ugašene kada su u dubokim sleep stanjima, dok sa trenutnim procesorima to nije moguće. Drugim riječima, Nehalemova integrirana strujna vrata dozvoljavaju jednoj ili više jezgri da u operativnom stanju rade na nominalnoj voltaži, dok je preostalim neaktivnim jezgrama u potpunosti moguće prekinuti dovod struje. Duboko C6 stanje je dakle sada omogućeno za svaku jezgru, a kao dodatak tome, i "un-core" logiku je moguće poslati u C6, te time još više sniziti potrošnju. Izlazak iz ovako dubokih stanja traje dugo, i tu PCU stupa na scenu tako što prati situaciju i po potrebi ne dozvoljava odlazak u duboka C6 stanja. PCU dakle prati i zahtjeve OS-a, te može donijeti inteligentne odluke u koje stanje poslati jezgre, bez obzira što mu OS govori. Još jedna prednost ovakvog on-die power managementa je da se promjene napona ostvaruju puno brže, što dovodi do efikasnijeg iskorištavanja energije.
Posljednja novost vezana uz Nehalem mikroarhitekturu je Turbo Mode. Premda je to predstavljeno još sa mobilnim Penryn procesorima, na Nehalemima je sve naravno unaprijeđeno. Turbo Mode je sastavni dio Intelove Speed Step tehnologije i operativni sistem ju tretira kao još jedno P-stanje. Ukoliko se pokaže potreba za višim performansama Turbo Mode se uključuje i povišava frekvenciju jednoj ili dvjema jezgrama iznad nominalnih vrijednosti (mijenja množitelj), dok ostale dvije zadržavaju istu radnu frekvenciju ili mogu postati neaktivne. Ovo naravno ovisi o aplikaciji i koliko threadova koristi, no sve mora ostati unutar TDP-a. Ukoliko on naraste iznad 130W jezgrama se automatski snižava frekvencija. Kako to funkcionira u praksi pokazati ćemo Vam kasnije u tekstu. Sada krenimo na opis Bloomfield procesora koji su nam pristigli na test.
Core i7 i DX58SO "Smackover"
Od tri procesora koje će Intel službeno predstaviti kasnije u ovom mjesecu na test su nam stigla dva - Core i7-965 Extreme Edition i njegov sporiji i zaključani brat 920. S obzirom da Core i7 Extreme 965 ima otključan množitelj može odglumiti i srednji procesor iz ponude - model 940, te će te stoga u rezultatima testova vidjeti i ovaj procesor. Ovi procesori, bazirani na Nehalem arhitekturi, kao što smo rekli nose kodno ime Bloomfield, a tržišno Core i7. Sve tehnološke novitete smo nabrojali, a ponoviti ćemo kako se proizvode u Inteovom 45nm Hi-k Metal Gate proizvodnom procesu, kako imaju 731 milijun tranzistora i kako "sjede" na novom LGA socketu koji ima 1366 pinova. Razumljivo, više pinova zauzima i više mjesta pa su Core i7 procesori znatno veći nego njihovi prethodnici. Pakiranje procesora je dimenzija 60x82 mm (LGA775 je 58x61 mm), a pin pitch je 0.4mm (LGA je 0.43x0.46 mm). Procesori podržavaju Hyper-Threading tehnologiju, što znači da donose performanse 8 dretvi na 4 jezgre, donose Turbo Boost i 8MB L3 Smart Cache tehnologiju. Imaju integrirani memorijski kontroler sa podrškoma za DDR3 memoriju brzine 1067MHz, QPI tehnologiju za vezu sa X58 čipsetom itd. Potrebno je napomenuti kako svi imaju TDP od 130W.
Core i7-965 Extreme Edition je najbrži i najskuplji procesor iz ponude, a radi na brzini od 3.2GHz. Osnovno obilježje mu je što ima otključan množitelj te se lakše overclockira od procesora kojima je množitelj zaključan. Potrebno je napomenuti kako procesor od takt generatora dobiva baznih 133MHz. Tih 133MHz pomnoženih sa množiteljem 24 daje takt od 3.2GHz. U TurboModu prvoj jezgri se množitelj može automatski podići do 26, a ostalima na 25. Brzina QPI linka na najbržem procesoru je maksimalna tj. 6.4GT/s (3200MHz). Kada je ovaj procesor na ploči u BIOS-u se pojavljuju dodatne opcije za promjenu množitelja, podizanje TDP-a, TDC-a ili pak omogućavanje zaobilaženja limita struje regulatora snage CPU-a. O ovim postavkama ćemo više reći kada na red dođe overclocking.
Core i7-920 ima množitelj zaključan na brojci 20, te mu je stoga radna frekvencija 2.67Ghz. Kod ovog procesora sporiji je i QPI link koji radi na 4.8GT/s (2400MHz). Tvrdnja da ovaj procesor ima zaključan množitelj i nije u potpunosti istinita. U TurboModu, prvoj jezgri ovog procesora automatski se množitelj podiže na 22, dok preostalima tri ide na 21. Ove funkcije su potpuno automatske i nama nedostupne u BIOS-u za razliku od EE procesora. Kako smo spomenuli ranije, za potrebe testiranja smo EE model pretvorili u 940 model, koji po defaultu množitelj ima zaključan na 22 i radi na taktu od 2.93GHz.
Na gornjoj slici vidimo kako funkcionira Turbo Mod kada je u pitanju 965 EE procesor. Vidimo kako je množitelj skočio na 26, pri čemu je takt porastao na 3.46GHz. No to vrijedi samo za prvu jezgru, dok se ostalima množitelj podiže samo za 1. Ovo se naravno događa samo ukoliko procesor ne prelazi svoj TDP-od 130W
Intel DX58SO "Smackover"
Sa novim procesorima i njihovim novim pakiranjima iz Intela stiže i novi čipset te novi socket. IOH nosi ime X58 te se značajno razlikuje od svojeg prethodnika X48. Naravno najbitnija novost je preseljenje memorijskog kontrolera na CPU. X58 (northbridge) se tako brine o 36 PCIe linija koje mogu biti konfigurirana kao 1x16, 2x16 ili pak 4x8 (uz ostale kombinacije), a sa procesorom je povezan preko 25.6GB/s QPI linka. ICH (southbrige) je dobro poznati ICH10R koji ima 676 pinova i dolazi u PBGA pakiranju. On se brine o SATA, USB, LAN i ostalim sistemskim sučeljima, a sa IOH-om je spojen preko 2GB/s DMI linka. Na sve njih je vezan generator takta 133MHz.
Nama je ploča kodnog imena "Smackover" stigla u bulk verziji, odnosno bez ikakvog bundlea (osim drivera i Back Panel limića), a kada dođe u prodaju pakiranje bi trebalo izgledati kao na gornjoj slici. Intel je za kutiju odabrao crnu boju koja karakterizira proizvode iz njihove Extreme serije.
DX58SO ploča je napravljena na crnom 8-slojnom PCB-u u ATX formatu. U potpunosti je "Legacy Free", što znači da nema PS/2, serijskih ili pak paralelnih portova, baš kao i nedavno testirana Intelova DG45ID ploča. Podržava dual PCIe x16 konfiguracije te diskretni TPM v1.2. Za raspodjeljivanje 133MHz takta procesoru, ICH-u i IOH-u brine se takt generator CK505 firme Silego Semiconductors. Vidimo kako se layout razlikuje znatno od dosadašnjih ploča baziranih na Intelovim čipsetima. Procesor i regulacija njegovog napajanja pomaknuta je u sredinu ploče, dok su memorijski utori prebačeni na sami vrh. Intel ovakvo postavljanje memorijskih slotova opravdava objašnjenjem kako je ta pozicija bolja za hlađenje, a ujedno je i centrirana te približena procesoru što ima utjecaja na frekvanciju i latencije. Northbridge ja pak pomaknut u desno prema samom rubu ploče. Hlađenje je u potpunosti pasivno te je izvedeno bez upotrebe toplovodnih cijevi. Plavo obojani aluminijski blokovi se nalaze na PWM regulatorima, northbridgeu i southbridgeu. Primjećujemo i kako su kondenzatori oko vitalnih dijelova (regulacija napona procesora, memorije i NB-a) Solid State, dok su za manje vitalne dijelove ploče korišteni standardni elektrolitski.
Na prvoj gornjoj slici možemo vidjeti kako izgleda IOH, odnosno X58 Express čip. Napajanje je 6-fazno, razvučenije je provedeno kroz više slojeva PCB-a nego do sada. Mehanizam za pričvršćivanje procesora na pinove je kao što vidimo sa slike znatno drugačiji od onoga na LGA775. Zbog većeg procesora, većih hladnjaka i mehanizam mora biti robustan, te ga je stoga bilo potrebno i dodatno učvrstiti. Na poleđini ploče se nalazi metalna pločica debljine 2.5mm koja je vijcima vezana za mehanizam. Novi mehanizam zahtjeva i minimalnu debljinu PCB-a koja mora biti između 1.57mm i 2.54mm. Sve ovo je rezultiralo i činjenicom da hladnjaci sada moraju imati drugačije kopče nego do sada.
Intel je na ovoj ploči koristio 4 memorijska slota, umjesto 6 koliko će biti kod nekih drugih proizvođača. Ovo opravdavaju time kako 4 slota osiguravaju glađe i kraće "rutanje" podataka. Na ploči se nalaze dva PCIe slota koji oba rade u punoj x16 brzini, a ploča podržava AMD-ovi CrossFireX tehnologiju. Ploča ima i jedan PCIe x4, dva PCIe x1 te jedan PCI utor. Tri od šest SATA konektora (Intel Matrix Storage, podrška za RAID 0, 1, 5 10), koji su se smjestili na desnom rubu ploče, u slučaju korištenja dugih grafičkih kartica postaje neupotrebljivo pa to svakako uzimamo kao manu ovom layoutu. Nezgodan je i položaj 8-pinskog konektora, koji je svoje mjesto pronašao iza hladnjaka northbridgea. Na backplateu se nalaze dva eSATA konektora, čak osam USB2.0 konektora (ICH10R ih podržava ukupno 12), zatim jedan Firewire i jedan gigabitni LAN (Intel 82567) RJ45 konektor. Tu je i pet 3.5mm analognih audio priključaka i jedan optički S/PDIF (7.1 HD Audio).
Gigabyte GA-X58-UD5P, hladnjaci, memorija i SSD
Prva stvar koju primjećujemo je kako ova ploča koristi nedavno predstavljenu Gigabyteovu Ultra Durable 3 tehnologiju. To znači kako su a izradu korišteni japanski solid state kondenzatori, Lower RDS(on) MOSFET-i, prigušnice sa feritnom jezgrom, unutrašnji bakreni sloj u PCB-u itd. Layout je vrlo dobar, a za pohvalu je činjenica kako su svi SATA konektori postavljeni vodoravno, pa neće biti problema prilikom korištenja dugačkih grafičkih kartica. Memorijskih slotova ima 6 što zanči da se može koristiti do 16GB radne memorije. Za zvuk se brine Realtek-ov AL889a čip, dok je za mrežni dio odgovoran Realtek RTL 81110 čip.
Hlađenje je izvedeno pasivno u kombinaciji aluminijskih hladnjaka
i toplovodnih cijevi, te vjerujemo kako je učinkovitije nego na Intelovoj ploči.
No, i PWM dio je znatno kompleksniji nego na Intelovoj ploči. Gigabyte koristi
12-faznu regulaciju napona za procesor, koji ima podršku za VRD 11.1 te već
standardni DES.
Najzanimljiviji detalji vezani uz ovu ploču su svakako podrška za 3 Way SLI i CrossFireX što korisniku otvara šire mogućnosti nego što je to bio slučaj do sada. Na slici iznad možete vidjeti 3 Way SLI konektor koji Gigabyte bundla uz ovu ploču. Nažalost, ovaj inženjerski primjerak Gigabyteove X58 ploče je stigao prekasno kako bi ju isprobali sa novim procesorima. Vjerujemo kako ćemo uskoro osigurati jedan Bloomfield procesor, pa će te moći više saznati o karakteristikama i prvenstveno performansama ove Gigabyteove ploče. Inače Gigabyte priprema tri modela X58 ploča - GA-X58-EXTREME, GA-X58-UD5P i GA-X58-UD5.
Hladnjaci, memorija i SSD
Intelov referentni hladnjak za Nehalema je zadržao istu visinu kao i onaj za Conroea, no narastao je u svim ostalim smjerovima. Ventilator je narastao za 10mm, a zadržana je ista potrošnja elektirčne energije. Masa hladnjaka je 550 grama, a u našim testovoma ćemo provjeriti koliko je efikasan i da li je u stanju adekvatno hladiti nove procesore. Montaža je kao što je to bio slučaj i kod prethodnika, vrlo jednostavna.
Thermalrightov Ultra-120 eXtreme hladnjak je znatno masivniji od Intelovog, koristi čak šest topovodnih cijevi te 120mm ventilator. Jasno je i vrapcima na grani kako će ovakva konstrukcija biti znatno efikasnija od Intelovog BOX hladnjaka. Montaža je jednostavna, a hladnjak pomoću četiri vijka pričvrščujemo za metalnu pločicu sa donje strane ploče.
Intel se odlučio uz ovaj kit poslati tri Quimondine DIMM pločice ukupnog kapaciteta 3GB. Ova DDR3 memorija radi na 1066MHz, sa latencijama 7-7-7-20 pri 1.5V. Tko želi više performanse treba znati kako Quimonda nudi i memoriju brzine 1333MHz (8-8-8 ili 9-9-9) koja također radi na 1.5V. Sve ove kitove je moguće nabaviti u 3 ili 6GB kapacitetima.
SSD se definitivno probija na tržište, a Intel je odlučio poslati vrlo brzi X25-M model koji je napravljen u MLC tehnologiji. Kapacitet mu je 80GB, a teoretske performanse su 250MB/s za čitanje i 70MB/s za pisanje. Koliko je stvarno brz provjerili smo mjerenjem performansi, a rezultate svakako provjerite u nastavku članka.
Test sistem, način testiranja i overclocking
|
|
Način testiranja i overclocking
Testiranja je kao i uvijek odrađeno u našem labu, a od dodatne opreme smo koristili mjerač potrošnje električne energije. Napajanje je bilo Thermaltakeovo snage 1.2kW, a monitor je bio Lenovov model LX220. Nastojali smo koristiti programe koji su u stanju iskoristiti više jezgri ili threadova kako bi iskorištenost procesora bila što veća. Operativni sustav je kao i uvijek bila Windows Vista sa instaliranim SP1, a korišteni su najnoviji Intelovi čipset driveri. Za usporedbu sa Bloomfield procesorima smo koristili posljednji Intelov Extreme procesor iz Penryn porodice koji radi na brzini od 3.2GHz - baš kao i Core i7-965 EE. Njega smo smjestili na DFI-evu UT X48-T3RS ploču, a koristili smo AData-inu DDR3 1600MHz memoriju. Sve igre su bile zakrpane najnovijim zakrpama, a testirali smo ih na dvije rezolucije. Na nižoj, gdje bi procesor mogao postati usko grlo i na višoj gdje se zahtjevaju odlične ukupne performanse sistema. Mjerili smo i potrošnju čitavog sustava, te zagrijavanje procesora na oba isporučena hladnjaka. Napominjemo kako smo kod provođenja svih testova isključili Turbo Mod te su procesori radili na svojim referentnim taktovima. Ono što smo ostavili za neki drugi test (prvenstveno zbog nedostatka vremena) je dobitak u performansama korištenjem Hyper-Threadinga.
Programi kao što je Cinebench R10 koriste svih osam threadova pa to onda u Windows Task Manageru izgleda ovako.
Overclocking se u slučaju 920 modela vrši na klasičan način - podizanjem baznog takta, pri čemu se mora voditi briga i o brzini memorije te njenom naponu. Nakon dosta istraživanja, korištenja raznih opcija i podizanja napona procesoru, northbridgeu i QPI-u stabilna maksimala koju smo uspjeli postići je vrlo dobrih 182MHz za bazni takt, što je rezultiralo brzinom QPI-a od 3296.8MHz te procesora 3662.9MHz. Memorijski djelitelj je u ovom slučaju bio snižen na jedinu nižu vrijednost, tj. 800MHz, a overclock je rezultirao brzinom memorije od 1099MHz pri naponu od 1.56V. Sve u svemu najsporiji Bloomfield procesor smo uspjeli stabilno natjerati na takt viši za 37% od referentnog što uopće nije loše :)
U slučaju otključanog Extreme modela čitava priča sa overclockingom je puno jednostavnija, no zahtjeva i ponešto drugačiji pristup. U BIOS-u je najprije potrebno podesiti parametre koji se nalaze u Intel Turbo Boost izborniku. prije svega je potrebno podići vrijednost limita TDC-a sa 110A na 300A te TDP-a sa 130W na 300W kako PCU ne bi automatski snizio frekvencije kada vrijednosti dođu tvornički postavljenih granica. Zatim je potrebno uključiti "override" limita struje naponskog regulatora te podići množitelje svakoj pojedinoj jezgri na željenu vrijednost. Premda Intel tvrdi kako ovaj procesor bez problema postiže vrijednosti iznad 4GHz, nama nije uspjelo postići stabilan rad ni na okruglih 4GHz, odnosno množiteljima postavljenim na 30. Kako nismo htjeli pretjerivati sa naponom, zadovoljili smo se sa konačnih i vrlo stabilnih 3.92GHz. Naravno da ćemo limite ovog procesora isprobati i na nekoj drugoj ploči čim nam se za to ukaže prilika - vjerujemo kako je u ovoj priči krivac lošijeg rezultata upravo bila DX58SO ploča.
Testovi - 1. dio
3DMark Vantage |
||||||||||||||||||||||||||||||||||||||||||||
CPU | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
Već u prvom provedenom testu, doduše sintetičkom, novi Core i7 procesori pokazuju zube i postižu znatno više vrijednosti od najjačeg procesora iz prijašnje generacije. Jedva čekamo "prave" testove da vidimo koliko su zaista brzi.
PCMark Vantage |
||||||||||||||||||||||||||||||||||||
Suite | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
Najslabiji Core i7 procesor je u ovom slučaju ostvario vrlo sličan rezultat kao i QX9770 procesor, dok preostala dva modela iz nove serije bježe naprijed. Napomenuti ćemo kako je ovaj test vršen sa klasičnim tvrdim diskom, te kako se vrijednosti penju debelo iznad 10000 u slučaju korišenja Intelovog SSD-a.
Blender |
||||||||||||||||||||||||||||||||||||
Time (sec) | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
Prvi "pravi" test dokazuje kako su novi procesori vrlo brzi. Blender je besplatni programčić nizozemskih autora kojeg možemo koristiti za modeliranje i renderiranje 3D animacija i grafike. U ovom slučaju riječ je o Character Model Renderingu, tj. 6.9MB "teškom" workloadu renderinga leteće vjeverice.
Cinebench R10 |
||||||||||||||||||||||||||||||||||||||||||||
Rendering x CPU (CB-CPU) | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
Dobro nam poznati Cinebench koji je baziran je na Cinema 4D softveru, također koristi svih 8 threadova pa nije ni čudo kako su rezultati Core i7 procesora znatno viši.
Photoshop CS3 |
||||||||||||||||||||||||||||||||||||||||||||||||
Time (sec) | ||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||
Photoshop CS3 također voli nove procesore, no ovdje najslabiji 920 ipak malo kaska za QX9770 modelom. Čini se kako CS3 ipak voli malo viši takt od broja threadova.
Excel 2007 Monte Carlo |
||||||||||||||||||||||||||||||||||||
Time (sec) | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
Već je ranije dokazano kako Excel 2007 zna raditi sa višejezgrenim procesorima te stoga ovakvi rezultati ne čude. Ovaj workload izvršava Europsku Put and Call procjenu opcija (ugovori o kupovini ili prodaji dionica po određenoj vrijednosti) za Black-Scholes cjenik opcija koristeći Monte Carlo simulaciju. Workload simulira izračune obnovljene proračunske tablice sa ulaznim parametrima i rekalkulira procjenu opcija. U ovom slučaju izvršavamo oko 300,000 iteracija Monte Carlo simulacije. Dodatno, workload koristi Excelove funkcije pretraživanja kako bi usporedio cijenu iz modela sa prijašnjim cjenama u 50000 redaka za razumijevanje konvergencije.
Xvid4PSP |
||||||||||||||||||||||||||||||||||||||||||||
Time (sec) | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
XviD4PSP je besplatan alat kojim smo transkodirali jedan video velikog formata u manji (koristeći h.264), pogodan za reprodukciju na iPOD Touch uređaju. Ovaj program ne koristi svih osam threadova, no svejedno novi procesori posao odrađuju znatno brže.
7-Zip |
||||||||||||||||||||||||||||||||||||
Score (MIPS) | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
Svi znamo za što koristimo ovaj alat, i također je poznato kao on voli višejezgrene procesore. Za našim Core i7 procesorima je jednostavno poludio, a prikazani rezultati su dokaz toga.
Everest MEM |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
Read (MB/s) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
Write (MB/s) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
Copy (MB/s) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
Latency (ms) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
S obzirom da je riječ o trokanalnom memorijskom setupu, visoki memorijski bandwidth je bio i očekivan. Ove već visoke brojke, dodatno će porasti kako se na tržištu budu pojavljivali brži memorijski kitovi koji će biti u stanju raditi na 1.5 - 1.6V.
Everest HDD |
||||||||||||||||||||||||||||||
Average read (MB/s) | ||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||
Average write (MB/s) | ||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||
Access time (ms) | ||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||
Znatno veća brzina SSD-a u odnosu na klasični tvrdi disk je bila očekivana i potkrijepljena činjenicom kako je riječ o vrlo brzom MLC disku. Izmjerene vrijednosti su vrlo blizu onima koje Intel reklamira i sa ovim diskom se stvarno osjeća ubrzanje u svakodnevnom radu. Budućnost je definitivno tu.
Testovi - 2. dio i overclocking performanse
Call of Duty 4 |
||||||||||||||||||||||||||||||||||||
1280x1024 (FPS) | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
1920x1200 (FPS) | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
Za drugi dio testova ostavili smo neke starije i neke novije naslove računalnih igara. Prva na redu je dobra stara COD4 igra, koja na nižoj rezoluciji pokazuje svu snagu Core i7 procesora, dok na višoj svi zaostaju za procesorom starije generacije.
Crysis Warhead |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x1024 (FPS) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 (FPS) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kao što se i u prethodnoj igri pokazalo, novi procesori imaju veće sirove performanse od starijeg modela. Na višoj rezoluciji čitav sistem postaje "usko grlo" te je vidljivo kako 920 modelu nedostaje koji megahertz više.
Far Cry 2 |
||||||||||||||||||||||||||||||||||||||||||||
1280x1024 (FPS) | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
1920x1200 (FPS) | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
Far Cry 2 benchmark samo potvrđuje već prije viđeni scenarij. Na višim rezolucijama, 940 i 920 procesorima nedostaju megahertzi, jer igre i dalje ne koriste više od jedne ili dvije jezgre/threada.
World in Conflict |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1280x1024 (FPS) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1920x1200 (FPS) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ovo je jedina testirana igra koja i na višoj rezoluciji prednost daje sporijem procesoru. No, WIC je s druge strane oduvijek bila čudna igra i benchmark.
Zagrijavanje |
||||||||||||||||||||||||||||||||||
Core i7 965 Idle (°C) | ||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
Core i7 956 Load (°C) | ||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
Kao što smo i prije napomenuli, isprobali smo oba priložena hladnjaka i došli do zaključka (kao i nebrojeno puta do sada) da je Intelov hladnjak bolje ostaviti u kutiji.
Potrošnja |
|||||||||||||||||||||||||||||||||||||||
Idle (W) | |||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||
Load (W) | |||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||
Pozitivno je vidjeti kako je nova generacija osim pomaka u performansama i mogućnostima donijela i sniženje potrošnje električne energije. U svakom slučaju dobro došla promjena.
Overclocking performanse
3DMark Vantage |
||||||||||||||||||||||||||||||||||
CPU | ||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
Overclocking performanse smo ovaj puta odlučili provesti u svega par testova, te ih izbaciti van iz ostalih grafova jer vjerujemo kako postignutih 3.92GHz za 965 model nije nije njegova maksimala. Ipak, razlike u prvom testu su osjetne.
PCMark Vantage |
||||||||||||||||||||||||||
Suite | ||||||||||||||||||||||||||
|
||||||||||||||||||||||||||
Ovi Vantage rezultati su postignuti sa SSD diskom, te su stoga znatno viši od onih prikazanih ranije. Ovdje overclocking nije donio značajnu razliku u konačnom rezultatu.
Super PI |
||||||||||||||||||||||||||
Time (s) | ||||||||||||||||||||||||||
|
||||||||||||||||||||||||||
SuperPI smo koristili iz razloga jer smo primjetili vrlo dobre rezultate procesora u "sub" 4GHz području. Ubrzanje kod overclockinga je ovdje vrlo primjetno.
7-Zip |
||||||||||||||||||||||||||||||||||
Score (MIPS) | ||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
7-Zip performanse vrlo dobro skaliraju sa povećanjem frekvencije i pitanje je vremena kada ćemo vidjeti brojke iznad 20000 MIPS-a.
Cinebench R10 |
||||||||||||||||||||||||||||||||||
Rendering x CPU (CB-CPU) | ||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
I Cinebench je također još jedna od aplikacija čije performanse vrlo dobro skaliraju povećanjem takta procesora.
Zaključak - Conclusion
Kao što smo vidjeli iz današnjeg članka Nehalem arhitektura donosi mnogo novosti i logičan je korak naprijed u odnosu na Conroe arhitekturu. U njenom razvoju se značajno mislilo na serversku primjenu i povećanje preformansi na tom polju, a to je donijelo napredak i u svakodnevnim "desktop" performansama. Svakako najbitnije novosti su integrirani trokanalni DDR3 memorijski kontroler, poboljšani power management koji je kao što smo vidjeli rezultirao manjom portošnom energije, povratak Hyper-Threadinga te uvođenje Turbo Boost tehnologije. Još uvijek je na tržištu premalo aplikacija koje mogu iskoristiti sve prednosti ovih tehnologija, no taj broj se svakako povećava, a i sam Intel preko svog Software Solutions Group odjela na to značajno utječe. Ukupne performanse Core i7 procesora su jako dobre, što je vidljivo i iz direktne usporedbe sa modelom kojeg nasljeđuju, a i overclocking potencijal je jako dobar. Iz svega viđenog jedino možemo zaključiti kako svakako zaslužuju našu preporuku. Tržišno predstavljanje ovih procesora će se desiti kasnije tijekom ovog mjeseca a cijene za tisuću komada će se kretati od 284USD za Core i7-920, preko 562USD za Core i7-940 pa do visokih 999USD za Core i7-965 Extreme Edition procesor. Maloprodajne cijene još nisu poznate, no na našem tržištu ne treba očekivati cijenu znatno nižu od 1000 € za 965 model.
Sljedeći korak je svakako snižavanje proizvodnog procesa i uvođenje octo-core procesora. No, tada će to nadamo se biti potkrijepljeno i sa većom količinom odgovarajućeg softvera koji će znati iskoristiti svu tu silnu moć. Sa konkurentske strane se također vrlo skoro očekuje predstavljanje nove serverske Shangai arhitekture iz kojih će proizaći i novi desktop procesori kodnog imena Deneb. Što nam je to AMD pripremio trebali bi svi skupa ubrzo saznati.
Conclusion
As we have seen from today`s article, Nehalem microarchitecture is a rather big and a very logical step forward from Conroe microarchitecture. It was designed to increase performance on the server side, and that brought a nice bump in desktop performance also. Biggest news is definitely integrated memory controller, improved power management system (which resulted in lower overall power consumption), resurrection of Hyper-Threading and Turbo Boost technology. There are still too few applications that can utilize all that power and technologies but that number is definitely growing. And Intel`s Software Solutions Group is helping with that also. Overall Core i7 performance is very good, which can be seen from direct comparison with its older Penryn brother. Overclocking potential is also very good, and we can only recommend Core i7 CPUs. Official Core i7 launch will be later in November, with 1kU pricing as follows: Core i7-965 Extreme Edition processor will cost $ 999, Core i7-940 processor $ 562, and Core i7-920 processor $ 284.
Next step is 32nm manufacturing process and octo-core CPUs. When they come to market, we hope there will be more applications which can utilize all that power. As for the competition, AMD is preparing its Shangai server platform from which Deneb desktop CPUs should derive. We should find soon enough what’s cooking in their kitchen.