Arhitektura jezgre – AMD Bulldozer
Datum objave 05.10.2011 - Krešimir Matanović
Bulldozer arhitektura - 1.dio
Bulldozer mikroarhitektura je primarno serverska, i dizajnirana je kako bi povećala skalabilnost u zahtjevnim "enterprise" primjenama. Na tržište će tako doći tri vrste procesora – dvije serverske – Valencia i Interlagos, te iz njih izvedeni Zambezi desktop modeli. Novi serverski, šesnaest jezgreni Bulldozeri, trebali bi osigurati 50% veću propusnost od postojećih 12 jezgrenih Opterona, a zadržati isti nivo potrošnje i termalne okvire. Poboljšana će biti virtualizacija, izvršavanje aplikacija baza podataka (više threadova), HPC korisnici će moći uštedjeti na prostoru zbog veće gustoće jezgri na manjem prostoru, a Cloud servisi će profitirati od velike memorijske skalabilnosti i naravno povećanja broja jezgri. Uz potpuno novu mikroarhitekturu, novost je i prelazak sa 45nm na 32nm Silicon-On-Insulator (SOI) Hi-K Metal Gate proizvodni proces (11 metalnih slojeva), AMD-ovog partnera Globalfoundriesa. Novi proizvodni proces tako omogućuje smještaj 33% više jezgri na istu površinu. To konkretno znači da će najjači desktop 8-jezgreni Bulldozer procesor imati nešto manju površinu od aktualnog 6-jezgrenog Thubana. Da, 16 je jezgri za sada rezervirano samo za serverske procesore, dok će desktop modeli imati 8, 6 i 4 jezgri ili 4, 3 i 2 Bulldozer modula kako će te kasnije saznati iz teksta.
Novi dizajn mikroarhitekture, gdje postoje dvije integer jezgre u jednom modulu, koje dijele zajednički front-end (fetch i decode jedinice), zajedno s velikom L2 cache memorijom i FPU-om, AMD-u je omogućio modularni pristup "gradnji" proceosora. Ta mogućnost ostavlja felksibilnost gradnje i omogućuje procesore kao što su nadolazeći Opteroni 6200 (Interlagos) sa 16 jezgri, kao i 8-jezgrene Opterone 4200 serije (Valencia). Takav je princip naravno baza i za nadolazeće desktop procesore (Zambezi). Zambezi će dolaziti u konfiguraciji s maksimalno osam jezgri, tj. četiri Bulldozer modula sa po dvije integer jezgre u svakom modulu. Nove jezgre nose 15h naziv, u odnosu na prethodnu K10 arhitekturu koja je nosila naziv 10h. Takav 8-jegreni procesor na 315mm2 površine, sadržava četiri Bulldozer modula, veliki dio površine zauzima priručna memorija, a tu je i integrirani northbridge, DDR3 memorijski kontroler, četiri HyperTransport fizička sloja i različita I/O sučelja. Procesor ima ukupno 128 KB L1 podatkovne priručne memorije, tj. 16 KB po jezgri (64-byte cacheline, write-through, 4-way associative). Uz podatkovnu priručnu memoriju tu je i instrukcijska L1, a nje ukupno ima 256 KB (64 KB po modulu, 64-byte cacheline, 2-way associative). Drugostupanjska priručna memorija (L2) broji ukupno 8MB, tj. 2MB po Bulldozer modulu (1MB po jezgri, 64-byte cacheline, 16-way associative). I za kraj nam ostaje ukupno 8MB L3 priručne memorije, tj. 2MB po modulu (64-byte cacheline, 16-way associative, MOESI), koja je kontrolirana od strane integriranog Northbridgea. Integrirani northbridge (sjeverni most) kontrolira i dva kanala DDR3 memorije širine 72 bita, te četiri HyperTransport linka (16-bit receive/16-bit transmit).
Arhitektura Bulldozer modula je zapravo ono što je najzanimljivije kod novih procesora. U jednom su modulu sadržane dvije izvršne jezgre, tj. jedan je modul u stanju odraditi dva threada simultano, a ostatak je logike dijeljen. No, ipak nije sve tako jednostavno. Svaka funkcija koja ne može na jednostavan način biti podjeljena (Integer pipelines, Level1 data caches) će postojati za svaku jezgru. Sve će se pak ostale funkcije (Floating point pipelines, Level2 cache) dijeliti između jezgara. Ovo omogućava da svaka od dvije jezgre koristi na svoj način funkcije viših performansi (floating point unit), jer se na taj način smanjuje ukupna aktivna površina jezgre.
Novost u ovakvoj konstrukciji je i dijeljeni front-end (fetch i decode). Sastoji se od odvojenih cjevovoda za predviđanje i dohvat, instrukcijskog prefetcha određenog predviđanjem, 2-way instrukcijske priručne memorije veličine 64KB, 32-bajtne fetch jedinice, instrukcijskih TLB-a (translation lookaside buffer) u dva nivoa – prvi se sastoji od 72 unosa različitih veličina stranica, a drugi je s 512 unosa (4-way, 4K pages), i na kraju Branch fusiona.
Dvije jezgre su zapravo dvije odvojene integer jedinice od kojih se svaka sastoji od dvije ALU jedinice i dvije AGU jedinice, koje su sposobne odraditi četiri nezavisne aritmetičke i memorijske operacije po taktu. Prijašnji AMD-ov dizajn mogao je odraditi jedan therad po jezgri no imao je samo 3 cjevovoda, koji su dijelili ALU i AGU funkcije. Novim se dizajnom znatno povećavaju multithreaded performanse, uz povećanje jedne jezgre od oko 12%. Integer jedinice koriste "thread retire" logkiu, svaka jezgra ima svoj scheduler i koristi se Physical Register File preimenovanje registara (pomaže u održavanju malog broja fizičkih registara). Svaka jezgra ima 16K L1 priručne memorije, a podatkovni TLB podržava 32 unosa (cully associative). Load/store operacije se u potpunosti izvode out-of-order, sa dva 128-bit "punjenja" po ciklusu, jednim 128-bitnim spremanjem po ciklusu i redom od 40 unosa punjenja i 24 unosa spremanja.
FPU jedinica je dijeljena od strane dvije integre jezgre i radi na principu co-procesora s izvještavanjem matične jezgre o završetku operacije. FPU ima dvostruke 128-bitne FMAC (Floating Point Multiply/Accumulate) cjevovode i dvostruke 128-bitne Packed Integer cjevovode. FMAC jedinice rade s FMA (Fused Multiply Accumulate) instrukcijama, kao i sa standardnim FMUL (multiply) i FADD (add). Ipak, FMA operacija je snažnija jer dozvoljava kalkulacije tipa A = B x C
+ D. U standardnoj FP jedinici, ovo bi oduzelo dva ciklusa, jedan za množenje i jedan za zbrajanje. FMAC može odraditi i FMUL i FADD, dok tradicionalni dizajn imaju dedicirane putanje za te operacije. Kada se moraju izvršavati višestruke FADD ili FMUL operacije, optimizacja posla se sada vrši dijeljenjem posla na oba FMAC-am umjesto da na izvršenje čekaju jedna iza druge u redu. S Bulldozer arhitekturom, AMD koristi i moćnije FMA4 operacije koje se koriste u HPC (High performance computing) primjeni, a imaju četiri operanda. Uz standardne instrukcijske setove novost je podrška za SSSE3, SSE4.1, SSE4.2, AES-NI
i AVX setove, a karakteristično samo za Bulldozer tu su i već spomenute FMA4 (HPC), te nove XOP instrukcije (numeričke, multimedijalne aplikacije i algoritmi koji se koriste za audio/radio).
Forum
Objavljeno prije 1 minute
Trance-house-techno i ostala elektronska glazbaObjavljeno prije 17 minuta
Koje napajanje kupiti te preporuka kvalitetnih napajanja dostupnih u HR (1.post)Objavljeno prije 27 minuta
P: Samsung QLED Q80T 55" 120Hz VRRObjavljeno prije 33 minute
AutomobiliObjavljeno prije 1 sat
Samsung mobiteli - 2. dioNovosti
Crvena uzbuna za korejsku industriju zaslona: sustignu ti su Samsung i LG!
Kineska industrija OLED zaslona čini značajne korake u zatvaranju jaza s Južnom Korejom, zahvaljujući snažnim ulaganjima i subvencijama vlade. Prema izvorima iz industrije, kineski BOE je 15. siječnja osigurao dvostruki OLED zaslon za ogran... Pročitaj više
Microsoft 365 podiže cijenu za 43% nakon ove odluke
Microsoft je upravo najavio integraciju Copilota u Microsoft 365 Individual and Family plan i povećao cijenu za oko 3 USD mjesečno. Cijena novog mjesečnog plana iznosi 9.99 USD, u odnosu na 6.99 USD, a cijena novog godišnjeg plana je 99.99... Pročitaj više
Što će Trumpova administracija učiniti sa Zakonom o čipovima i znanosti?
Iako Donald Trump i njegove pristaše nisu baš podržavali Zakon o čipovima i znanosti Bidenove administracije tijekom kampanje, čini se da sljedeća američka vlada nema planove da ga poništi. Barem je to dojam koji je sljedeći američki minist... Pročitaj više
Google pretraživanje počelo je prisiljavati korisnike da omoguće JavaScript u svojim preglednicima.
Pojavila su se izvješća Googleovih korisnika koji su onemogućili JavaScript u svojim preglednicima, koji tvrde da im se pojavila poruka upozorenja da se tražilica ili Google pretraživanje ne mogu koristiti. Nakon tih izvješća i Google je po... Pročitaj više
Google otkriva audio audio datoteke Eclipsa otvorenog koda
Prema vijestima, Samsung je lansirao Eclipsa Audio, 3D audio sustav razvijen u suradnji s Googleom. Informacije o Eclipsa Audiou počinju izlaziti na sljedeći način: Eclipsa Audio temelji se na audio formatu Immersive Audio Model and Formats... Pročitaj više
Sve novosti