Arhitektura jezgre – AMD Bulldozer
Datum objave 05.10.2011 - Krešimir Matanović
Bulldozer arhitektura - 1.dio
Bulldozer mikroarhitektura je primarno serverska, i dizajnirana je kako bi povećala skalabilnost u zahtjevnim "enterprise" primjenama. Na tržište će tako doći tri vrste procesora – dvije serverske – Valencia i Interlagos, te iz njih izvedeni Zambezi desktop modeli. Novi serverski, šesnaest jezgreni Bulldozeri, trebali bi osigurati 50% veću propusnost od postojećih 12 jezgrenih Opterona, a zadržati isti nivo potrošnje i termalne okvire. Poboljšana će biti virtualizacija, izvršavanje aplikacija baza podataka (više threadova), HPC korisnici će moći uštedjeti na prostoru zbog veće gustoće jezgri na manjem prostoru, a Cloud servisi će profitirati od velike memorijske skalabilnosti i naravno povećanja broja jezgri. Uz potpuno novu mikroarhitekturu, novost je i prelazak sa 45nm na 32nm Silicon-On-Insulator (SOI) Hi-K Metal Gate proizvodni proces (11 metalnih slojeva), AMD-ovog partnera Globalfoundriesa. Novi proizvodni proces tako omogućuje smještaj 33% više jezgri na istu površinu. To konkretno znači da će najjači desktop 8-jezgreni Bulldozer procesor imati nešto manju površinu od aktualnog 6-jezgrenog Thubana. Da, 16 je jezgri za sada rezervirano samo za serverske procesore, dok će desktop modeli imati 8, 6 i 4 jezgri ili 4, 3 i 2 Bulldozer modula kako će te kasnije saznati iz teksta.
Novi dizajn mikroarhitekture, gdje postoje dvije integer jezgre u jednom modulu, koje dijele zajednički front-end (fetch i decode jedinice), zajedno s velikom L2 cache memorijom i FPU-om, AMD-u je omogućio modularni pristup "gradnji" proceosora. Ta mogućnost ostavlja felksibilnost gradnje i omogućuje procesore kao što su nadolazeći Opteroni 6200 (Interlagos) sa 16 jezgri, kao i 8-jezgrene Opterone 4200 serije (Valencia). Takav je princip naravno baza i za nadolazeće desktop procesore (Zambezi). Zambezi će dolaziti u konfiguraciji s maksimalno osam jezgri, tj. četiri Bulldozer modula sa po dvije integer jezgre u svakom modulu. Nove jezgre nose 15h naziv, u odnosu na prethodnu K10 arhitekturu koja je nosila naziv 10h. Takav 8-jegreni procesor na 315mm2 površine, sadržava četiri Bulldozer modula, veliki dio površine zauzima priručna memorija, a tu je i integrirani northbridge, DDR3 memorijski kontroler, četiri HyperTransport fizička sloja i različita I/O sučelja. Procesor ima ukupno 128 KB L1 podatkovne priručne memorije, tj. 16 KB po jezgri (64-byte cacheline, write-through, 4-way associative). Uz podatkovnu priručnu memoriju tu je i instrukcijska L1, a nje ukupno ima 256 KB (64 KB po modulu, 64-byte cacheline, 2-way associative). Drugostupanjska priručna memorija (L2) broji ukupno 8MB, tj. 2MB po Bulldozer modulu (1MB po jezgri, 64-byte cacheline, 16-way associative). I za kraj nam ostaje ukupno 8MB L3 priručne memorije, tj. 2MB po modulu (64-byte cacheline, 16-way associative, MOESI), koja je kontrolirana od strane integriranog Northbridgea. Integrirani northbridge (sjeverni most) kontrolira i dva kanala DDR3 memorije širine 72 bita, te četiri HyperTransport linka (16-bit receive/16-bit transmit).
Arhitektura Bulldozer modula je zapravo ono što je najzanimljivije kod novih procesora. U jednom su modulu sadržane dvije izvršne jezgre, tj. jedan je modul u stanju odraditi dva threada simultano, a ostatak je logike dijeljen. No, ipak nije sve tako jednostavno. Svaka funkcija koja ne može na jednostavan način biti podjeljena (Integer pipelines, Level1 data caches) će postojati za svaku jezgru. Sve će se pak ostale funkcije (Floating point pipelines, Level2 cache) dijeliti između jezgara. Ovo omogućava da svaka od dvije jezgre koristi na svoj način funkcije viših performansi (floating point unit), jer se na taj način smanjuje ukupna aktivna površina jezgre.
Novost u ovakvoj konstrukciji je i dijeljeni front-end (fetch i decode). Sastoji se od odvojenih cjevovoda za predviđanje i dohvat, instrukcijskog prefetcha određenog predviđanjem, 2-way instrukcijske priručne memorije veličine 64KB, 32-bajtne fetch jedinice, instrukcijskih TLB-a (translation lookaside buffer) u dva nivoa – prvi se sastoji od 72 unosa različitih veličina stranica, a drugi je s 512 unosa (4-way, 4K pages), i na kraju Branch fusiona.
Dvije jezgre su zapravo dvije odvojene integer jedinice od kojih se svaka sastoji od dvije ALU jedinice i dvije AGU jedinice, koje su sposobne odraditi četiri nezavisne aritmetičke i memorijske operacije po taktu. Prijašnji AMD-ov dizajn mogao je odraditi jedan therad po jezgri no imao je samo 3 cjevovoda, koji su dijelili ALU i AGU funkcije. Novim se dizajnom znatno povećavaju multithreaded performanse, uz povećanje jedne jezgre od oko 12%. Integer jedinice koriste "thread retire" logkiu, svaka jezgra ima svoj scheduler i koristi se Physical Register File preimenovanje registara (pomaže u održavanju malog broja fizičkih registara). Svaka jezgra ima 16K L1 priručne memorije, a podatkovni TLB podržava 32 unosa (cully associative). Load/store operacije se u potpunosti izvode out-of-order, sa dva 128-bit "punjenja" po ciklusu, jednim 128-bitnim spremanjem po ciklusu i redom od 40 unosa punjenja i 24 unosa spremanja.
FPU jedinica je dijeljena od strane dvije integre jezgre i radi na principu co-procesora s izvještavanjem matične jezgre o završetku operacije. FPU ima dvostruke 128-bitne FMAC (Floating Point Multiply/Accumulate) cjevovode i dvostruke 128-bitne Packed Integer cjevovode. FMAC jedinice rade s FMA (Fused Multiply Accumulate) instrukcijama, kao i sa standardnim FMUL (multiply) i FADD (add). Ipak, FMA operacija je snažnija jer dozvoljava kalkulacije tipa A = B x C
+ D. U standardnoj FP jedinici, ovo bi oduzelo dva ciklusa, jedan za množenje i jedan za zbrajanje. FMAC može odraditi i FMUL i FADD, dok tradicionalni dizajn imaju dedicirane putanje za te operacije. Kada se moraju izvršavati višestruke FADD ili FMUL operacije, optimizacja posla se sada vrši dijeljenjem posla na oba FMAC-am umjesto da na izvršenje čekaju jedna iza druge u redu. S Bulldozer arhitekturom, AMD koristi i moćnije FMA4 operacije koje se koriste u HPC (High performance computing) primjeni, a imaju četiri operanda. Uz standardne instrukcijske setove novost je podrška za SSSE3, SSE4.1, SSE4.2, AES-NI
i AVX setove, a karakteristično samo za Bulldozer tu su i već spomenute FMA4 (HPC), te nove XOP instrukcije (numeričke, multimedijalne aplikacije i algoritmi koji se koriste za audio/radio).
Forum
Objavljeno prije 8 minuta
PS5 Slim, RTX 4070 Super, Ext SSD, Switch Pro kontroler, ruteriObjavljeno prije 10 minuta
Dobra klimaObjavljeno prije 25 minuta
LCDi, Plazme i ostali televizori - pročitaj prvi post prije postavljanja pitanjaObjavljeno prije 35 minuta
Ubiquiti lap ac 120 ->nanobeam ac problem spajanjaObjavljeno prije 37 minuta
Linux OS - info, how-to, pitanja, novosti, savjeti, problemi...Novosti
Nova igra studija Naughty Dog možda izlazi ranije nego što se očekivalo
Obožavatelji Naughty Doga koji čekaju sljedeću igru legendarnog studija možda neće morati dugo čekati da čuju vijesti o njoj. Nedavna objava predsjednika Naughty Doga, Neila Druckmanna, možda donosi dobre vijesti vezane za najavu dugo išček... Pročitaj više
RedMagic 10 Pro postaje prvi gaming telefon koji je lansiran na tržištu sa Snapdragon 8 Elite procesorom
Serija RedMagic 10 Pro postaje prvi gaming telefon koji je lansiran na tržištu sa Snapdragon 8 Elite procesorom, dok će serija ASUS ROG Phone 9 još neko vrijeme čekati na službeno lansiranje. Kada je Qualcomm službeno predstavio procesor Sn... Pročitaj više
Izložena dva nova vodeća mobilna čipa: jednojezgrene i višejezgrene performanse povećane više od 20%!
Zahvaljujući nadogradnji procesa proizvodnje čipova ove godine, sveobuhvatne performanse vodećih čipova MediaTeka i Qualcomma uvelike su se poboljšale.bloger objavio je jučer (11. studenog) na Twitteru da Dimensity 9500 i Qualcommova druga... Pročitaj više
Novi trailer serije Secret Level izgleda odlično
Novi trailer za antologijsku seriju Secret Level daje dublji uvid u njezine interpretacije različitih videoigara. Također se saznaje više o zvjezdanoj glumačkoj postavi koja će se pojaviti u epizodama. Potvrđeno je da će se epizoda temeljen... Pročitaj više
Horizon Zero Dawn Remastered ne pronalazi uspjeh
Nedavno objavljeno izvješće pokazuje da je Horizon Zero Dawn Remastered jedno od najmanje popularnih ekskluziva za PlayStation 5 konzolu objavljenih 2024. godine. Iako Sony nudi nadogradnju za 10 dolara za Horizon Zero Dawn Remastered s osn... Pročitaj više
Sve novosti