Zen 4 arhitektura

 amd_ryzen_7000_0

I tako smo polagano, od 2017. godine naovamo dogurali do Zen 4 arhitekture. Kao da je još jučer bilo predstavljanje originalnog Zena i prvih Ryzen procesora koji su promijenili tok povijesti za AMD i vratili ih u igru. Prva je Zen arhitektura donijela velike pomake u performansama u odnosu na četvrtu generaciju sada već zaboravljene Bulldozer arhitekture nazvane Excavator. U te se četiri godine štošta promijenilo, pa je i konkurent Intel konačno natjeran da napravi veće pomake i nešto inovira s Alder Lake arhitekturom.

amd_zen_4_0

Zen 4 donosi veliku promjenu na tržište. Uvodi se novi AM5 socket, nakon impresivnih pet generacija procesora koji su sjedili na istom socketu. Ovaj put je i promjena socketa značajna, nema više procesora s pinovima za AMD, sada su istureni kontakti preseljeni na matičnu ploču i ovaj put ih ima 1718 u LGA socketu koji može isporučiti impresivnih 230 W snage. Uz to, promjene su zahvatile i memorijski kontroler u procesoru koji sada podržava DDR5 memoriju, a tu je i podrška za PCIe 5.0 tehnologiju. Da, novosti je puno, a mi ćemo krenuti redom – od Zen 4 arhitekture.

amd_zen_4_7

AMD si je sa Zen 4 arhitekturom zadao ambiciozne planove i ono što su zacrtali su i ostvarili. 13% su povećali IPC (Zen 3 vs. Zen 4 na istom taktu), zatim povećali takt sve do 5,7 GHz (single core boost), zadržali 8-core complex jezgre koje imaju svojih 32 MB L3 priručne memorije, te povećali L2 priručnu memoriju s 512 KB na 1 MB po jezgri. Usput su u svaki procesor, tj. u njegov I/O dio integrirali i jednostavnu grafiku baziranu na RDNA2.

Na najjačem modelu se tako nalaze dva 8-core complexa kao i do sada (16 jezgri i 32 threada) ali novost je da su one sada napravljene u TSMC-ovom 5-nanometarskom procesu. Ispod CPU jezgara se nalazi I/O koji je napravljen u 6-nanometarskom procesu.

amd_zen_4_1

Zen 4 mikroarhitektura je doživjela facelift u odnosu na Zen 3 u front endu, izvršnom mehanizmu, load/store dijelu, nova je arhitektura priručne memorije, a nove su i AVX-512 instrukcije. Poboljšanja su napravljena u predviđanju grananja, povećana je operacijska priručna memorija, veći je red za umirovljenje instrukcija, povećani su Integer i Floating Point registri, te su dublji bufferi u cijeloj jezgri.

U Front endu je kao što smo napisali poboljšano predviđanje grananja i to povećanjem na dva predviđanja po ciklusu, povećanjem 50% L1 Branch Target Buffera (BTB), i povećanjem L2 BTB-a za nepoznat postotak. Operacijska priručna memorija je povećana za oko 68%, a iz OpCache-a izlazi 9 makro operacija po ciklusu. Ono što je zadržano iz Zen 3 arhitekture je slanje po 6 operacija između Integer i Floating Pointa.

Izvršni mehanizam je doživio poboljšanja povećanjem reda za umirovljenje instrukcija za 25%, zatim povećanjem broja registara cijelih brojeva, Integera, (sa 192 na 224) i Floating Pointa (sa 160 na 192), te povećanjem buffera u cijeloj jezgri (Re-order bufferi povećani s 256 na 320). Ono što je zadržano u odnosu na Zen 3 je izvršavanje 10 Integer + 6 Floating Point schedulea u jednom ciklusu.

Load/Store jedinica je također doživjela promjene, 22% je povećan red za Load, manje je konflikata na ulazu u podatkovnu priručnu memoriju, a za 50% je povećan L2 DTLB (data translation lookaside buffer) koji služi za spremanje prijevoda virtualne u fizičku memoriju (2k na 3k).  I dalje je moguće obraditi 3 operacije po ciklusu, maksimalno 3 Load i 2 Store operacije, a tu su i 6 „Table Walkera“ (tj. page walk struktura za spremanje mapiranja između virtaualne i fizičke adrese).

amd_zen_4_2

I struktura priručne memorije jezgre je doživjela velike promjene. Sada svaka jezgra ima čak 1 MB L2 (8-way) memorije što je duplo u odnosu na Zen 3, dok je zadržana ista L1 arhitektura (32K + 32K 8-way). Uz to, svaki Core Complex od osam jezgri ima i 23 MB L3 memorije (16-way). Podržano je više nerazriješenih promašaja u priručnoj memoriji od L2 prema L3, kao i od L3 prema memoriji. No ono što je očito bilo neizbježno je povećanje L2 latencije s 12 ciklusa na 14 ciklusa u odnosu na Zen 3, dok je L3 latencija skočila s 46 ciklusa na 50 ciklusa.

amd_zen_4_3

Nove AVX-512 instrukcije dodaju per-lane opcije maskiranja, nove Scatter/Gather instrukcije, a implementirane su 256b operacije, te BFloat16 i VNNI instrukcije.

I/O jezgra SOC-a

amd_zen_4_4

I/O jezgra je potpuno nova, a napravljena je u 6-nanometarskom procesu. Integrira osnovnu RDNA 2 grafiku, donosi optimizacije Infinity Fabrica, ima 28 PCI Express 5.0 stazica, podržava BIOS Flashback, i USB Type C. Jedna od bitnijih promjena je uvođenje DDR 5 memorijskog kontrolera (JEDEC 5200 s ECC podrškom). Dok je kod prethodne generacije Ryzena bilo optimalno ostaviti omjere frekvencija Infinity Fabrica (FCLK), memorijskog kontrolera (UCLK) i same memorije (MCLK) na 1:1:1 omjeru, kod nove platforme to više nije tako. U osnovi najbolje je ostaviti FCLK na automatskoj brzini, pa sada to izgleda AUTO:1:1. Optimalni FCLK takt je 2.000 MHz i toga se zapravo treba držati, a takav će ostati sve do brzine memorije od 3.000 MHz (DDR5-6000), nakon čega se prepolavlja pa memoriju nije ni potrebno overclockirati iznad toga.

Integrirana RDNA 2 grafika podržava AV1 dekodiranje, H.264 i HEVC kodiranje i dekodiranje, Display Port 2.0 UHBR10 standard, HDMI 2.1 FRL, USB Type C s DP Alt modom, ima 4K60 mogućnosti i podršku za hibridnu grafiku. Za 3D nije naročito podobna jer ima samo dva compute unita.

AM5 platforma

amd_ryzen_7000_2

Nakon pet generacija procesora koji su bili na praktički istom socketu, dolazi potpuno novi AM5 koji je LGA pakiranja, veličine 40 x 40 milimetara i s 1718 pinova (kontakata). Donosi podršku za DDR5 memoriju, 28 PCIe 5.0 stazica, tri USB-C (Hybrid GFX) i jednim dediciranim video izlazom, tri USB-C 3.2 porta (uz njih i jedan USB-A 3.2 i jedan USB 2.0), podršku za HDA/Soundwire/DMIC zvuk i sa SVI3 standardom kontrole napajanja. SVI3 donosi mnoga poboljšanja u odnosu na raniji SVI2. Komunikacijska veza omogućava kontrolu za cijelu AM5 platformu putem brze 2-way veze za mnoštvo onboard kontrolera za telemetriju napona, struje, snage i temperature. AM5 socket može dati do 230 W energije procesoru, uz opciju AMD Eco moda kojim se to može ograničiti na 65 ili 105 W.

Čipseti – X670E, X670, B650E i B650

amd_zen_4_5

AMD se u ovoj generaciji odlučio za čak četiri čipseta. X670 Extreme i X670 namijenjeni su zahtjevnijim korisnicima, entuzijastima koji su spremni platiti više za bolje napojne jedinice i više opreme, dok su B650E i B650 za one malo skromnije i obzirnije u trošenju.

X670E čipseti donose podršku za 16/4 PCIe 5.0 stazice i 4 PCIe 4.0, zatim dva USB 3.2 Gen2x2 porta i osam Gen 2×1 portova. Ukupan broj USB portova je 22. Šest je SATA 3.0 portova, integriran je WiFi 6E, a sabirnica je DMI 4.0 (x4). X670E čipset ima podršku za PCIe x16 5.0 i PCIe x4 5.0 M.2 slotove, dok proizvođači kod X670 ploča biraju žele li omogućiti PCIe x16 5.0 ili M.2 PCIe 5.0 slotove i to je zapravo jedina razlika. Dakle, ako nemate plan u bližoj ili daljoj budućnosti nabavljati PCIe 5.0 SSD ili grafiku dovoljan vam je i običan X670 čipset. U X670 čipsetima se nalazi i 12x PCIe 4.0 stazica za LAN, WiFi, NVMe, CEM slotove itd., te 8x PCIe 3.0 ili 6x PCIe 3.0 + 2x SATA 6 Gbps, ili 4x PCIe 3.0 + 4s SATA 6 Gbps, ili 2x PCIe 3.0 + 6x SATA 6 Gbps ili pak samo 8x SATA 6 Gbps – kako proizvođač matične ploče odabere.

amd_zen_4_6

B650E čipset donosi 16/8 PCIe 4.0 i 5.0 stazica, samo jedan USB Gen 2×2 port (20 Gbps) ili umjesto njega dva USB Gen 2×1 porta, zatim četiri USB 3.2 Gen2x1 portova (10 GBps) i 12 USB 2.0 (480 Mbps) portova. Tu je i 8 PCIe 4.0 stazica za LAN, WiFi, NVMe, CEM slotove itd. Osim toga tu je ili 4x PCIe 3.0 stazice, ili 2x PCIE 3.0 + 2x SATA 6 Gbps ili samo 4x SATA 6Gbps portova.