amd_rdna3_1

Kao što smo prošli tjedan izvijestili uživo iz Las Vegasa, AMD je nakon dvije godine predstavio novu grafičku arhitekturu RDNA 3, na događaju nazvanom together we advance_gaming.

RDNA 3 arhitektura donosi veće promjene u odnosu na RDNA 2, kako po pitanju interne strukture, tako i pakiranja. Prva je to arhitektura koja donosi chiplet dizajn grafičkog procesora, tj. modularni pristup u gradnji i odbacuje monolitni dizajn poznat do sada.

amd_rdna3_2

Grafički procesor je podijeljen na GCD ili Graphics Complex Die, te MCD ili Memory Complex Die. GCD je napravljen u TSMC-ovom 5-nanometarskom procesu i površine je 300 kvadratnih milimetara. Oko njega se nalazi šest MCD jezgri svaka površine 37 kvadratnih milimetara koje su napravljene u TSMC-ovom 6-nanometarskom procesu. GCD i MCD su međusobno povezani potpuno novom Infinity sabirnicom koja svoje korijene vuče iz Ryzen i Epyc procesora ali je puno kompleksnija zbog prirode rada GPU-a – visoka paralelizacija.

Kako je AMD došao do ovoga?

amd_rdna3_30

Krenimo redom. RDNA 3 je zamišljena kao arhitektura koja mora znatno povećati performanse i doživljaj igračima. Zadani ciljevi su bili postizanje ultra visoke frekvencije do 3 GHz, poboljšanje performansi poduplavanjem FP32 jedinica, poboljšanjem priručne memorije i povećanjem registara, zatim poboljšanje Ray Tracing performansi i dodavanje dediciranih operacija matrice čime se maksimizira propusnost i iskoristivost GPU-a, te na efikasan način implementiraju tensor operacije.

amd_rdna3_7

Napredan fizički dizajn je osnovica RDNA 3 arhitekture, u što ulazi chiplet dizajn koji povećava performanse po cijeni koštanja, te maksimiziranje performansi iz svakog kvadratnog milimetra. Naime, RDNA 3 ima 20% veću relativnu iskoristivost od RDNA 2. Ipak, glavni faktor veći performansi nove arhitekture je takt, on je zaslužan za 30% bržu izvedbu.

Chiplet tehnologija

amd_rdna3_12

Povećanje gustoće tranzistora donosi drastično povećanje cijene izrade, pa su skokovi s 14 i 16 nanometara, na 7 i 5 nanometara vrlo visoki. Ujedno, faktori skaliranja su sve ograničeniji i zapravo svi dobici ostvareni prijelazom na manji proizvodni proces i nisu toliko značajni da bi opravdali visoke troškove. AMD je stoga odlučio iskoristiti znanje i tehnologiju koju imaju s chiplet tehnologijom na Ryzen i Epyc procesorima te ju prebaciti u svijet grafičkih procesora. Kod Ryzena i primjene chiplet tehnologije su uspjeli postići linearan rast troškova u proizvodnji, za razliku od eksponencijalnog koji bi im se dogodio da su ostali na monolitnom dizajnu.

amd_rdna3_31

Kada su se jednom odlučili za chiplet GPU tehnologiju, zapitali su se kako ju zapravo ostvarili i može li funkcionirati za grafičke čipove. Naime, GPU shaderi zahtijevaju puno više veza od procesora zbog visoke paralelizacije, i potreban im je bio drugačiji pristup. Kako nam je Sam Naffziger (SVP & Corporate Fellow, te glavni Product Technology Architect) objasnio, chiplet tehnologija donosi bolji način particioniranja. Infinity Cache i GDDR6 sučelja su problematična za smanjiti, a grafički je procesor ostvario velike benefite od prijelaza na 5-nanometarsku tehnologiju. Zbog toga je pametnije odvojiti ove komponente koje je teško smanjiti od grafičkog procesora u zasebne jezgre. No, kako ih efikasno povezati?

amd_rdna3_13

Grafički procesor zahtijeva 10 puta veću propusnost od one koju zahtijeva CPU i njegovi CCD-i, pa je bilo potrebno dizajnirati potpuno novo pakiranje i sučelje – fanout visokih performansi i Infinity veze.

amd_rdna3_14

Infinity fanout linkovi koje su dizajnirali (fanout je broj ulaza koji može biti povezan sa specifičnim izlazima), visoke gustoće za RDNA 3 tehnologiju omogućavaju propusnost od 9,2 Gbps, što je 10 puta veća propusnost nego kod Epyc procesora. Ovo je omogućilo maksimalnu vršnu propusnost od 5,3 TB/s. Veze su iznimno sitne i dizajnirane su za rad s niskim naponom te imaju agresivan clock gating (uklanjanje signala iz strujnog kruga kada on nije u upotrebi), što štedi i do 80% energije u odnosu na veze organskog pakiranja kakve su u Epyc procesorima.

Povećanje broja veza, neupitno povećava i latenciju, no ona je u ovom slučaju eliminirana povećanjem osnovnog takta Infinity Fabrica za 43% i povećanjem takta grafičkog procesora za 18%. U odnosu na Navi21, kod nove arhitekture i Navi31 GPU-a je latencija memorije smanjena za 10%.

Chiplet arhitektura je definitivno budućnost za AMD i vjerojatno druge kompanije, a AMD je uspio iskoristiti prednost i znanje koju imaju s Ryzen i Epyc procesorima te to uspješno pretočiti u chiplet bazirane GPU-e. Samo prijelazom na ovu tehnologiju tvrde da su povećali efikasnost arhitekture za do 54% u odnosu na RDNA 2.

Kako izgleda nova grafička arhitektura?

amd_rdna3_15a

Odgovor na ovo pitanje nam je dao Mike Mantor, Corporate Fellow i glavni AMD-ov arhitekt grafičkih procesora. Kao i uvijek vrlo smireni gospodin kojeg je iznimno zanimljivo slušati, iznio je sve detalje o svojoj najnovijoj kreaciji.

amd_rdna3_16

Osim naprednog chiplet dizajna i arhitekture koja je spremna za taktove do 3 GHz, novosti grafičke arhitekture uključuju nove ALU instrukcije i propusnost (2x ALU + BF16 podrška), zatim optimizirani i balansirani sustav priručne memorije (96 MB Infinity Cache memorije, 6 MB L2 memorije (50% više nego kod RDNA 2), 3 MB L1 memorije (300% više), i 3MB L0 memorije (240% više).

amd_rdna3_17

Druga generacija Ray Tracinga donijela je nove značajke koje povećavaju performanse i efikasnost, a veća priručna memorija će utjecati na brže izvršavanje kompleksnih RT zadaća. Sve to rezultiralo je 1.8 puta većim Ray Tracing performansama.

Command Processor i Geometry cjevovodi su fleksibilni s povećanjem performansi Multi Draw Indirect ubrzivača (MDIA) za 2,3 puta te mogućnošću obrade 12 primitiva po taktu što je 50% povećanja u odnosu na RDNA 2, a poduplane su i performanse hardver primitiva i vertices cull stope.

Piksel cjevovod je ubrzan za 50% pa obrađuje 6 rasteriziranih primitiva po taktu i 192 piksela po taktu. Dodani su Random Order Opaque izvozi (zamijenili veliki reorder buffer) te Pixel Wait sinkronizacija (omogućeno izvršavanje tzv. consumer fazi geometrije prije završetka tzv. producer faze što je uklonilo zastoje i početne latencije).

Korištena je brza GDDR 6 memorija koja preko 384-bitnog sučelja i stope od 20 Gbps ostvaruje propusnost od 960 GB/s. Na najjačem modelu je ukupno 24 GB memorije.

amd_rdna3_24

Novi je Radiance Display mehanizam s podrškom za Display Port 2.1 i HDMI 2.1a te 12 bita po kanalu za ukupnih 68 milijardi boja. Maksimalna propusnost je impresivnih 54 Gbps, a podrška za monitore ide do 8K@165Hz i 4K@480Hz.

Novi je i Dual Media mehanizam koji simultano kodira i dekodira AVC i HEVC, zatim kodira i dekodira 8K60 te ima AI podršku kod dekodiranja.

Što je novoga u računskim jedinicama?

amd_rdna3_4

Računske jedinice (CU; Compute Unit) su u paru kao i do sada, a arhitekturalna poboljšanja su donijela 17,4% ubrzanja po taktu. Primarno, povećan je broj računskih jedinica s 80 na 96, dodane su napredne matrične operacije (2,7 puta ubrzanje u tom tipu operacija i podrška za Bf16 podatke). ALU jedinica ima 64 i višenamjenske su, a nove su im instrukcije donijele dvostruku iskoristivost. Novi je menadžment tzv. softverske ovisnosti, Vector GPR je povećan za 50%, a Ray ubrzivači su optimizirani. Za kraj, i vektorska priručna memorija je poduplana sa 16 na 32 kB.

amd_rdna3_25

Vektorske jedinice se ponašaju kao 1 SIMD64 ili 2 SIMD32 jedinice što znači da u jednom taktu mogu odraditi jednu Wave 64 operaciju s FMA instrukcijama, ili dvije Wave 32 operacije.

amd_rdna3_26

Vektorska jedinica može biti i matrični ubrzivač koji obrađuje WMMA operacije (Wave Matrix Multiply Accumulate) – za 32 ciklusa izračuna 2.048 Dot2 operacija.

Koji su to onda proizvodi nastali iz RDNA 3?

amd_rdna3_5

Za početak su tu dvije grafičke kartice – Radeon RX 7900 XT i RY 7900 XTX. Na valu arhitekturalnih promjena i načina izrade grafičkog procesora nastale su dvije grafičke kartice koje donose izmijenjeni dizajn proizvoda, novo dizajnirani PCB i hladnjak.

amd_rdna3_19

PCB za XTX model je napravljen od IT-170 materijala, s 14 slojeva od kojih četiri koriste 2 oz. bakrene vodove. Napojna je jedinica pojačana u odnosu na prethodnu generaciju i sada je tu 20 visoko efikasnih power stageova, tj. integriranih MOSFET-a s prigušnicama i kondenzatorima, te kontrolerom. Na PCB-u se nalaze dva klasična 8-pinska PCIe Power konektora i to nije mijenjano u odnosu na prethodnu generaciju premda su zahtjevi za strujom nešto narasli (do 355 W). Na kartici se nalaze i jedan HDMI 2.1a port, dva DisplayPorta 2.1, te jedan USB Type-C port.

amd_rdna3_20

Hladnjak je redizajniran, s novim termalnim materijalima za kontakt s GPU-om, ultra mekim termalnim materijalima za kontakt s MOSFET-ima, novim termalnim materijalima za kontakt s GDDR6 čipovima, 10% većom parnom komorom itd. Stražnja ploča je baš kao i prednji pokrov napravljena od lijevanog aluminija. Na gornjoj se strani nalaze tri aksijalna ventilatora sa Zero-RPM modom rada, a na pokrovu su i RGB LED-ice. Ono što je novost za ovu generaciju je temperaturni senzor postavljen na usis, kojeg će budući driveri koristiti kao dodatan parametar za određivanje načina rada ventilatora.

amd_rdna3_6

Dvije predstavljene kartice su zadržale i relativno pristoje dimenzije. XTX kartica je dugačka 287 milimetara ima visinu od 123 milimetra, debljinu za 2,5-slota. TBP je kao što smo ranije spomenuli 355 W. XT kartica je manja s 276 milimetara i visine 113 milimetara. Debljina je istih 2,5 slota, a TBP je 300 W. AMD se posebno ponosi što su kartice Plug and Play u postojeće sisteme, tj. bezbolno se može zamijeniti RX 6950 XT kartica ovim novijima.

amd_rdna3_11

RX 7900 XTX ima Navi31 GPU s 96 CU jedinica ili 6.144 shadera. Game takt GPU-a je 2,3 GHz, a boost takt ide do 2,5 GHz. To znači da je partnerima ostavljeno dosta prostora za igranje s različitih tipovima hladnjaka i taktom do 3 GHz. Naravno, partneri će moći koristiti i novi tip konektora za napajanje kakav je poznat s Nvidia kartica 4000 serije ako za to ima potrebe. Uz GPU se nalazi i 96 MB Infinity priručne memorije što je manje nego kod prethodne generacije, a AMD tvrdi da je to sasvim dovoljno uz sve druge optimizacije i povećane taktove. Maksimalna računska snaga je visokih 61 TFLOPS-a. XTX kartica je opremljena s 24 GB GDDR6 memorije. Memorijska sabirnica je širine 384-bita, a data rate je 20 Gbps, uz maksimalnu propusnost od 960 GB/s.

RX 7900 XT ima GPU s 84 CU jedinice ili 5.372 shadera. Game takt je 2.0 GHz, a boost takt ide do 2,4 GHz. GPU ima 80 MB Infinity priručne memorije (ima 6 MCD-a oko GCD-a, ali je jedan onemogućen). Maksimalna računska snaga je visokih 52 TFLOPS-a. Kartica ima 20 GB GDDR6 memorije. Memorijska sabirnica je nešto uža nego kod jačeg modela te ima 320-bita, a dana rate je 20 Gbps.

amd_rdna3_21a

amd_rdna3_22

Performanse kartica su prema AMD-u dosta narasle u odnosu na prethodnu generaciju što se može vidjeti na slajdovima, no tu ipak volimo sami provjeriti brojke. Tvrde kako XTX nudi i odličnu 8K igrivost uz korištenje FSR-a, na monitorima koji mogu imati stopu osvježenja i do 165 Hz.

Kao što smo već iz Las Vegasa s predstavljanja izvijestili preporučene maloprodajne cijene su 999 USD za RX 7900 XTX i 899 USD za RX 7900 XT. Još malo ćemo se strpjeti da vidimo kako će to stvarno izgledati na policama dućana.

A softver za nove kartice?

Naravno, nisu zaboravili ni na Adrenaline Edition upravljačke programe koje su unaprijedili za novu generaciju kartica. Kako nam je u ugodnom razgovoru rekao Andrej Zdravković koji je stariji potpredsjednik razvoja softvera: „Na upravljačkim programima posao nikad nije završen, uvijek ima tweakanja i dodavanja novih funkcija. No, vrlo smo zadovoljni njihovom stabilnošću u zadnjih par godina“.

amd_rdna3_23

Novosti iz ovog dijela su nam predstavili Frank Azor, glavni arhitekt igraćih rješenja i marketinga, te Ray Watkins koji je stariji product marketing menadžer.

AMD je u 2021. izdao čak 21 verziju upravljačkih programa testiranih na preko 6.000 Radeon kartica (automatizirane kombinacije testnih platformi), i time jamče visoku stabinost.

amd_rdna3_18

Nova značajka koju će dodati početkom 2023. godine je kombinacija triju postojećih – Super Resolution, Boost i Anti–Lag, a nazvana je AMD Hypr-RX On. Riječ je o značajki koja pritiskom na jedan gumb u sučelju ubrzava performanse, smanjuje ulazno kašenjenje i poboljšava cjelokupno korisničko iskustvo. Prema internim mjerenjima s igrom Dying Light 2 ostvarili su 85% povećanja u performansama (s prosječnih 90 na 166 FPS) i smanjenje ulaznog kašnjenja s 30 na 11 milisekundi.

amd_rdna3_27

Novosti dolaze i streamerima koji će moći koristiti AMD Noise Suppression tehnologiju, AV1 kodiranje, OBS optimizacije, povećanu kvalitetu streaminga (8K@60FPS streamovi ako ih baš želite) i AMD Link za AV1 integraciju (više performanse i vizualna kvaliteta uz fiksni bit-rate, 4-way multiplayer uz RX 7900 kartice).

Smart rješenja koja su vezana za Ryzen + Radeon platforme uključuju SmartShift Max, SmartShift Eco, Smart Access Memory, SmartAccess Graphics i Super Resolution tehnologije. Tehnologije su to koje se mogu koristiti i u AMD Advantage programu koji se sada širi i na desktop rješenja.

Možda želim kupiti gotov AMD sistem s najjačim komponentama i podrškom?

amd_rdna3_8

Advantage Desktop je program koji partnerima donosi smjernice za gradnju računala po AMD pravilima. Za početak će biti dostupni sistemi isključivo s Ryzen 9 7950X procesorom, RX 7900 XTX karticom i AM5 X670E matičnim pločama. AMD-ove smjernice za gradnju sistema uključuju korištenje premium i tool-less kućišta, vodenih hlađenja za procesore, minimalno 2 TB NVMe 4.0 SSD-a i minimalno 32 GB DDR5 AMD EXPO radne memorije.

amd_rdna3_10

Hlađenje mora biti dizajnirano tako da ne premašuje buku od 42 dB, a u sve jasno ulaze i Smart tehnologije te FreeSync Premium monitori. Za početak su tu sistemi koje su pripremili CyberPowerPC, eBuyer, Falcon Northwest, Maingear, Xidax, CSL i Origin tvrtke, a u budućnosti će ih biti još.

Kako AMD pomaže neovisnim softverskim studijima?

amd_rdna3_28

Od AMD-a smo imali priliku čuti nešto više i o podršci koju pružaju neovisnim softverskim studijima, a da ne ostane sve na igrama doveli su i dvije tvrtke koje se bave animacijom, odnosno 3D modeliranjem. AMD kroz GPUOpen inicijativu neovisnim studijima nudi pristup GPU-u, open source softver i suradnju na višem nivou. Dokaz tome je i podrška za FidelityFX Super Resolution koja je sada proširena na 218 igara (više FSR 1.0 nego FSR 2.0), a kao što znamo najavili su i FSR 3.0 tehnologiju za sljedeću godinu. FSR 2 je dobio podršku i u 3DMarku s Feature Testom, a uskoro dolazi i nova revizija FSR 2.2. FSR 3.0 bi pak trebao donijeti do dva puta veće performanse u odnosu na FSR 2.0 što je pokazano kroz Unreal Engine. Najavili su i podršku za Microsoft Direct Storage 1.1 s GPU dekompresijom. Posebno zanimljivo je bilo izlaganje Save Živkovića koji na bazi Unreal Enginea i AMD hardvera stvara kompjuterski generirane filmove.

amd_rdna3_29

Na kraju samo možemo zaključiti da smo u nekoliko dana u Las Vegasu saznali vrlo zanimljive informacije vezane za razvoj RDNA arhitekture 3 i sada čekamo 13. prosinac kako bi vam donijeli recenziju novi AMD grafičkih kartica baziranih na njoj.