AMD RDNA 3 – arhitektura, proizvodi i softver
Datum objave 14.11.2022 - Krešimir Matanović
RDNA 3 - arhitektura, proizvodi i softver
Kao što smo prošli tjedan izvijestili uživo iz Las Vegasa, AMD je nakon dvije godine predstavio novu grafičku arhitekturu RDNA 3, na događaju nazvanom together we advance_gaming.
RDNA 3 arhitektura donosi veće promjene u odnosu na RDNA 2, kako po pitanju interne strukture, tako i pakiranja. Prva je to arhitektura koja donosi chiplet dizajn grafičkog procesora, tj. modularni pristup u gradnji i odbacuje monolitni dizajn poznat do sada.
Grafički procesor je podijeljen na GCD ili Graphics Complex Die, te MCD ili Memory Complex Die. GCD je napravljen u TSMC-ovom 5-nanometarskom procesu i površine je 300 kvadratnih milimetara. Oko njega se nalazi šest MCD jezgri svaka površine 37 kvadratnih milimetara koje su napravljene u TSMC-ovom 6-nanometarskom procesu. GCD i MCD su međusobno povezani potpuno novom Infinity sabirnicom koja svoje korijene vuče iz Ryzen i Epyc procesora ali je puno kompleksnija zbog prirode rada GPU-a – visoka paralelizacija.
Kako je AMD došao do ovoga?
Krenimo redom. RDNA 3 je zamišljena kao arhitektura koja mora znatno povećati performanse i doživljaj igračima. Zadani ciljevi su bili postizanje ultra visoke frekvencije do 3 GHz, poboljšanje performansi poduplavanjem FP32 jedinica, poboljšanjem priručne memorije i povećanjem registara, zatim poboljšanje Ray Tracing performansi i dodavanje dediciranih operacija matrice čime se maksimizira propusnost i iskoristivost GPU-a, te na efikasan način implementiraju tensor operacije.
Napredan fizički dizajn je osnovica RDNA 3 arhitekture, u što ulazi chiplet dizajn koji povećava performanse po cijeni koštanja, te maksimiziranje performansi iz svakog kvadratnog milimetra. Naime, RDNA 3 ima 20% veću relativnu iskoristivost od RDNA 2. Ipak, glavni faktor veći performansi nove arhitekture je takt, on je zaslužan za 30% bržu izvedbu.
Chiplet tehnologija
Povećanje gustoće tranzistora donosi drastično povećanje cijene izrade, pa su skokovi s 14 i 16 nanometara, na 7 i 5 nanometara vrlo visoki. Ujedno, faktori skaliranja su sve ograničeniji i zapravo svi dobici ostvareni prijelazom na manji proizvodni proces i nisu toliko značajni da bi opravdali visoke troškove. AMD je stoga odlučio iskoristiti znanje i tehnologiju koju imaju s chiplet tehnologijom na Ryzen i Epyc procesorima te ju prebaciti u svijet grafičkih procesora. Kod Ryzena i primjene chiplet tehnologije su uspjeli postići linearan rast troškova u proizvodnji, za razliku od eksponencijalnog koji bi im se dogodio da su ostali na monolitnom dizajnu.
Kada su se jednom odlučili za chiplet GPU tehnologiju, zapitali su se kako ju zapravo ostvarili i može li funkcionirati za grafičke čipove. Naime, GPU shaderi zahtijevaju puno više veza od procesora zbog visoke paralelizacije, i potreban im je bio drugačiji pristup. Kako nam je Sam Naffziger (SVP & Corporate Fellow, te glavni Product Technology Architect) objasnio, chiplet tehnologija donosi bolji način particioniranja. Infinity Cache i GDDR6 sučelja su problematična za smanjiti, a grafički je procesor ostvario velike benefite od prijelaza na 5-nanometarsku tehnologiju. Zbog toga je pametnije odvojiti ove komponente koje je teško smanjiti od grafičkog procesora u zasebne jezgre. No, kako ih efikasno povezati?
Grafički procesor zahtijeva 10 puta veću propusnost od one koju zahtijeva CPU i njegovi CCD-i, pa je bilo potrebno dizajnirati potpuno novo pakiranje i sučelje – fanout visokih performansi i Infinity veze.
Infinity fanout linkovi koje su dizajnirali (fanout je broj ulaza koji može biti povezan sa specifičnim izlazima), visoke gustoće za RDNA 3 tehnologiju omogućavaju propusnost od 9,2 Gbps, što je 10 puta veća propusnost nego kod Epyc procesora. Ovo je omogućilo maksimalnu vršnu propusnost od 5,3 TB/s. Veze su iznimno sitne i dizajnirane su za rad s niskim naponom te imaju agresivan clock gating (uklanjanje signala iz strujnog kruga kada on nije u upotrebi), što štedi i do 80% energije u odnosu na veze organskog pakiranja kakve su u Epyc procesorima.
Povećanje broja veza, neupitno povećava i latenciju, no ona je u ovom slučaju eliminirana povećanjem osnovnog takta Infinity Fabrica za 43% i povećanjem takta grafičkog procesora za 18%. U odnosu na Navi21, kod nove arhitekture i Navi31 GPU-a je latencija memorije smanjena za 10%.
Chiplet arhitektura je definitivno budućnost za AMD i vjerojatno druge kompanije, a AMD je uspio iskoristiti prednost i znanje koju imaju s Ryzen i Epyc procesorima te to uspješno pretočiti u chiplet bazirane GPU-e. Samo prijelazom na ovu tehnologiju tvrde da su povećali efikasnost arhitekture za do 54% u odnosu na RDNA 2.
Kako izgleda nova grafička arhitektura?
Odgovor na ovo pitanje nam je dao Mike Mantor, Corporate Fellow i glavni AMD-ov arhitekt grafičkih procesora. Kao i uvijek vrlo smireni gospodin kojeg je iznimno zanimljivo slušati, iznio je sve detalje o svojoj najnovijoj kreaciji.
Osim naprednog chiplet dizajna i arhitekture koja je spremna za taktove do 3 GHz, novosti grafičke arhitekture uključuju nove ALU instrukcije i propusnost (2x ALU + BF16 podrška), zatim optimizirani i balansirani sustav priručne memorije (96 MB Infinity Cache memorije, 6 MB L2 memorije (50% više nego kod RDNA 2), 3 MB L1 memorije (300% više), i 3MB L0 memorije (240% više).
Druga generacija Ray Tracinga donijela je nove značajke koje povećavaju performanse i efikasnost, a veća priručna memorija će utjecati na brže izvršavanje kompleksnih RT zadaća. Sve to rezultiralo je 1.8 puta većim Ray Tracing performansama.
Command Processor i Geometry cjevovodi su fleksibilni s povećanjem performansi Multi Draw Indirect ubrzivača (MDIA) za 2,3 puta te mogućnošću obrade 12 primitiva po taktu što je 50% povećanja u odnosu na RDNA 2, a poduplane su i performanse hardver primitiva i vertices cull stope.
Piksel cjevovod je ubrzan za 50% pa obrađuje 6 rasteriziranih primitiva po taktu i 192 piksela po taktu. Dodani su Random Order Opaque izvozi (zamijenili veliki reorder buffer) te Pixel Wait sinkronizacija (omogućeno izvršavanje tzv. consumer fazi geometrije prije završetka tzv. producer faze što je uklonilo zastoje i početne latencije).
Korištena je brza GDDR 6 memorija koja preko 384-bitnog sučelja i stope od 20 Gbps ostvaruje propusnost od 960 GB/s. Na najjačem modelu je ukupno 24 GB memorije.
Novi je Radiance Display mehanizam s podrškom za Display Port 2.1 i HDMI 2.1a te 12 bita po kanalu za ukupnih 68 milijardi boja. Maksimalna propusnost je impresivnih 54 Gbps, a podrška za monitore ide do 8K@165Hz i 4K@480Hz.
Novi je i Dual Media mehanizam koji simultano kodira i dekodira AVC i HEVC, zatim kodira i dekodira 8K60 te ima AI podršku kod dekodiranja.
Što je novoga u računskim jedinicama?
Računske jedinice (CU; Compute Unit) su u paru kao i do sada, a arhitekturalna poboljšanja su donijela 17,4% ubrzanja po taktu. Primarno, povećan je broj računskih jedinica s 80 na 96, dodane su napredne matrične operacije (2,7 puta ubrzanje u tom tipu operacija i podrška za Bf16 podatke). ALU jedinica ima 64 i višenamjenske su, a nove su im instrukcije donijele dvostruku iskoristivost. Novi je menadžment tzv. softverske ovisnosti, Vector GPR je povećan za 50%, a Ray ubrzivači su optimizirani. Za kraj, i vektorska priručna memorija je poduplana sa 16 na 32 kB.
Vektorske jedinice se ponašaju kao 1 SIMD64 ili 2 SIMD32 jedinice što znači da u jednom taktu mogu odraditi jednu Wave 64 operaciju s FMA instrukcijama, ili dvije Wave 32 operacije.
Vektorska jedinica može biti i matrični ubrzivač koji obrađuje WMMA operacije (Wave Matrix Multiply Accumulate) – za 32 ciklusa izračuna 2.048 Dot2 operacija.
Koji su to onda proizvodi nastali iz RDNA 3?
Za početak su tu dvije grafičke kartice – Radeon RX 7900 XT i RY 7900 XTX. Na valu arhitekturalnih promjena i načina izrade grafičkog procesora nastale su dvije grafičke kartice koje donose izmijenjeni dizajn proizvoda, novo dizajnirani PCB i hladnjak.
PCB za XTX model je napravljen od IT-170 materijala, s 14 slojeva od kojih četiri koriste 2 oz. bakrene vodove. Napojna je jedinica pojačana u odnosu na prethodnu generaciju i sada je tu 20 visoko efikasnih power stageova, tj. integriranih MOSFET-a s prigušnicama i kondenzatorima, te kontrolerom. Na PCB-u se nalaze dva klasična 8-pinska PCIe Power konektora i to nije mijenjano u odnosu na prethodnu generaciju premda su zahtjevi za strujom nešto narasli (do 355 W). Na kartici se nalaze i jedan HDMI 2.1a port, dva DisplayPorta 2.1, te jedan USB Type-C port.
Hladnjak je redizajniran, s novim termalnim materijalima za kontakt s GPU-om, ultra mekim termalnim materijalima za kontakt s MOSFET-ima, novim termalnim materijalima za kontakt s GDDR6 čipovima, 10% većom parnom komorom itd. Stražnja ploča je baš kao i prednji pokrov napravljena od lijevanog aluminija. Na gornjoj se strani nalaze tri aksijalna ventilatora sa Zero-RPM modom rada, a na pokrovu su i RGB LED-ice. Ono što je novost za ovu generaciju je temperaturni senzor postavljen na usis, kojeg će budući driveri koristiti kao dodatan parametar za određivanje načina rada ventilatora.
Dvije predstavljene kartice su zadržale i relativno pristoje dimenzije. XTX kartica je dugačka 287 milimetara ima visinu od 123 milimetra, debljinu za 2,5-slota. TBP je kao što smo ranije spomenuli 355 W. XT kartica je manja s 276 milimetara i visine 113 milimetara. Debljina je istih 2,5 slota, a TBP je 300 W. AMD se posebno ponosi što su kartice Plug and Play u postojeće sisteme, tj. bezbolno se može zamijeniti RX 6950 XT kartica ovim novijima.
RX 7900 XTX ima Navi31 GPU s 96 CU jedinica ili 6.144 shadera. Game takt GPU-a je 2,3 GHz, a boost takt ide do 2,5 GHz. To znači da je partnerima ostavljeno dosta prostora za igranje s različitih tipovima hladnjaka i taktom do 3 GHz. Naravno, partneri će moći koristiti i novi tip konektora za napajanje kakav je poznat s Nvidia kartica 4000 serije ako za to ima potrebe. Uz GPU se nalazi i 96 MB Infinity priručne memorije što je manje nego kod prethodne generacije, a AMD tvrdi da je to sasvim dovoljno uz sve druge optimizacije i povećane taktove. Maksimalna računska snaga je visokih 61 TFLOPS-a. XTX kartica je opremljena s 24 GB GDDR6 memorije. Memorijska sabirnica je širine 384-bita, a data rate je 20 Gbps, uz maksimalnu propusnost od 960 GB/s.
RX 7900 XT ima GPU s 84 CU jedinice ili 5.372 shadera. Game takt je 2.0 GHz, a boost takt ide do 2,4 GHz. GPU ima 80 MB Infinity priručne memorije (ima 6 MCD-a oko GCD-a, ali je jedan onemogućen). Maksimalna računska snaga je visokih 52 TFLOPS-a. Kartica ima 20 GB GDDR6 memorije. Memorijska sabirnica je nešto uža nego kod jačeg modela te ima 320-bita, a dana rate je 20 Gbps.
Performanse kartica su prema AMD-u dosta narasle u odnosu na prethodnu generaciju što se može vidjeti na slajdovima, no tu ipak volimo sami provjeriti brojke. Tvrde kako XTX nudi i odličnu 8K igrivost uz korištenje FSR-a, na monitorima koji mogu imati stopu osvježenja i do 165 Hz.
Kao što smo već iz Las Vegasa s predstavljanja izvijestili preporučene maloprodajne cijene su 999 USD za RX 7900 XTX i 899 USD za RX 7900 XT. Još malo ćemo se strpjeti da vidimo kako će to stvarno izgledati na policama dućana.
A softver za nove kartice?
Naravno, nisu zaboravili ni na Adrenaline Edition upravljačke programe koje su unaprijedili za novu generaciju kartica. Kako nam je u ugodnom razgovoru rekao Andrej Zdravković koji je stariji potpredsjednik razvoja softvera: „Na upravljačkim programima posao nikad nije završen, uvijek ima tweakanja i dodavanja novih funkcija. No, vrlo smo zadovoljni njihovom stabilnošću u zadnjih par godina“.
Novosti iz ovog dijela su nam predstavili Frank Azor, glavni arhitekt igraćih rješenja i marketinga, te Ray Watkins koji je stariji product marketing menadžer.
AMD je u 2021. izdao čak 21 verziju upravljačkih programa testiranih na preko 6.000 Radeon kartica (automatizirane kombinacije testnih platformi), i time jamče visoku stabinost.
Nova značajka koju će dodati početkom 2023. godine je kombinacija triju postojećih – Super Resolution, Boost i Anti–Lag, a nazvana je AMD Hypr-RX On. Riječ je o značajki koja pritiskom na jedan gumb u sučelju ubrzava performanse, smanjuje ulazno kašenjenje i poboljšava cjelokupno korisničko iskustvo. Prema internim mjerenjima s igrom Dying Light 2 ostvarili su 85% povećanja u performansama (s prosječnih 90 na 166 FPS) i smanjenje ulaznog kašnjenja s 30 na 11 milisekundi.
Novosti dolaze i streamerima koji će moći koristiti AMD Noise Suppression tehnologiju, AV1 kodiranje, OBS optimizacije, povećanu kvalitetu streaminga (8K@60FPS streamovi ako ih baš želite) i AMD Link za AV1 integraciju (više performanse i vizualna kvaliteta uz fiksni bit-rate, 4-way multiplayer uz RX 7900 kartice).
Smart rješenja koja su vezana za Ryzen + Radeon platforme uključuju SmartShift Max, SmartShift Eco, Smart Access Memory, SmartAccess Graphics i Super Resolution tehnologije. Tehnologije su to koje se mogu koristiti i u AMD Advantage programu koji se sada širi i na desktop rješenja.
Možda želim kupiti gotov AMD sistem s najjačim komponentama i podrškom?
Advantage Desktop je program koji partnerima donosi smjernice za gradnju računala po AMD pravilima. Za početak će biti dostupni sistemi isključivo s Ryzen 9 7950X procesorom, RX 7900 XTX karticom i AM5 X670E matičnim pločama. AMD-ove smjernice za gradnju sistema uključuju korištenje premium i tool-less kućišta, vodenih hlađenja za procesore, minimalno 2 TB NVMe 4.0 SSD-a i minimalno 32 GB DDR5 AMD EXPO radne memorije.
Hlađenje mora biti dizajnirano tako da ne premašuje buku od 42 dB, a u sve jasno ulaze i Smart tehnologije te FreeSync Premium monitori. Za početak su tu sistemi koje su pripremili CyberPowerPC, eBuyer, Falcon Northwest, Maingear, Xidax, CSL i Origin tvrtke, a u budućnosti će ih biti još.
Kako AMD pomaže neovisnim softverskim studijima?
Od AMD-a smo imali priliku čuti nešto više i o podršci koju pružaju neovisnim softverskim studijima, a da ne ostane sve na igrama doveli su i dvije tvrtke koje se bave animacijom, odnosno 3D modeliranjem. AMD kroz GPUOpen inicijativu neovisnim studijima nudi pristup GPU-u, open source softver i suradnju na višem nivou. Dokaz tome je i podrška za FidelityFX Super Resolution koja je sada proširena na 218 igara (više FSR 1.0 nego FSR 2.0), a kao što znamo najavili su i FSR 3.0 tehnologiju za sljedeću godinu. FSR 2 je dobio podršku i u 3DMarku s Feature Testom, a uskoro dolazi i nova revizija FSR 2.2. FSR 3.0 bi pak trebao donijeti do dva puta veće performanse u odnosu na FSR 2.0 što je pokazano kroz Unreal Engine. Najavili su i podršku za Microsoft Direct Storage 1.1 s GPU dekompresijom. Posebno zanimljivo je bilo izlaganje Save Živkovića koji na bazi Unreal Enginea i AMD hardvera stvara kompjuterski generirane filmove.
Na kraju samo možemo zaključiti da smo u nekoliko dana u Las Vegasu saznali vrlo zanimljive informacije vezane za razvoj RDNA arhitekture 3 i sada čekamo 13. prosinac kako bi vam donijeli recenziju novi AMD grafičkih kartica baziranih na njoj.
Forum
Objavljeno prije 5 minuta
AutomobiliObjavljeno prije 17 minuta
PlayStation 5Objavljeno prije 34 minute
SvataraObjavljeno prije 47 minuta
Recenzija meanIT Bluetooth zvučnik i alarm sat B5Objavljeno prije 49 minuta
Aplikacije za prijavljivanje prometnih kameraNovosti
Posljednji dani rasprodaje za Praznik rada! Doživotni Office 2021 Pro već od 35,24 €! Iskoristite najbolju cijenu za Microsoftove licence odmah!
Kolege već koriste XLOOKUP kako bi ubrzali rad s podacima dok ste vi zaglavljeni s ručnim filtriranjem. Dok se drugi opuštaju tijekom blagdana, vješti profesionalci već su iskoristili Godeal24 rasprodaju za Praznik rada kako bi nadogradili... Pročitaj više
Facebook testira "degradiranje" nekorisnog sadržaja
Meta trenutno testira gumb Downvote na nekim računima kako bi smanjila nekorisne komentare na Facebooku. Kada više ljudi pritisne gumb Downvote na komentaru posta, bit će manje vidljiv. Predstavnik Mete rekao je da je za razliku od prethodn... Pročitaj više
FBI nudi nagradu od 10 milijuna dolara za hakersku skupinu Salt Typhoon, navodno povezanu s Kinom
FBI nudi 10 milijuna dolara za informacije o hakerskoj skupini Salt Typhoon – evo zašto je to velika stvar. Američki FBI nedavno je ponudio nagradu do 10 milijuna dolara za informacije koje bi dovele do identifikacije ili uhićenja članova h... Pročitaj više
Huawei tiho razvija moćne AI čipove unatoč pritisku SAD-a
Prema Wall Street Journalu (WSJ), Huawei ubrzava razvoj svojih moćnih AI čipova, s očekivanjem zamjene dijela Nvidijinih vrhunskih čipova. Ovaj potez nastavlja pokazivati otpornost kineske industrije poluvodiča na napore Sjedinjenih Država... Pročitaj više
Zašto sve više zemalja želi zabraniti društvene mreže djeci?
Zabrane dolaze polako, ali sigurno. I ne, nije riječ o nekoj moralnoj panici – ovaj put su zabrinuti znanstvenici, roditelji, psiholozi… i sad sve više i više vlada. Društvene mreže su, kažu mnogi, novi toksin za djecu i mlade – i možda je... Pročitaj više
Sve novosti