Radeon Vega 64 Liquid kit

amd_vega_64_liquid_1

amd_vega_64_liquid_2 amd_vega_64_liquid_3

Nakon dugog iščekivanja, još tamo od Computexa, AMD napokon danas lansira svoju novu grafičku arhitekturu i nove desktop grafičke kartice. Do sada smo imali prilike vidjeti samo profesionalne Frontier Edition kartice, a sada stižu Vege za igranje (i eventualno mining). Nama je na test stigla najmoćnija Vega 64 Liquid koja ima najviše tvorničke taktove za grafički procesor što joj omogućava vodeno hlađenje. GPU ima 4096 shadera, baš kao i kod Fury X-a, no arhitektura je nova, a i koristi se nova HBM2 memorija.

amd_vega_64_liquid_4 amd_vega_64_liquid_5

Kao što smo u subotu u unboxing videu pokazali Vega 64 Liquid nam je stigla u zanimljivom pakiranju koje sadrži akrilnu kocku koja može poslužiti kao držac papira, dvije manje i dvije veće Radeon Vega naljepnice, vijke za radijator vodenog hlađenja, Vega gumenu narukvicu i ono najzanimljivije sam grafički procesor. Kartica i radijator s ventilatorom su ugodno smješteni u debelu spužvastu ispunu kako bi neoštećeni stigli do recenzenata.

amd_vega_64_liquid_6 amd_vega_64_liquid_7

Prigodno, pred predstavljanje novosti koje je donijela Vega arhitektura imamo prilike pogledati i sam grafički procesor koji ima površinu jezgre od 486 milimetara kvadratnih, napravljen je u 14-nanometarskom procesu i broji impresivnih 12.5 milijardi tranzistora. Ima 64 Next Gen Compute (NGC) jedinica po čemu je Vega 64 i dobila ime, koje ukupno broje 4096 stream procesora. Teksturnih je jedinica 256, a render back endova (ROP jedinice) 64. Maksimalni fill-rate tekstura je 429.3 GT/s, a piksela 107.3 GP/s. Osnovni takt procesora u Liquid verziji je 1406 MHz, a boost takt je 1677 MHz. Vršne SP performanse su 13.7 TFLOPS-a, a half precision su 27.5 TFLOPS-a.

Odmah do GPU jezgre vidimo i dva HMB2 čipa koji su svaki kapaciteta 4 GB (ukupno 8 GB). S čipom komuniciraju na sabirnici širine 2048-bita, a maksimalna teoretska propusnost je 483.8 GB/s. Sada kada smo iznijeli sirove brojke Vega 64 čipa vrijeme je za pregled arhitekturalnih novosti.

 

Vega arhitektura

amd_vega_64_liquid_15

AMD Vegu 64 opisuje kao svoj najkompleksniji i najmoćniji GPU do sada, koji donosi najveću promjenu u tehnologiji u zadnjih pet godina zbog sve većih zahtjeva koji se postavljaju pred GPU – od machine learninga, preko profesionalnih vizualizacija, virtualiziranog hostinga do virtualne stvarnosti. I stvarno, Vega donosi nove Next-Generation Compute jedinice s podrškom za Rapid Packed Math, novi Geometry Engine, poboljšani Pixel Engine, zatim novost u obliku High-Bandwidth Cache kontrolera, a tu je i 8GB High-Bandwidth Cache (HMB2 memorija). Pa krenimo redom.

amd_vega_64_liquid_8

 Prva implementacija Vega arhitekture je Vega 10 čip koji i pogoni Vega 64 karticu. Napravljen je u 14-nm LPP FinFET procesu, površine je 486 milimetara kvadratnih i ima 12.5 milijardi tranzistora. I premda broji 4096 stream procesora kao i prethodna generacija, poboljšanja u arhitekturi su donijela veću propusnost pa sada imamo 13.7 teraflops-a single-precision aritmetičke propusnosti, a zahvaljujući implementaciji “packed 16-bit math-a” ista ta mreža shadera ima vršne performanse od 27.4 teraflops-a u half-precision aritmetičkoj propusnosti. Vega 10 je prvi AMD-ov grafički procesor koji koristi Infinity Fabric interkonekcije iz poznate iz Zen arhitekture. Ove interkonekcije imaju nisku latenciju i omogućavaju koherentnu komunikaciju između on-chip logičkih blokova s ugrađenim QoS (quality-of-service) i sigurnosnim mogućnostima. Infinity Fabric omogućuje i stvaranje različitih konfiguracija prema željama naručitelja. Grafičku jezgru spaja s memorijskim kontrolerom, PCI Express kontrolerom, display mehanizmom i blokovima za ubrzavanje videa. I upravo zahvaljujući Infinity Fabric podršci u svakom bloku, novi će GPU-i i APU-i imati mogućnost lakog inkorporiranja elemenata Vega arhitekture.

amd_vega_64_liquid_9

Novost kod Vege je High-Bandwidth Cache kontroler (HBCC) koji omogućuje proširenje memorije koju GPU koristi s lokalne na sistemsku memoriju računala. Tradicionalno, ovo bi predstavljalo problem jer je pristup memoriji preko PCIe sabirnice spor i visokih je latencija. No, HBCC omogućuje lokalnoj video memoriji (memorija na kartici) da služi kao last-level cache. To omogućava grafičkom procesoru povlačenje memorijskih stranica koje trenutno nisu u lokalnoj memoriji preko PCIe sabirnice u tu istu lokalnu memoriju. S obzirom na to da su stranice manje od kompletnih tekstura ili ostalih resursa, kopiranje se odvija puno brže. Drugim riječima, HBCC omogućava remote memoriji (sistemskoj) da se ponaša kao video memorija, a lokalnoj video memoriji kao last-level cache. HBBC podržava 49-bitno adresiranje, tj. do 512TB virtualnog adresnog prostora. To je dovoljno za pokrivanje 48-bitnog adresnog prostora kojem moderni CPU-i mogu pristupiti.

amd_vega_64_liquid_10

Omogućavanje veće količine memorije od one dostupne lokalno (u slučaju Vege 64 je to 8 GB), pomaže razvojnim timovima igara stvaranje scena s više detalja, realističnije animacije, kompleksnije efekte osvjetljivanja scene itd.

U Vega arhitekturi je svaki grafički blok klijent L2 memorije, pa je stoga ona i povećava na 4MB. To je dvostruko povećanje u odnosu na GCN arhitekturu gdje je svaki piksel mehanizam imao svoju neovisnu priručnu memoriju.

U ovu se priču odlično uklopila i upotreba HBM2 memorije koja povećava data-rate dvostruko u odnosu na HMB prve generacije, ali i osmerostruko povećava kapacitet po “stacku”. Svaki “stack” HBM2 memorije s GPU-om komunicira putem 1024-bitne sabirnice. Zbog široke sabirnice memorija radi na nižem taktu za ostvarivanje potrebne propusnosti, a kraće interkonekcije omogućavaju i nižu potrošnju električne energije. AMD tvrdi kako je bandwidth-per-watt efikasnost veća za 3.5 puta nego kod GDDR5 memorije.

amd_vega_64_liquid_11

Novost je i Next-Generation Geometry (NGG) mehanizam koji je ugođen za veću propusnost poligona, te je fleksibilniji i programabilniji nego do sada. Tzv. Primitive Shaders su ključni element u postizanju veće propusnosti poligona po dostupnom tranzistoru. AMD je ovdje izmijenio tradicionalno mapiranje blisko Direct3D cjevovodu (input assembly, vertex shading, hull shading, tessellation, domain shading i geometry shading), i primitiv shaderi Vegi omogućavaju kombiniranje i zamjenu tradicionalnih dijelova cjevovoda s efikasnijim, kao što je early culling koji ubrzava renderiranje vidljive geometrije. Vega 10 GPU ima četri geometrijska mehanizma koji bi tradicionalno bili limitirani na četiri primitiva po taktu, a s primitiv shaderima se to sada povećava na više od 17 po taktu. Osim geometry cullinga, primitiv shaderi imaju i drugih primjena kao što je shadow-map renderiranje. NGG donosi i poboljšano balansiranje opterećenja preko različitih geometrijskih mehanizama, što maksimizira njihovu iskoristivost kod primjerice promjena konteksta (promjena jednog render stanja u drugo što uzrokuje privremeno mirovanje mehanizma).

amd_vega_64_liquid_12

Vega donosi i next-compute unit sa Rapid Packed Math značajkom. Podrška za 16-bitni packed math poduplava vršne floating-point i integer vrijednosti u odnosu na 32-bitne operacije. Također prepolavlja registarski prostor i količinu prijenosa podataka. Novi instrukcijski set uključuje bogatu mješavinu 16-bitnih cjelobrojnih i operacija s pomičnim zarezom što uključuje FMA, MUL, ADD, MIN/MAX/MED, bit shiftove, packing operacije itd.

amd_vega_64_liquid_13

Uz dodatak Rapid Packed Math-a od kojeg benefite imaju aplikacije kao što je machine learning and training, video procesiranje, computer vision, ali i moderne igre  (normal/direction vektori, vrijednosti osvjetljenja, vrijednosti HDR boja, blend faktori itd), NCU donosi i nove 32-bitne cjelobrojne operacije. One uključuju i set od osam instrukcija koje ubrzavaju generiranje adresa memorije i hashing funkcije (kriptografija, mining), ali i nove ADD/SUB instrukcije za minimiziranje upotrebe registara. Novost je i podrška za set 8-bitnih cjelobrojnih SAD (Sum of Absolute Differences) operacija koji se koriste u algoritmima za video i slikovno procesiranje.

Vega donosi i poboljšani pixel engine koji uključuje DSBR (Draw-Stream Binning Rasterizer) koji smanjuje nepotrebno procesiranje i prijenos podataka na GPU. AMD je Vega arhitekturu prilagodio postizanju viših radnih taktova produžavanjem nekih od cjevovoda, no uz korištenje trikova za smanjenje latencija koje to nosi sa sobom. NCU tako ima novi “floorplan” s kraćim vezama i kraćim ciklusima takta, a korištene su i neke tehnologije iz Zen arhitekture kao što je high-performance SRAM koji je u ovom slučaju modificiran za upotrebu u registrima opće namjene.

Novi je i mikrokontroler koji brine o efikasnosti potrošnje električne energije, koji sada ima kompleksnije power-control algoritme i dodane floating-point jedinice za kalkulacije više preciznosti. Prenesene su neke tehnologije s prijašnjih grafičkih procesora kao što je AVFS (adaptive voltage and frequency scaling), a poboljšana su “deep sleep” stanja. Vega uz standardna tri aktivna stanja memorije ima i low-freq. stanje za HBM memoriju od samo 167 MHz.

amd_vega_64_liquid_14

Vega uz pomoć novih upravljačkih programa također donosi niz zanimljivosti. Prva su power stanja – Power Saver, Balanced i Turbo. Testiranjem smo utvrdili kako je Balanced stanje najbolje za svakodnevnu upotrebu jer nudi visoke performanse uz solidnu potrošnju energije, dok Turbo drastično povećava potrošnju a ne donosi vidljivi benefit. Power Saver je s druge strane namijenjen svima koji imaju monitore niže rezolucije ili jednostavno ne trebaju visoki framerate (koji je doduše smanjen za samo oko 10%).

Uz već poznati Frame Rate Target Control kojim ograničavamo broj sličica u sekundi i smanjujemo potrošnju, novost je i Radeon Chill koji ide korak dalje od FRTC-a i donosi dinamički pristup menadžmentu snage prilikom igranja. Chill prati korisničke inpute kako bi razumio kada je brza akcija na ekranu, a kada nije. Kada nema puno akcije smanjuje broj sličica u sekundi i smanjuje potrošnju, a kada akcija krene trenutačno diže framerate. Chill radi i u suradnji s FreeSync tehnologijom, pa je moguće postaviti ga da radi u području FS zone monitora (npr. od 30 do 90 FPS-a (Hz-a).

Još jedna novost je i Enhanced Sync koji je novi vSync mod. Radi tako što kada framerate prijeđe iznad fiksne stope osvježenja ne limitira performanse, nego prikazuje posljednji kompletirani frame (sliku) na svakom intervalu monitora, što smanjuje ulazno kašnjenje a bez poznatih artefakata kao što je tearing. Istovremeno, kada framerate padne ispod stope osvježenja slike ekrana Enhanced Sync dinamički isključi vSync, što trenutačno dopušta tearing slike a kako bi se izbjegao stutter i povećanje ulaznog kašnjenja.

U upravljačkim je programima moguće odmah koristiti i High-bandwidth cache funkciju kako bi povećali memoriju s primjerice 8 na 12 GB. Ovo trenutno nema efekta jer ni jedna igra ne koristi toliko memorije, no u budućnosti će svakako dobro doći.