Pascal arhitektura

nvidia_gtx1080_12

Nvidijina je Pascal arhitektura nasljednik prethodne Maxwell arhitekture, a prvi je put predstavljena s high-end GP100 GPU-om namijenjenom serverskoj upotrebi. GP104 je prva desktop izvedenica toga čipa, a kako sam proizvođač kaže namijenjena je DirectX 12 i Vulkan igrama, upotrebi u VR igranju, igranju na 4K i 5K monitorima, te najnovijim HDR monitorima. GTX1080 je prva GP104 kartica koju je Nvidia izbacila, a GTX1070 je druga.

nvidia_gtx1080_nvidia_gtx1080_9

GP104 je napravljen u 16 nm FinFET proizvodnom procesu od strane TSMC-a, a novost za ovu seriju je i upotreba GDDR5X memorije propusnosti 10 Gbps. Pascal je najkompleksnija Nvidijina GPU arhitektura do sada, a GP104 ima čak 7.2 milijardi tranzistora koji su raspoređeni u GPC internu strukturu koja broji 2560 CUDA jezgri (shadera) jednostruke preciznosti. FinFET je mulitigate tranzistor koji je napravljen na SOI supstratu te ima dvoja vrata (za razliku od Intelovog TriGate procesa). FinFET je donio malo curenje struje i visoke taktove, pa tako GP104 bez problema ide i preko 2 GHz.

Svaki se GP104 sastoji od četiri GPC-a (Graphics Processing Cluster), dvadeset PSM-a (Pascal Streaming Multiprocessor) i osam memorijskih kontrolera širine 32 bita (256 bita ukupna širina). Svaki GPC ima dedicirani raster mehanizam i pet SM-ova (Streaming Multiprocessor), a svaki SM ima 128 CUDA jezgri, 256 KB registarske memorije, 96 KB dijeljene memorije, 48 KB L1 memorije te osam teksturnih jedinica. Tako jednostavnom matematikom dolazimo do brojke od 2560 CUDA jezgri i 160 teksturnih jedinica po čipu.

nvidia_gtx1080_10

SM ili Streaming Multiprocessor je visoko paralelizirani procesor koji raspoređuje tzv. warpove, odnosno grupe od po 32 niti (threadova) u CUDA jezgre i ostale izvršne jedinice unutar SM-a.

Spomenuti memorijski kontroleri širine 32-bita svaki na sebe vežu po osam ROP jedinica (Raster Operations Pipeline) i 256 KB L2 memorije, pa tako množenjem dolazimo do ukupno 2048 KB L2 memorije i 64 ROP jedinice po čipu.

nvidia_gtx1080_8

U usporedbi s prethodnom Maxwell arhitekturom i GTX980 karticom, GTX1080 je puno moćnija kartica jer donosi 25% više CUDA jezgri koje prosječno rade na 500 MHz višem taku. U GigaFLOPS-ima to iznosi 8873 naspram 4981, odnosno 78%. Texell fill-rate je također rastao za 78%, a memorijska propusnost  je rasla za oko 43%. Prijelazom sa 28 nm na 16 nm proizvodni proces je bilo moguće na 21% manju površinu staviti i 38% više tranzistora, a da je TDP rastao samo 15 W.

Ako se pitate zašto Nvidia uspoređuje GTX980 sa GTX1080, a ne GTX980 Ti odgovor je jednostavan. GP104 je izravni nasljednik GM204 čipa, dok je GTX980 Ti pogonio GM200 koji je bio nešto stesana verzija onoga u Titan X kartici. Naravno, usporedbi performansi, mi ćemo gledati obje ove kartice.

nvidia_gtx1080_13

Novu karticu i novu arhitekturu prati i novi tip memorije – GDDR5X. Riječ je unaprijeđenoj memoriji baziranoj na GDDR5, koja donosi tri ključne stvari – poduplava data rate, povećava energetsku efikasnost i donosi veću gustoću po čipu. Memorija na GTX1080 kartici doseže brzinu transfera od 10 Gbps efektivno (8x data rate x 1250 MHz), što je ugrubo vrijeme od 100 pikosekundi između dva bita podataka. Kako bi ovakve brzine bile ostvarive i održive, Nvidijini su inženjeri morali voditi posebnu brigu pri dizajniranju vodova između GPU-a i memorijskih čipova kako bi kompletan put iz GPU-a, kroz čip i vodove pa do jezgre memorijskog čipa generirao čim manji gubitak signala, crosstalk-a i eventualnih diskontinuiteta. GDDR5X memorija radi na 1.35V što osigurava istu potrošnju električne energije na 43% višem taktu u odnosu na GDDR5.

Kao i do sada memorijski podsistem koristi lossless kompresijske tehnike kako bi se smanjila propusnost, što se ostvaruje smanjenjem podataka zapisanih u memoriju, smanjenjem podataka prebačenih u L2 memoriju i smanjenjem količine podataka koja se prenosi između primjerice teksturnih jedinica i frame buffera. GP104 donosi određeni napredak u kompresiji pri čemu se 2:1 kompresija sada koristi češće i efikasnije, dodana je 4:1 delta color kompresija, kao i 8:1 delta color kompresija koja kombinira konstantnu 4:1 kompresiju boja 2×2 piksel blokova sa 2:1 kompresijom razlika između tih blokova. Rezultat svega je 70% povećanja efikasnosti memorijske propusnosti u odnosu na SM204 (GTX980).

nvidia_gtx1080_11

Pascal arhitektura i GTX1080 podržavaju PlayReady 3.0 (SL3000) standard i podržavaju HEVC dekodiranje unutar hardvera, što znači mogućnost 4K streaminga sa internetskih servisa. Kartica ima DisplayPort po 1.2 standardu s DP 1.3/1.4 Ready, što omogućuje prikaz slike na 4K ekranima pri 120 Hz, 5K ekranima pri 60 Hz i 8K ekranima pri 60 Hz putem dva kabela.

Pascal arhitektura donosi podršku za asinkroni compute (AMD to ima od prve GCN arhitekture), a to znači kako ima mogućnost obavljanja asinkronih poslova kao što su GPU bazirana obrada fizike i zvuka, zatim postprocessing renderiranih slika i asinkroni timewarp što je tehnika koja se koristi u VR-u za regeneriranje finalne slike bazirane na poziciji glave točno prije display scanout-a. Pascal podržava tehnike kao što su dinamičko raspoređivanje poslova, tzv. preemption na razini piksela i to u tri nivoa – graphic preemption na nivou piksela, compute preemption na nivou threada i compute preemption na nivou instrukcije.

nvidia_gtx1080_14

Tu je i SMP podrška odnosno Simultaneous Multi-Projection Engine, koji je hardverski blok smješten unutar PolyMorph mehanizma i to pri kraju geometrijskog pipeline-a a ispred rester jedinice. Ovaj je blok zadužen za generiranje višestrukih projekcija jednog geometrijskog toka, koji ulazi u SMP mehanizam iz shadera. SMP procesira geometriju kroz šesnaest predkonfiguriranih projekcija, pri čemu dijeli do dvije točke gledišta koje su u offsetu na X osi. Točke gledišta se mogu neovisno naginjati ili rotirati po osi. S obzirom da se svaki primitiv može pojavljivati u višestrukim projekcijama (točkama gledišta), SMP tu dodaje multi-cast funkcionalnost, pri čemu se omogućuje aplikaciji da GPU-u naredi repliciranje geometrije do 32 puta (16 projekcija puta dva projekcijska centra), a bez dodatnog overheada aplikacije dok geometrija teče kroz pipeline. S obzirom da se sve odvija unutar hardvera SMP mehanizam može smanjiti količinu posla za 32x (kod teselacije primjerice). Jedna od primjena SMP-a je i kod surround monitora i VR-a (lens matched shading).

S GTX1080 karticama dolazi i novo SLI sučelje koje ostaje kao i staro fizički ali je sada dodana veza između dva linka – dual-link SLI, putem novih SLI Bridge-ova nazvanih SLI HB. Koristeći SLI HB novo sučelje radi na višoj brzini 650 MHz vs. 400 MHz.

nvidia_gtx1080_15

Novost je i dodavanje novih Multi-GPU modova. Na najvišem nivou razlikujemo dvije opcije – Multi Display Adapter (MDA) Mode i Linked Display Adapter (LDA). LDA ima dva moda rada – implicitni (SLI) i eksplicitni (za ovaj su zaduženi razvojni timovi). Svakako najveća novost je što je GTX1080 SLI podrška ograničena na dvije kartice i 3-way i 4-way konfiguracije se više ne preporučuju zbog iznimno slabog skaliranja performansi u novim igrama koje koriste tehnike koje otežavaju ekstrakciju frame-to-frame paralelizacije. Najavljena Enthusiast Key aplikacija koja otključava 3 i 4-way funkcionalnost po novim je informacijama stvar prošlosti.

Pascal donosi i Fast Sync opciju koja je alternativa tradicionalnom V-Syncu, a koja radi zahvaljujući razdvajanju front enda (rendera) i backenda (display), pri čemu se smanjuje latencija jer više nema “flow controla” a eliminira se tearing. Tu je i podrška za HDR monitore, a novost je 4K@60 10/12b HEVC Decode, 4K@60 10b HEVC Encode i DP1.4-Ready HDR Metadata Transport.

Još jedna zanimljiva tehnologija je i Ansel, a riječ je o mogućnosti hvatanja in-game screenshota i njihov pregled u 360°. Screenshote je moguće slagati iz bilo koje pozicije, podešavati ih post-processing filterima, hvatati HDR slike u visokoj rezoluciji i dijeliti ih u 360° uz pomoć pametnog telefona, PC-a ili VR naočala. Podrška za Ansel je najavljena za The Division, The Witness, LawBreakers, The Witcher Wild Hunt, Parakog, No Mans`s Sky i Unreal Tournament.