TPC u "computing modu"

Kod "computing moda" TPC-a vidimo lokalnu dijeljenu
memoriju koja je sadržana u svakom od tri SM-ova. Svaka procesna jezgra u
SM-u može dijeliti podatke sa drugim jezgrama preko te dijeljene memorije
bez potrebe da zapisuje ili čita u i iz eksterne memorije. Ovo znatno doprinosi
povećanju brzine procesiranja i efikasnosti za različite algoritme.

Nvidijina unificirana i računalna arhitektura koristi dva različita
procesna modela. Za izvođenje preko svakog od TPC-a arhitektura je MIMD (multiple
instruction, multiple data), a za izvođenje preko svakog od SM-a arhitektura
je SIMT (single instruction, multiple thread). Iz programerske perspektive,
SIMT dozvoljava svakom threadu kretanje svojim putem, a s obzirom da se grananje
izvodi hardverski nema potrebe za ručnim podešavanjem grananja unutar vektorske
dubine.

GTX 200 GPU podržava više od 30,000 threadova u "letu",
a hardversko raspoređivanje threadova osigurava gotovo 100% iskorištenja
svih jezgara. GPU arhitektura je u stanju izvesti brzo hardversko prebacivanje
sa jednog threada na drugi ukoliko jedan mora čekati duže vremena na pristup
memoriji. SIMT višedretvena instrukcija unutar SM-a kreira, uređuje, raspoređuje
i izvršava dretve u grupama od 32 paralelne dretve zvane "warps".
GTX 200 GPU podržava do 32 warps/SM, dok je u staroj arhitekturi podržano
24warps/SM.

Usporedba veličine jezgre quad-core procesora i GTX
280 GPU-a.

Nvidija dakle ovim čipom zadire i u domenu CPU-a, odnosno oduzima
mu dio kolača sa GPU computingom. Heterogeno računanje podrazumjeva
da aplikacije sa visokom učinkovitošću koriste i GPU i CPU. CPU bolje barata
sa serijskim operacijama sa dosta grananja i nasumičnog pristupa memoriji.
GPU s druge strane bolje barata sa paralelnim operacijama koje imaju više
operacija sa pomičnim zarezom. Nvidija tu cilja na video reprodukciju, video
kodiranje, obradu fotografija, znanstvene proračune, simulacije fizike i rad
sa 3D grafikom (raytracing i rasterizacija) što su primjeri paralelnih aplikacija.
CPU-u tako ostaje posao sa kompajliranjem, web pretraživačima i e-mail klijentima
što su serijske aplikacije. Tu u cijelu priču uskače CUDA, koju GTX 200 arhitektura
podržava. CUDA iskorištava silne procesorske jezgre GTX-a 200, te predstavlja
nadogradnju za C i C++ jezike za paralelno procesiranje. CUDA omogućava programerima
rad u C-u bez da moraju probleme prevoditi u grafičke koncepte.

U novoj je arhitekturi dvostruko povećana veličina lokalne registarske
datoteke po SM-u, što dozvoljava brže i kompleksnije izvršavanje većih i kompleksnijih
shadera. Nvidija tvrdi kako ovo povećanje registarske datoteke nije
puno utjecalo na povećanje veličine samog GPU-a. Vrlo bitan dodatak novoj
arhitekturi je i podrška za "double-precision" 64-binto računanje
sa pomičnim zarezom. Nvidija tvrdi kako u "double-precisionu" GTX
200 ima jednake performanse sa osmo-jezgrenim Xeonom, odnosno njenih 10 TPC-a
ima snagu od 90 gigaflopsa. Poboljšali su i performanse tekstura, tako je
GTX 200 u realnim uvjetima 22% efikasniji og GF9 serije. GTX 200 ima i veći
shader-texture odnos i to za 50%. Ovo je bitno jer moderne igre imaju sve
kompleksnije shadere. I ROP jedinica je poboljšana pa je tako sada
u stanju dati 32 piksela po taktu. Po ROP particiji je podržano do 32 boje
i Z uzoraka po taktu za 8x MSAA. Pikseli koji koriste U8 (8-bitni unsigned
integer) podatkovni format mogu biti pomiješani dvostruko brža po TPC-u nego
u prijašnjoj generaciji.

GTX 200 serija ima 1GB frame buffer, odnosno GTX 280 podržava
1024MB GDDR3 memorije, dok GTX 260 podržava 896MB GDDR3 memorije. U slučaju
jačeg modela memorijsko sučelje je 512-bitno, što je skok sa 384-bitnog sučelja
u prethodnoj arhitekturi. Ono čime se Nvidija posebno hvali je poboljšanje
upravljanja potrošnjom električne energije. Tako tvrde da je u Idle/2D modu
potrošnja svega 25W, dok pri Blu-ray DVD reprodukciji troši svega 35W. Negativna
strana je da ogroman čip pri Loadu troći čak 236W što znači da će Vam trebati
jako dobro napajanje kako bi ju napojili. O kvaliteti i snazi napajanja za
SLI ne treba ni razmišljati jer će malo tko imati sredstava za dvije ili tri
ovakve kartice. GTX 200 podržava i HybridPower pa u kombinaciji sa nekom od
npr. nForce 780a ploča potrošnja pada na 0W ukoliko koristite integriranu
grafiku.

Za kraj priče o tehnologiji iza GTX 200 čipova samo informacija
kako GTX 260 kojeg još nismo dobili na test predstavlja "okljaštrenu"
verziju GTX-a 280 te ima 192 stream procesora koji kucaju na 1242MHz, dok
ostatak čipa kuca na 576MHz. Memorijsko sučelje je 448-bitno a GDDR3 memorije
ima ukupno 896MB. O GTX 280 specifikacijama detaljnije u nastavku teksta.