NV40 – GeForce 6 serija je tu!

Datum objave 15.04.2004 - Ozren Žagmešter

Uvod, CineFX i Vertex Shader 3.0

U članku o CeBIT-u sam indirektno najavio da je izlazak nove generacije grafičkih kartica tvrtke NVIDIA vrlo blizu. Na tom sajmu sam po prvi puta vidio NV40 u akciji i šturi demo iza zatvorenih vrata je na mene ostavio dobar dojam. Ipak, jedan lijepi demo sa atraktivnom sirenom ne znači puno, pogotovo što ostalih informacija praktički nije bilo. Bilo je jasno da na tome neće dugo ostati jer je NVIDIA odmah dala do znanja da me vodi na europski NV40 launch u Genevi. Par tjedana nakon CeBIT-a, točnije 9. travnja napokon su stigli materijali koji su omogućili pisanje ovog članka. Materijal je dobro popratio sve novosti koje NV40 donosi, no ja ne vjerujem u teoretske opise - ja volim vidjeti stvar uživo.

Prije nego što krenem opisivati što donosi NV40 moram napomenuti kako je cijela situacija oko ovoga članka negdje u rangu poremećaja u time-space continuumu iz Star Trek svijeta. Kao prvo ovaj članak je pisan 10. travnja, a objavljen 14. travnja u 15h. U to vrijeme (koje se još nije desilo jer sada kada ja pišem sve ovo je još 10. travanj) ja se nalazim (ili bolje rečeno nalazit ću se) u Genevi. Sada ćete se zapitati zašto je to bitno? Zato što sam tokom objave ovog članka saznao još tko zna što ili je netko vani uspio doći do informacija koje ja nisam uspio iskopati prije odlaska na avion. Što će reći da se lako može desiti da ja nakon povratka ovaj članak obogatim dodatnim informacijama ili čak napišem još jedan članak (npr. ukoliko u Genevi dobijem test sample - nešto u što živo sumnjam). Jedno je sigurno - vodeće svjetske stranice poput Anandtecha imat će puno bogatije članke jer su oni dobili same kartice na test, dakle bili su u prilici izvrtiti sve bencheve, provjeriti kvalitetu slike i sl. PC Ekspert će taj dio napraviti tek kad nam u ruke sleti sama kartica.

Prva stvar s kojom ću se pozbaviti jest CineFX 3.0, tj. novi engine koji stoji iza NV40.

 

CineFX 3.0 i Intellisample 3.0

CineFX 3.0 engine je ono što realno čini NV40. CineFX 3.0 je mozak nove uzdanice tvrtke NVIDIA - hardveraj je pak tijelo koje izvršava ono što mozak kaže. CineFX 3.0 prvi na tržištu donosi potpunu podršku za DirectX9.0 Vertex i Pixel Shader Modele 3.0. Uz SM3.0 tu je i podrška za OpenGL 1.5 te podrška za shader jezike poput Cg-a, GLSL-a (OpenGL Shader Language) i HLSL-a (High-Level Shader Language). Intellisample 3.0 tehnologija je pak tu da optimizira efikasnost memorije i da omogući još bolju iskoristivost postojećih tehnologija za kvalitetu slike.

Vertex Shader 3.0

Vertex Shader Model 3.0 podrška proizlazi iz činjenice da CineFX 3.0 podržava praktično neograničeno duge vertex programe i dynamic flow control. Neograničeno dugi vertex programi omogućavaju developerima da kompleksne efekte reliziraju putem jednog programa, dok su se do sada morali oslanjati na kombinaciju različitih shader programa. Dynamic flow control nudi programerima više opcija za pisanje efikasnih shader programa kroz nove instrukcije, dodatne opcije za granjanje i looping i sl. Stvar koja se meni pak posebno sviđa kod CineFX 3.0 enginea je displacement mapping.

Displacement mapping je tehnika koja eliminira glatke, dosadne, površine kroz "ljepljenje" tekstura na vertexe. Drugim riječima, displacement mapping omogućuje izradu likova bogatih detaljima (utorima, uvalama, itd.), a da pri tome nije potrebno računati geometriju. Uz to, ovi detalji reagiraju i na izvore svjetla čime se dobivaju još realističniji modeli.

Zli čika dinosaur bogat borama

Zadnja stvar vezana uz Vertex Shader 3.0 je Vertex Frequency Stream Divider. Ova stvarčica dugog imena omogućuje programerima da isti lik izrendaju n puta i time ostvare veliku uštedu, tj. dobrano zarade na performansama. Npr. jedno te isto drvo grafička izrenda 100 puta i onda svako od tih drva "pukne" na druge koordinate - rezultat toga je lijepa šuma od 100 drveća. Ljepota cijele stvari je što se ti "klonovi" mogu razlikovati ne samo po koordinatama gdje su postavljeni, već i po boji i sličnim stvarima. Ušteda proizlazi iz "masovne proizvodnje" - rendanje gomile istih objekata koji se onda "personaliziraju" efikasnije je zbog manjeg overheada nego da se stvari rade na način "rendaj objekt, personaliziraj ga, rendaj drugi, personaliziraj taj,..."

Pixel Shader 3.0, Superskalarna tehnologija i Rotated-Grid AA

Pixel Shader 3.0

Pixel Shaderi su bili Ahilova peta FX kartica serije 5 pa ne čudi da je NVIDIA tu napravila puno promjena. Kao prvo tu je nativna podrška za 32-bitnu preciznost. Kao drugo tu je podrška za neograničeno duge pixel shader programe (minimum za hardware kod shadera 2.0 bio je 96 instrukcija, za 3.0 je ta brojka narasla na 512). Tu je i dynamic flow control, isto kao i kod vertex shadera. Multiple Render Targets tehnologija pak omogućava per-pixel uštedu jer se svjetlosni efekti mogu dodati nakon što je izračunata sva geometrija. Ova tehnologija se još zove i deferred shading.

Sirena Nalu zvijezda je novog demoa napravljenog baš za NV40

 

UltraShadow II

Iako je CineFX 3.0 svakako najbitniji dio NV40, NVIDIA je puno prostora potrošila na reklamu svoje UltraShadow II tehnologije. Iako je UltraShadow tehnologija zgodna stvar, ne može se reći da je nešto fenomenalno. NVIDIA pak gura UltraShadow iz jednostavnog razloga - Doom III. Carmack je još davno odlučio da su mu stencil sjene bitna stvar i da u njima vidi ono što mu treba za Doom III. Kako nema sumnje da će Carmack/Doom III kombinacija biti dobitna, ne čudi da je i NVIDIA tu vidjela svoj dio kolača.

Nakon što smo se pozabavili sa CineFX-om 3.0 i dodacima, vrijeme je da bacimo oko i na samu arhitekturu i hardveraj.

 

Superscalar arhitektura

Superskalarni dizajn omogućuje NV40 karticama da u nekim slučajevima obrađuju duplo više operacija po ciklusu. Obrađivanje duplo više operacija proizlazi iz postojanja druge shader jedinice.

Lijevo je dijagram tradicionalne arhitekture, desno je superskalarna arhitektura

 

HPDR (High-Precision Dynamic-Range)

NVIDIA je ponosna i na svoju HPDR tehnologiju koja približava fotorealistično renderiranje kompjuterskoj grafici. Ključni oslonci za HPDR su nativna podrška za 32-bitni shading te operacije poput blendinga, filteringa i sl. Tu je i mogućnost korištenja floating point tekstura (i dinamičkog opsega).

 

Rotated-Grid Antialiasing

Nikada nisam volio kockice po ekranu i zato ne čudi da mi je kvaliteta antialiasinga od početka bila bitna. NVIDIA s NV40 donosi novi algoritam - rotated-grid antialiasing. Kao što samo ime govori, ključni element novog algoritma jest rotacija. Do sada su četiri pod-pixela semplirani u dva-na-dva grid za svaki pixel. Novi algoritam malo rotira pod-pixele i semplira iz četiri-na-četiri grida koji je oblika dijamanta. Rotirani grid omogućuje bolje pokrivanje pod-pixela u vertikalnoj i horizontalnoj dimenziji.

S lijeva je stara tehnika, s desna nova

Karakteristike

Karakteristike

Karakteristike NV40 (tj. kartica GeForce 6 serije) izgledaju ovako:

Arhitekturalne karakteristike GeForce 6 serije
Pixel pipelinea
16
Superskalarni shader
Da
Pixel shader, operacija po pixelu
8
Pixel shader,operacija po taktu
128
Pixel shader preciznost
32-bitna
Jedna tekstura, pixela po taktu
16
Dvostruka tekstura, pixel po taktu
8
Adaptivni anisotropic filtering
Da
Z-stencil, pixela po taktu
32

Ovako moćna arhitektura omogućila je i tvrtki NVIDIA da u nekim stvarima napokon uhvati ATi kartice - tako je tu i podrška za anisotropic 16x. U nekim stvarima je ostvaren i velik napredak. Tako NV40 može rendati do 16 tekstura po jednom prolazu. Uz to, podržane su i teksture nestandardnih dimenzija. Ono što meni nikako ne ide u glavu jest brojka od 128 pixel shader operacija po taktu - kako sa 16 pipelinea te dvije shader jedinice po pipelineu doći do broja 128 (umjesto 32)? Nadam se da ću na to pitanje dobiti odgovor!

NVIDIA je na NV40 natrpala još toga - tu je i dedicirani video procesor koji izvršava MPEG video enkodiranje i dekodiranje. Integrirani NTSC/PAL TV enkoder podržava rezolucije do 1024x768 bez panninga. Podržano je i DVD i HDTV MPEG-2 dekodiranje do 1920x1080i rezolucije.

Iako će prve GeForce 6 kartice biti AGP 8x modeli, podrška za PCI Express 16x je već ugrađena na njima putem high-speed interconnect tehnologije. Što se razlike u performansama između AGP 8x i PCI Ex 16x kartica tiče, ja sumnjam da će one iznositi više od 5% (a i to mi se čini puno).

Sljedeće pitanje koje se postavlja je gdje to sve stane? Odgovor pronađite u tablici:

Karakteristike
Broj tranzistora
preko 220 milijuna
Proizvodni proces
0.13 mikronski
Memorijsko sučelje
256-bitno
Memorija
GDDR3
AGP podrška
8x, SBA i FastWrites podržani
PCI Express 16x podrška
Da

220 milijuna tranzistora! Kada sam vidio jezgru na CeBIT-u bilo je jasno da se radi o gigantu jer je njezina veličina bila negdje dupla u omjeru s Barton jezgrom na AthlonXP procesorima. Ipak, brojka od preko 220 milijuna tranzistora iznenadila je i mene. Što se tiče ostalih stvari, tu iznenađenja nema. Proizvodni proces je i dalje 0.13 mikronski. Svi ovi podaci odnose se samo na GeForce 6800 i 6800 Ultra kartice. Za ATi RV370/380 kartice se već sada zna da će biti 0.11 mikronske. Podržana memorija je pak GDD3 što nije iznenađenje iako su NV40 kartice lako mogle doći i s DDR2 memorijom. Koliko slojeva ima PCB još nismo saznali, no ima ih barem 10, a najvjerovatnije 12. Uza sve to, cijena FX6800 kartica bit će jednaka kao i kod prijašnjih top modela (ispod USD500).

Što se drivera tiče, NVIDIA je za GF6800 kartice pripremila drivere serije 6x.xx koje nećete tako brzo vidjeti kao download na njihovim stranicama. Razlog za to je što su to ipak rani driveri te uz to potpuno neoptimizirani za FX kartice. S obzirom da tako i tako treba proći još barem mjesec dana da se 6800 kartice pojave u prodaji, to nije nikakav minus.

Hardware

Hardveraj

Sama kartica izgleda ovako:

Kartica u prostoru...

GeForce 6800 Ultra u punom sjaju

Hlađenje na kartici nije ništa posebno, tj. ne radi se o nikakvom bakrenom hladnjaku koji teži sto kilograma. Ono što pak odmah upada u oči jesu dva Molex 12V konektora koje treba nahraniti svaki sa svojom "žicom" - zaboravite na splittere i sl. stvari. Ja sam karticu vidio i bez oklopa i ona je dizajnom vrlo jednostavna - na njoj nećete naći puno kondića. Uz to layout je vrlo sličan dosadašnjim NVIDIA karticama, tako da ćete svoj postojeći GPU vodeni blok lako montirati i na GF6800 (ukoliko ste jedan od onih koji koriste vodeno hlađenje). PCI Express 16x kartice tražit će nešto manje dodatne struje pa će one dolaziti "samo" s jednim Molex konektorom za 12V.

Specifikacije su:

GeForce 6800 Ultra
Takt jezgre
400MHz
Takt memorije
550MHz DDR
Potrebno napajanje
480W (!)

Kada već hlađenje nije problem, NVIDIA se pobrinula da umjesto s bukom sada moramo ratovati s napajanjem! Da, da, GF6800 Ultra je mrcina za koju NVIDIA preporuča napajanje snage od 480W! I to kvalitetnih 480W, ne nekih JNC/shit kvazi-480W - NVIDIA za GF6800 preporuča napajanja poput Anteca od 500 i 550W. Šteta što GeForce 6800 nije izašla u vrijeme našeg Infoa pa da se možemo smijati našim dealerima kako pokušavaju demonstrirati naj-naj grafičku s napajanjima poput Maxpowera ili JNC-a - vjerujte, s tim napajanjima nema šanse da stroj s NV40 uopće POST-a. U svakom slučaju potreba za tako jakim napajanjem nije sretno rješenje i siguran sam da će radi toga biti dosta pisanja i isto tako dosta zbrke. U Americi će takva stvar uzrokovati puno problema, a kod nas još i više - kod nas test labovi nekih časopisa nisu opremljeni takvim napajanjima. Za PC Ekspert se ne trebate bojati - nije da smo bogati (daleko od toga), ali na sredstvima za rad ne štedimo.

Što se tiče taktova, 400MHz za jezgru i nije nešto posebno visoko. S druge strane, radi se o 220 milijuna tranzistora - nije lako sve njih natjerati da rade na visokom taktu. Ipak za očekivati je da će overclocking biti moguć, no koliki - ne znam. Memorija se pak vrti na 550MHz DDR, odnosno 1100MHz tako da nekih problema s bandwidthom ne bi trebalo biti, pogotovo što se promijenio trend kada su memorija i/ili memorijski kontroler bili usko grlo na grafičkim karticama - sada je to GPU. Nažalost, takt od ne-Ultra kartice, tj. od obične GeForce 6800, nisam uspio saznati.

NVIDIA je rekla da bi sample mogli dobiti u roku od tjedan-dva nakon lansiranja. Nadam se da će tako i biti s tim da bi do tada već mogao izaći i R420 - e to će biti ludi usporedni test ako se sve poklopi.

Što očekivati i zaključak

Što je za očekivati?

Malo mi je glupo ulaziti u to što očekivati od performansa kada će se na Internetu u isto vrijeme kada se objavi ovaj članak pojaviti članci s benchevima. NVIDIA je dala neke brojeve u svojem materijalu koji nažalost ne govore puno jer svatko ima neki svoj način testiranja. Jedini broj koji se meni čini prilično upotrebljiv za potrebu neke jednostavne usporedbe je rezultat u 3dMarku 2003 na 1600x1200 uz korištenje 4x AA i 8x AF - 3953. FX5950 Ultra s takvim postavkama, ali na 1024x768 postiže oko 3700.

Inače, ne treba vas čuditi korištenje 4x AA i 8x AF - NVIDIA je u svojim materijalima preporučila testiranje u rezoluciji ne nižoj od 1280x1024 (idealno 1600x1200) uz korištenje 4x AA i 8x AF. Ovako nešto ne čudi jer smo trenutno malo u rupi s dobrim benchevima - trenutno nema dovoljno zahtjevnih testova. Kada se pojave Doom III, Half-Life 2 i sl. to će se napokon srediti.

Jedinu stvar koju sam ja vidio u akciji jest Nalu demo koji je na mene ostavio jako dobar dojam. Duga gusta kosa sirene Nalu izgleda fantastično zbog odlične upotrebe deep shadows tehnike. Gibanje sirene zajedno sa kosom i perajom također izgleda super, a impresivna je i njezina koža na kojoj se vide spore i slične stvari (kada se zoomira).

Opako dobar demo - sirena Nalu

Općenito je za očekivati da je NVIDIA sredila shader performanse i da tu više neće biti problema, tako da je za očekivati odlične performanse i kod naslova koji debelo deru po pixel i vertex shaderima nove generacije. Sama NVIDIA tvrdi da je snaga GeForce 6800 Ultra kartice za 4-8x veća što se FP shadera tiče, 4x što se sjena i occlusion cullinga tiče te 2x veća što se vertex shadera tiče. S druge strane nema naznaka da su sređene performanse early Z-occlusiona - nažalost taj dio nećemo moći provjeriti dok god ne dobijemo samu karticu.

 

Zaključak

Osobno mrzim pisanje članaka o tehnologiji kada istu ne mogu i isprobati (za razliku od našeg Denisa koji obožava pisati takve stvari - ima nas svakakvih). Iz tog razloga ne mogu dati nekakav kvalitetan zaključak o GeForce seriji 6 osim da je sigurno napravljen napredak što se kvalitete slike i performansi tiče. Lista noviteta je dugačka i nekako sumnjam da će ATi s R420 biti na istom nivou, a pogotovo sumnjam da će ta kartica podržati Shader Modele 3.0 - to vjerojatno neće doći ni s R423. Dobra vijest je i to što hlađenje više nije problem. Nažalost, sada je tu problem hranjenja strujom ovog monstruma od 220 milijuna tranzistora - rijetko tko ima (kvalitetno) napajanje od 480W, a takva napajanja nisu baš ni jeftina.

Dok se čeka sample, ja ću se baciti na benchanje kartica poput 9800XT i FX5950U pod "teškim" uvjetima (1600x1200 uz korištenje AA i/ili AF). A kada stigne sample, moći ću dati i pravu ocjenu. Do tada - pozdrav!