NVIDIA GeForce 8 – ponovo na vrhu
By : Denis Arunović

Mnogo je vremena prošlo otkada je NVIDIA posljednji put radikalno promjenila arhitekturu svojih GPU-a. Točnije, to se zadnji put dogodilo s lansiranjem GeForce 6 serije grafičkih procesora. GeForce 7 koji je lansiran kasnije, bio je baziran na istoj arhitekturi, s manjim kozmetičkim promjenama. Sada je napokon došlo vrijeme za novu veliku promjenu, a njen nosioc je grafički procesor razvijan pod imenom G80. Novi GPU-a je zaista revolucionaran u svakom pogledu, a vjerojatno najzanimljiviji feature je kompatibilnost s novom, desetom generacijom Direct X API-a, no osim toga tu su i mnogi drugi zanimljivi detalji. Kako bi napravili dostojan pregled nove generacije NVIDIA-inih kartica, pozabavili smo se s referentnim modelom najsnažnije kartice iz cijele serije, GeForceom 8800 GTX, te s dva za nijansu slabija produkcijska modela – MSI-evim i BFG-evim GeForceom 8800 GTS. Nove smo kartice sučelili sa starim šampionima – GeForceom 7950 GX2 i Radeonom X1950 XTX.

Razvoj GeForce 8 arhitekture započet je prije čak četiri godine, a na njega je NVIDIA potrošila oko 400 milijuna dolara. Cilj je bio razviti grafički procesor nove generacije koji će biti kompatibilan s DirectX-om 10 i koji će u jednom potezu odbaciti sve probleme koji su mučili starije arhitekture. Rezultat ovih napora je G80 odnosno njegove produkcijske verzije GeForce 8800 GTX i GeForce 8800 GTS.

Glavne karakteristike nove arhitekture su:

  • Puna kompatibilnost s DX10 što uključuje i SM 4.0 (G80 je iz istog razloga korišten kao referentna kartica za razvoj novog API-ja)
  • 128 odnosno 96 Stream procesora – unificiranih shaderskih jedinica koje znaju raditi s pixel, vertex i geometry shaderima
  • Lumenex Engine – podrška za nove AA modove, podrška za FP16 i FP32 render targets, podrška za istovremeno korištenje HDR-a i AA algoritama
  • 10-bitni display output odnosno 10-bitni DAC-ovi – osjetno veći broj podržanih boja od 8-bitnih DAC-ova
  • Quantum Effects – podrška za ubrzavanje fizikalnih efekata na GPU-u
  • Pure Video HD – hardverska akceleracija HD video formata – H.264, VC-1, WMV/WMV-HD, MPEG-2 HD

Kao što vidimo, dizajn nove arhitekture je osjetno drukčiji od onog što se dalo naslutiti iz neslužbenih informacija koje su cirkulare mrežom svih mreža. Pričalo se da G80 neće imati hardverski unficirane shadere zato što takav dizajn nije dovoljno efikasan, već da će čip prema van biti unificiran kako bi bio kompatibilan s DX 10, dok će internoj dediciranoj logici (pixel i vertex shaderima) podatke dostavljati posebni interpreter instrukcija. Ovo se pokazalo kao varka koju je NVIDIA vjerojatno namjerno pustila u opticaj kako bi zamazala oči konkurenciji.

Prije nego što uđemo dublje u detalje arhitekture novog NVIDIA-inog GPU-a, treba spomenuti i njegove izuzetno impresivne fizičke karakteristike. G80 je do sada najkompleksniji i najveći procesor ikad plasiran na maloprodajno tržište. Čip je izrađen TSMC-ovim 90-nanometarskim procesom, a sastoji od se od oprilike 681 milijun tranzistora koji prekrivaju površinu od otprilike 484 kvadratna milimetra. Za usporedbu, Intelov Core 2 Duo procesor s četiri megabajta cachea se sastoji od "tričavih" 291 milijuna tranzistora. Masivni GPU-a pristupa memoriji preko 6 sabirnica širine 64-bita što će reći da je ukupna širina memorijske sabirnice čak 384 bita. Memorijski kontroler podržava sve poznate tipove GDDR memorije, od GDDR-a pa do GDDR4, no trenutno je uporabi 768 MB GDDR3 memorije koja radi na taktu od 900 MHz odnosno efektivno 1800 MHz. Osnovni takt G80 čipa je 575 MHz, no interno mnogi dijelovi GPU-a rade na osjetno višem taktu. Sve se ovo dakako odnosi na najjači model – GeForce 8800 GTX, dok slabija varijatna GTS ima nešto slabije specifikacije.

Arhitekturalne promjene koje je sa sobom donio G80 zaista su vrlo radikalne. To je u prvom redu odmak od klasičnog shaderskog cjevovoda koji je u osnovi neizmjenjen već posljednjih 20-ak godina. Ovaj se klasični cjevovod može podijeliti u nekoliko koraka. Prvi korak je slanje podataka iz sistema odnosno drivera kojim upravlja procesor, na grafičku karticu gdje oni dolaze u vertex-shaderske jedinice. VS jedinice potom šalju podatke na triangle setup gdje se stvaraju primitive – trokuti, linije i točke. Primitive potom dolaze do pixel shadera gdje se obavlja rasterizacija i sjenčanje. Sljedeći korak su ROP jedinice gdje se obavlja završni Z-check, blending i anti-aliasing. Na kraju se ovi podaci zapisuju u frame buffer odnosno video memoriju iz koje se završeni frameovi dalje šalju na izlaz grafičke kartice odnosno ekran.

Klasični shaderski cjevovod je odbačen u korist nove, efikasnije arhitekture

Kod G80 klasičnog cjevovoda više nema. Nema niti dediciranih jedinica koje se brinu za pojedine faze obrade podataka. Umjesto njih tu su stream procesori, njih 128 grupiranih u osam grupa, koji rade na taktu od 1,35 GHz. Stream procesori više nisu vektorski, kao što je do sada bio slučaj s PS i VS jedinicama, već skalarni procesori. Premda su mnoge operacije pri obradi grafike inherentno vektorske, što je i glavni razlog zašto su do sada grafički čipovi bili bazirani na vektorskim jedinicama, NVIDIA-ini inženjeri su izračunali da veću efikasnost i bolje performanse mogu dobiti korištenjem 128 skalarnih procesora nego 32 četverokomponenta vektorska procesora.

SP-ovi, kako NVIDIA skraćeno zove svoje stream procesore, su multifunkionalni odnosno unificirani pa svaki od njih može odrađivati posao koji su prije odrađivali pixel i vertex shaderske jedinice. Uz to, znaju raditi i s novom vrstom geometry shadera koji su implementirani u DirectX-u 10. SP sam po sebi može istovremeno izvršavati MADD i MUL instrukcije (MADD+MUL/clock), a podržava FP format IEEE 754.

GeForce 8800 sa svojih 128 stream procesora

Zbog korištenja velikog broja brzih unificiranih shaderskih jedinica odnosno SP-ova, G80 je mnogo efikasniji od bilo koje dosadašnje arhitekture. Kakav god da je omjer PS i VS instrukcija u pojedinoj sceni, G80 se dinamički može prilagoditi mnogo efikasnije iskorištavajući dostupne hardverske resurse.

Particija od 16 SP-ova zajedno s jedinicama za teksturiranje, L1 i L2 cacheom

Kao što se može i naslutiti, podaci nakon ulaska u čip više ne prolaze kroz fiksni cjevovod već kruže u čipu zavisno o tome koliko ih je potrebno obrađivati. Nakon što jedan SP odradi svoj dio posla, vrijednosti se zapisuju na on-chip memoriju te ih potom sljedeći SP koristi kao ulazne podatke. Proces se ponavlja dok se ne izvrše sve potrebne instrukcije, bilo da je riječ o PS, VS ili pak GS operacijama. Upućeniji će u ovakvom pristupu prepoznati ATI-jev GPU R520 gdje je primjenjen sličan koncept threading, ali na manjoj skali s obzirom da ovaj grafički procesor ima manji broj dediciranih PS i VS jedinica.

Usporedni prikaz starog i novog principa rada grafičkog cjevovoda

Kako bi G80 sa svojim brojnim SP-ovima bio dovoljno efikasan pri obradi podataka, NVIDIA je implementirala još jedan feature poznat s ATI-jevih kartica – razdvajanje jedinica za matematiku i teksturiranje. Svrha ovog postupka je maskiranje latencija memorije budući da instrukcije koje čekaju na čitanje ili pisanje iz memorije više nisu zaglavljene u matematičkoj jedinici odnosno u jednom od SP-ova, već se "uspavljuju" odnosno zapisuju u cache. Kada podatak iz memorije postane dostupan, instrukcije se ponovo "bude" i šalju na prvi slobodan SP.

Prikaz rada jedinica za matematiku i teksturiranje na starim i novim GeForceovima

Još jedan feature koji osjetno poboljšava efikasnost i brzinu izršavanja instrukcija je napredno grananje. Upućeniji sigurno znaju kako je baš u dinamičkom grananju R520 odnosno R580 bio osjetno nadmoćniji od bilo koje kartice iz GeForce 7 serije. Razloga za to je u prvom redu granularnost. GeForce 7 je pri grananju ograničen na pakete od 880 piksela dok R520 radi s paketima od 16, a R580 s paketima od 48 piksela. GeForce 8 ide korak dalje te nudi granularnost od 16 (vertex operacije) do 32 piksela (pixel operacije) što novoj NVIDIA-inoj arhitekturi osigurava još jedan as iz rukava kad je riječ o performansama u nadolazećim naslovima.

Premda starije verzije NVIDIA-inih kartica nisu imale problema s performansama, mnogi korisnici su im zamjerali nižu kvalitetu slike u odnosu na ekvivalentne kartice iz ATI-jevih pogona. NVIDIA je ove kritike shvatila vrlo ozbiljno te ih s G80 arhitekturom u potpunosti riješila, ali istovremeno i pomaknula granice kvalitete prikaza.

Pojednostavljeno rečeno, odgovor na NVIDIA-ine probleme nosi ime Lumenex Engine. Pod ovim brandom NVIDIA je upakirala nove vrste antialiasinga, podršku za FP32 format kroz cijeli proces obrade piksela , podršku za HDR u kombinaciji s antialiasingom te novi kvalitetniji anizotropni filter za teksture.

Što se tiče algoritama za antialiasing, odbačeni su stari 8xS i 16xS modovi, a dodani novi 8x, 8xQ, 16x i 16xQ. 8x i 16x modovi ne rade u sklopu klasičnog MSAA algoritma već koriste novu metodu CSAA odnosno Coverage Sample AntiAliasing. Nažalost, NVIDIA se u svojim tehničkim dokumentima nije potrudila opisati kako točno rade taj novi algoritam osim da u većini slučajeva rezultira kvalitetnijim prikazom u odnosu na 4x MSAA algoritam uz vrlo malen pad performansi.

Kod standardnog MSAA algoritma završna se boja piksela prikazanog na ekranu izračunava korištenjem nekoliko vrijednosti. S nekoliko točaka oko originalnog piksela uzimaju se uzorci boje, vrijednost Z-buffera za te točke te coverage sampleovi odnosno informacije o tome koji poligoni prekrivaju referentne točke za uzimanje color i Z sampleova. Vrijednosti boje i Z-buffera su osjetno zahtjevnije po pitanju fillratea grafičke kartice tako da proporcionalno s povećanjem broja korištenih vrijednosti padaju i performanse. NVIDIA-ini inženjeri su zaključili kako je bolje napraviti kompromis – koristiti manji broj color i Z-sampleova, ali istovremno uzeti veći broj coverage sampleova. CSAA algoritam rabi upravo ovu metodu kako bi se dobila kvalitetnija slika u odnosu na klasični MSAA algoritam, ali uz manji pad performansi.

Algoritam
2x
4x
8x
8xQ
16x
16xQ
Texture/Shader uzorci
1
1
1
1
1
1
Color/Z uzorci
2
4
4
8
4
8
Coverage uzorci
2
4
8
8
16
16

Kao što vidimo, standardni MSAA 4x algoritam koristi po četiri vrijednosti za boju i Z-buffer te četiri coverage samplea. Novi 8x mod koristi CSAA algoritam – premda se i dalje koriste četiri vrijednosti za boju i z-buffer, dva puta je povećan broj coverage sampleova. S 8xQ algoritmom opet se vraćamo na standardni MSAA dok je 16x mod koristi CSAA metodu zadržavajući jednak broj sampleova boje i Z-buffera kao kod 4x MSAA algoritma, no istovremeno koristi četiri puta više coverage sampleova. 16xQ mod opet standardni i vrlo zahtjevni MSAA algoritam s većim brojem svih sampleova.

Osim dodavanja novih AA algoritama odnosno modova, NVIDIA je kod G80 tvornički uključila u driverima korekciju gamme tijekom antialiasinga. Premda je ovaj feature bio dostupan i na GeForce 7 seriji GPU-a, korisnik ga je morao uključiti ručno. Još jedna novost je korištenje antialiasinga nezavisno o formatu što je rezultiralo mogućnošću uporabe AA algoritama u kombinaciji s HDR-om. Dakako, G80 podržava i oba TAA algoritma za zaglađivanje prozirnih tekstura.

Referentna slika korištena za usporedbu kvalitete AA algoritama

GeForce 7950 GX2

GeForce 8800 GTX

8xQ AA

Radeon X1950 XTX

No AA

Klikom na ponuđene doći ćete do screenshotova koje smo koristili za usporedbu AA algoritama na testiranim karticama. Slike su u rezoluciji 1280x960, JPG format, tako da će trebati vremena da se učitaju. Preporučamo vam da ih skinete na računalo i za pregledavanje koristite alat FastStone ImageViewer. U browseru alata izaberite četiri slike mišem istovremeno držeći pritisnutu tipku Ctrl. Potom pritisnite tipku P što će rezultirati usporednim prikazom četiri odabrane slike.

Stara je priča da starije verzije GeForce arhitekture imaju lošiji algoritam za anizotropno filtriranje u odnosu na Radeone. S obzirom da je ovaj nedostatak NVIDIA-i konstatno nabijan na nos, nije ni čudo da je napokon ispravljen. Štoviše, AF filter kod nove generacije čipova nudi čak i bolje filtriranje nego što smo to do sad imali prilike iskusiti na Radeonima. Tako je već sa standanim quality algoritmom filtriranje na GeForce 8 seriji prema kvaliteti vrlo slično onom koje nudi high quality algoritam na Radeonima. Kada pak uključimo high quality algoritam na GeForceu 8, filtriranje svojom kvalitetom nadilazi ono ponuđeno na modernim Radeon GPU-ima.

GF 8800 GTX vs. GF 7950 GX2 - Quality mod

GF 8800 GTX vs. GF 7950 GX2 - High Quality mod

GeForce 8800 GTX vs. Radeon X1950 XTX - Quality mod

GeForce 8800 GTX vs. Radeon X1950 XTX - High Quality mod

Priča o GeForceu 8 ne bi bila potpuna bez da spomenemo DirectX 10. Kao i G80 čip, DirectX 10 također označava radikalan tehnološki korak naprijed, korak kojim se mnogi stari principi u potpunosti napuštaju. DX 10 je najavljen kao integralni dio Windowsa Vista i kao takav neće biti podržan u starijim verzijama Windows operativnog sistema.

Jedna od glavnih značajki nove verzije DirectX-a je smanjivanje ovisnosti o performansama procesora. Kao što znamo, DirectX API sam po sebi radi kao abstrakcijski sloj između grafičkog hardvera i softvera koji taj grafički hardver koristi. S obzirom da se DirectX brine za prevođenje naredbi iz softvera u oblik razumljiv hardveru, upravljanje grafičkim hardverom pomoću DirectX-a (ili drugog 3D API-ja kao što je OpenGL) nosi sa sobom opterećenje glavnog procesora u računalu. Procesor postaje "usko grlo" sistema, a ograničava broj objekata koji se mogu iscrtati na ekranu te ograničava broj jedinstvenih efekata koji se mogu primjeniti u pojedinoj 3D sceni.

Provjera valjanosti resursa mnogo je efikasnije izvedena na DirectX-u 10

DirectX 10 rješava problem prevelikog opterećenja procesora na tri načina. Prvi je smanjenje opterećenja procesora pri iscrtavanju objekata i naredbama za promjenu stanja objekata u sceni, što je rezultat redizajna jezgre 3D API-a. Drugi način je dodavanje novih mogućnosti čiji je cilj smanjenje ovisnosti brzine grafičkog podsistema o brzini glavnog procesora. Na kraju, dodane su nove metode kojima je moguće izvršavati više funkcija sa samom jednom naredbom.

Jezgra API-a je skresana u odnosu na DirectX 9 izbacivanjem podrške za fiksne funkcije koje se vuku još iz vremena DirectX-a 7. Provjera valjanosti resursa, proces koji je prilično procesorski zahtjevan, a izvodi se prije izvođenja svake naredbe za iscrtavanje, sada je mnogo optimalnije implementira. Provjera valjanosti za svaki se objekt izvodi samo jedanput – kada je objekt stvoren, a ne svaki put kada objekt treba biti iskorišten kao što je slučaj s DirectX-om 9.

Osjetno smanjenje iskorištenja procesora rezultirat će boljim performansama u modernim 3D aplikacijama

Tri su nove metode implementirane kako bi se smanjila ovisnost o procesoru. Prva je mogućnost spremanja tekstura u nizove. Prebacivanje između različitih tekstura inače sa sobom nosi par performansi. Do sad se izbjegavanje prebacivanja između tekstura svodilo na uporabu tekstura vrlo visoke rezolucije u koje bi zapravo bilo upakirano nekoliko manjih tekstura. Kod DX-a 10 je do 512 tekstura moguće spremiti u niz. Nove instrukcije omogućavaju shaderima da pristupaju indeksiranim teksturama u nizu, a kako ove instrukcije izvodi GPU-a, opterećenje procesora je osjetno smanjeno.

Predicated-iscrtavanje je efikasnija metoda izbjegavanja iscrtavanja objekata koji na će na ekranu biti zaklonjeni nekim drugim objektom. Premda je ova metoda i do sada bila implementirana, sada se izvodi isključivo pomoću GPU-a.

Treća metoda je implementacija funkcije pod imenom stream out. Stream out omogućava geometry i vertex shaderima da rezultate kalkulacije zapisuju u direktno u memoriju kako bi oni interno mogli ponovo biti iskorišteni kao ulazne vrijednosti. Dakako, ova metoda se zapravo ponajviše odnosi na arhitekture koje će biti DX10 kompatibilne, ali neće imati hardverski unificirane shadere. Jednostavniji oblik ove funkcije je već bio implementiran u DirectX-u 9, a zove se vertex texture fetch.

Došli smo i do metoda koje su implementirane kako bi se grafičkom hardveru više posla moglo zadati samo jednom naredbom. S DirectX-om 9 su se za izmjenu stanja objekata na sceni koristile mnoge naredbe od kojih bi svaka radila opterećenje na procesoru. DirectX 10 rješava problem korištenjem dvaju novih konstrukcija pod imenom state objects i constant buffers.

State object su zapravo grupirane low level naredbe koje je programer prije morao rabiti ručno kako bi rekonfigurirao grafički cjevovod. DirectX 10 nudi ukupno pet state objekata – InputLayout, Sampler, Rasterizer, DepthStencil i Blend. Ove skupne naredbe zapravo objedinjuju osnovna stanja grafičkog cjevovoda koja se rabe pri izvođenju 3D grafike.

Constant buffers omogućava spremanje do 4096 konstanti u jednu funkcionalnu cjelinu kojom je moguće upravljati pozivom samo jedne funkcije. Konstante su inače predefinirane vrijednosti koje se koriste kao parametri pri izvođenju svih shaderskih programa. Primjer konstante su broj, intezitet, lokacija i boja izvora svijetla u sceni, budući da će izvori svijetla utjecati na izgled svih ostalih objekata. S obzirom da se ovakve konstantne vrijednosti (konstantne u kontekstu pojedine scene) mijenjaju tijekom izvođenja aplikacije, potrebno ih je mijenjati brojnim naredbama koje opet, svaka pojedinačno, generiraju opterećenje na procesoru zbog abstrakcijog sloja koji čini DirectX API. Constant buffer omogućava programerima da spreme hrpu konstantni u jednu cjelinu na koju je moguće utjecati samo jednom naredbom odnosno pozivom samo jedne funkcije.

Usporedni prikaz resursa dostupnih programerima s različitim verzijama DirectX-a

Dakako, novi DirectX ne bi bio to što jest bez novog shaderskog modela u verziji 4.0. Glavne novosti SM-a 4.0 je uvođenje nove vrste shadera koji se bavi manipulacijom primitiva pod imenom geometry shader, unificiranje shaderske arhitekture korištenjem unificiranog seta instrukcija i jednakih resursa za sve vrste shadera te na kraju povećanje resursa dostupnih programerima pri razvoju aplikacija.

S obzirom da smo o unificiranoj arhitekturi već dovoljno rekli opisujući arhitekturu novog NVIDIA-inog GPU-a, bacit ćemo se odmah na geometry shadere. GS-ovi su u DX10 grafičko cjevovodu smješteni između vertex shadera i rasterizacije, a omogućavaju napredno baratanje s primitivama – trokutima, točkama i linijama. Ono što je bitno naglasiti je da GS-ovi mogu stvarati i uništavati podatke koje su dobili od VS-ova što Microsoft naziva data amplification odnosno data minimization. Ovakva razina manipulacije s podacima unutar GPU-a nije bila moguća na starijem hardveru i API-ju, a otvara brojne mogućnost mnogo efikasnijeg izvršavanja efekata kao što su stencil shadows, dynamic cube maps i displacement mapping.

Geometry shaderi u kombinaciji sa stream out funkcijom omogućavaju da se na GPU-u vrlo efikasno izvršavaju i algoritmi koji nemaju veze s grafikom. Tu se u prvom redu misli na ubrzavanje fizike u igrama, ali i na algortime kakvi se npr. rabe u projektu GPGPU odnosno General Purpouse GPU computing.

Na kraju, spomenio da DirectX 10 nudi i efikasniji algoritam za zaglađivanje transparentnih tekstura. Premda su i ATI i NVIDIA već ponudili vlastita rješenja ovog problema, Microsoftova metoda rezultira jednako kvalitetnim prikazom no smanjenim padom performansi.

Nakon pregleda teoretskih mogućnosti nove NVIDIA-ine arhitekture, vrijeme je da vidimo kako je izveden konkretni hardver. Referentni GeForce 8800 GTX dobili smo u ruke prilično kasno što je i glavni razlog zašto ovaj članak o novoj generaciji kartica toliko kasni u odnosu na službeni datum lansiranje serije. Uz referentnu NVIDIA-inu karticu, na test nam istovremeno bio ponuđen i PNY-ev maloprodajni model novog GTX-a. Razlike među referentnom i PNY-evom karticom nema, izuzev različite naljepnice na hladnjaku. PNY-ev model nam je ustupila tvrtka LAB 2000, a kod njih ga je moguće nabaviti po cijeni od 4.999 kn.

Kartica i pol, kako god okrenuli

GeForce 8800 GTX je bez sumnje najveća grafička kartica koju smo ikad imali prilike vidjeti. Jedina veća kartica koju smo imali prilike vidjeti je inženjerski primjerak GeForcea 7950 GX2 korišten pri lansiranju Quad SLI-a. Doduše, kartica se u "divovskom" obliku nikad nije pojavila u prodaji pa 8800 GTX zapravo nema konkurenciju. Zbog izuzetne veličine, s naglaskom na dužinu, potencijalni kupci trebaju dobro razmisliti da li će uz karticu možda morati kupiti i novo kućište.

Što se pak karakteristika tiče, njih smo već spomenuli u uvodnom tekstu. Na velikom PCB-u smješten je G80 čip koji se sastoji od 681 milijun tranzistora od kojih većina rad na taktu od 1,35 GHz. Ipak, osnovni takt GPU-a je "samo" 575 MHz. Zanimljivo je spomenuti da G80 nema integrirane neke I/O funkcije. Sam čip s vanjskim svijetom može samostalno komunicirati samo preko PCI-E sabirnice, dok mu je za ostale funkcije potreban dodatni čip NVIO kojeg je NVIDIA smjestila između GPU-a i stražnjih konektora na kartici. Na ovaj način je napravljen kompromis između integriranja brojnih novih funkcija u GPU i proizvodnih troškova. Na GPU je povezano ukupno 768 MB GDDR3 memorije na radnom taktu od 1,8 GHz DDR. GPU i memorija komuniciraju preko 384-bitne sabirnice. Premda naizgled čudna, 384-bitna sabirnica se nalazi na pola puta između klasične 256-bitne i 512-bitne sabirnice, a NVIDIA-ini inženjeri su zaključili kako će im zlatna sredina dati najbolji omjer uloženo i dobiveno s obzirom na mogućnosti GPU-a.

Pogodite što je na vrhu

Dvostruko PCI-E napajanje je stvarnost

Velik GPU i puno memorije imaju svoj nusprodukt - potrošnju energije. Premda u NVIDIA-inim dokumentima nismo pronašli konkretne podatke o potrošnji kartice, prema informacijama koje do sad znamo rekli bi da je oko 150 do 160 vata. Tome u prilog govore i dvostruki PCI-E konektori za napajanje. Premda smo dvostruke konektore već imali prilike vidjeti prije na nekim karticama, one su uredno radile ako bi bio priključen samo jedan konektor. Kod 8800 GTX to nije slučaj - potrebno je priključiti oba konektora. Imajte na umu da kartica solidnu količinu energije vuče i iz same matične ploče preko PCI-E konektora - maksimalno 75 vata. Što se tiče podržanih napajanja, nismo bili primorani nabaviti nikakve kilovatne cirkuse. Kartica je uredno i bez ikakvih problema radila na starom dobrom Coolermasterovom RealPoweru od 550 vata. S obzirom da ovo napajanje ima samo jedan PCI-E konektor za grafičku karticu, drugi smo napravili pomoću adaptera.

Velik, ali izuzetno tih i moćan hladnjak

Ako ste se bojali da će velika potrošnja rezultirati problematičnih hlađenjem, grdno ste se prevarili. Kako već otprije znamo, NVIDIA jako dobro zna kako složiti hlađenje na high-end karticama. Na GTX-u je iskorišten vrlo masivni dvoslotni hladnjak koji prekriva sve čipove na kartici, a aktivno je hlađen turbinskim ventilatorom s promjenjivom brzinom okretaja. Hladnjak se odlično nosi s toplinom koju generira kartica i što je dosta važno, nije bučan čak niti pri opterećenju. Konkretne brojke oko zagrijavanja pogledat ćemo kasnije, ali zasad nam vjerujte da je hladnjak doista odličan.

Dupli SLI konektori

Još jedan kuriozitet na kartici su dupli SLI konektori koji će omogućiti povezivanje više od dvije kartice u SLI polje. Imajte na umu da NVIDIA prilično agresivno cilja na harversko ubrzavanje fizike u igrama putem GPU-a. Mogućnost je dostupna i na starijim karticama tako da pretpostavljamo da će korisnici dvije kartice u SLI polju iskoristiti za ubrzavanje grafike dok će treća, starija kartica biti iskorištena za ubrzavanje fizike. Doduše, još ništa nije službeno, ali dupli SLI konektori svakako nisu implementirani bez razloga.

Velikih novosti što se tiče konektora nema

Eto nas i do stražnjeg dijela kartice na kojem vidimo standarne konektore - dva dual-link DVI konektora koji podržavaju HDCP zaštitu, te TV-out izlaz. VIVO funkcije nisu implementirane, no na to smo već navikli.

Ruku na srce, razmjerno malo ljudi će se odlučiti na kupovinu GeForce 8800 GTX kartica s obzirom da se radi o najbržem modelu koji sa sobom nosi i vrlo visoku cijenu. NVIDIA je svjesna ove činjenice pa je zajedno s GTX-om izdala i model namijenjen korisnicima s nešto plićim novčanikom (nešto plićim s obzirom da niti slabiji model nije baš jeftin) - GeForce 8800 GTS. Stariji se siguno sjećaju kada je NVIDIA posljednji put koristila sufiks GTS - bilo je to na GeForce 2 seriji GPU-a. Tada je model Ultra bio na vrhu hranidbenog lanca, dok je model GTS bio namijenje korisnicima koji su htjeli visoke performanse, ali uz razumniju cijenu.

Model GeForce 8800 GTS je skresana verzija GTX-a. Sama je kartica osjetno manja i veličinom je vrlo slična starijim karticama iz NVIDIA-ine i ATI-jeve ponude. GF 8800 GTS GPU tako ima manji broj stream procesora, 96 u odnosu na 128 kod GTX-a. Osnovni takt GPU-a je 500 MHz, dok mnogi interni dijelovi kucaju na taktu od 1,2 GHz. Memorijsko sučelje je također skresano s 384 na 320 bita, a ista je stvar s količinom memorije koja iznosti 640 MB.

MSI GeForce 8800 GTS

MSI GeForce 8800 GTS

O MSI-jevoj implementaciji GeForce 8800 GTS-a nema se što previše reći. Radi se o referentoj kartici na čiji je hladnjak naljepljena drugačija naljepnica. Taktovi GPU-a i memorije odgovaraju onima na referentoj kartici. Kao što vidimo, referetni GTS je zapravo smanjena verzija GTX-a. Osim dimenzija, razlika postoji jedino po pitanju PCI-E konektora za napajanje i SLI konektora - implementiran je samo jedan konektor od svake vrste. Hladnjak ima iste kvalitete u odnosu na onaj na GTX-u - vrlo je moćan, ali istovremeno tih.

Bundle nije ništa posebno

Paket opreme je sasvim očekivan i prilično konvencionalan. Osim TV-out kabela i adaptera za PCI-E napajanje i dva DVI/VGA adaptera, tu je još i puna verzija Serious Sama 2 te CD s CyberLinkovim aplikacijama Power2Cinema i Power2Go.

BFG GeForce 8800 GTS

BFG-ev GTS izgleda mrvicu "opasnije"

BFG-ev 8800 GTS nam priča jednaku priču kao MSI-jev primjerak. Ponovo je riječ o referentnoj kartici koja je modificirana naljepnica i tu priča praktički staje. Tvornički taktovi su također jednaki referentom modelu. Premda nam BFG-ev GTS izgleda bolje zbog agresivnijeg logoa, kada je kartica instalirana u računalo ionako ga nećemo vidjeti.

Majica s BFG-evim logom je prilično zanimljiv dodatak

Što se pak opreme tiče, BFG je jedan od onih proizvođača koji idu svojim putem. Tako bundlanih igara nema, no tu je cool crni T-shirt s BFG-em logom koji će vlasniku omogućiti da bude glavni baja u kvartu. Zanimljiv dodatak su također i teflonske podloge za miša, no nismo ih mogli isprobati pa nećemo komentirati koliko je ovaj dodatak zapravo dobar. Ostatak opreme je standardan - adapteri za napajanje i DVI izlaze, kabel za TV-out i CD s driverima.

Test sistem :: Hardware
Platforme

Asus P5N32-SLI Premium

Procesor(i)

Intel Core 2 X6800

Memorija

2 x 1024 MB DDR2 800 Corsair

Grafička kartica

ATI Radeon X1900 XTX 512 MB

Driveri:: Catalyst 6.11

nVidia GeForce 7950 GX2

Driveri:: 93.71

nVidia GeForce 8800 GTX

MSI GeForce 8800 GTS

BFG GeForce 8800 GTS

Driveri:: ForceWare 97.02

Muzička kartica CL Audigy Player
SATA Kontroler

nForce 590 SLI Intel Edition

Hard disk(ovi)

Seagate Barracuda 7200.7 160 GB SATA

Optički pogon

Pioner DVR-106

 

Testni sistem :: Software
OS

Windows XP Professional

Service Pack SP2
Chipset datoteke nForce 9.53
DirectX verzija 9.0c
3DMark06 v1.0.2, default
X3 Rolling thunder demo
F.E.A.R. v1.04, max. details
Farcry v1.4, high details
TrackMania Nations High image quality
Call of Duty 2 v1.2, custom PCE demo, all max.
Serious Sam 2 v1.068, Greendale demo, all max
HL2: Lost Coast max. details, HDR on
Quake IV v1.2, max. details, id_demo001 net timedemo
Pacific Fighters v4.02, perfect land details

Testna konfiguracija za nove NVIDIA-ine kartice morala je biti zvijer pa je baza sistema Intelov Core 2 X6800 procesor u kombinaciji s dva gigabajta memorije. GeForceu 8800 GTX i GTS suprotstavili smo staru perjanicu NVIDIA-ine ponude, GeForce 7950 GX2, te trenutno najbrži Radeon - model X1950 XTX. Premda NVIDIA za testiranje novih kartica preporuča korištenje monitora visoke HD rezolucije, nama je nabavka takvog monitora trenutno ipak malo previsoka investicija. Testiranje smo izveli na 17-inčnom CRT monitoru s maksimalnom rezolucijom 1600x1200, no vjerujemo da većina čitatelja ovog članka niti ne rabi rezolucije koju su više od navedene.

Što se pak drivera tiče, stari i novi GeForceovi rabe potpuno drukčije verzije. Na karticama nove generacije više nije moguće rabiti staru verziju Control Panela već samo novu verziju koja je dizajnirana za Windows Vista. Novi Control Panel je kompliciranije koristiti ako ste iskusniji korisnik, a posebice ako ste navikli na staru verziju. Uz to, neke mogućnosti koje su bile automatski ponuđene sa starim Control Panelom, sada nije moguće koristiti bez instaliranja nTunea. Čak i nakon instaliranja nTunea neke stvari ne funkcioniraju kako treba, npr. praćenje temperature grafičke kartice. Sve u svemu se nadamo da će s budućim revizijama drivera ovi problemi biti riješeni jer zaista iritiraju.

Što se tiče problema s testnim aplikacijama, jedina crna ovca bio je Farcry. Igra je nedavno dobila novu zakrpu, verzija 1.4, no ipak smo naletjeli na probleme s GeForce 8 karticama. Uključivanje HDR-a u kombinaciji s AA algoritmom bi rezultiralo korupcijom prikaza, premda je Serious Sam 2 sasvim normalno radio s istim postavkama. Da li je problem do same igre ili pak do drivera nismo uspjeli saznati, no od oka bi rekli da je stvar ipak u NVIDIA-ji.

Novi driveri donijeli su i neke novosti što se tiče konfiguracije postavki 3D prikaza. Tako je automatski uključena korekcija gamme kod korištenja AA algoritama. Također je promijenjen način uključivanja AA postavki. Prije je bilo moguće forsirati isključenje AA, forsirati pojedine postavke kvalitete ili pak prepustiti konfiguraciju aplikaciji. Sada je pak dodan novi Enhanced mod s kojim se aplikaciji prepušta uključivanje odnosno isključivanje AA algoritma, no kvaliteta algoritma se diktira iz NVIDIA Control Panela.

Što se pak tiče postavki korištenih za testiranje, na NVIDIA-inim karticama smo rabili High Quality mod dok smo kod Radeona koristili High Quality AF algoritam.

Zagrijavanje

Prije nego što se bacimo na testiranje performansi, pogledajmo kako se hladnjaci na testiranim karticama nose s toplinom generiranom od strane GPU-a i memorije.

Grijanje

Idle (°C)
Radeon X1950 XTX
51
  
GeForce 8800 GTS
60
  
GeForce 8800 GTX
68
  
GeForce 7950 GX2
70
  
015304560758
6
 
Stress (°C)
Radeon X1950 XTX
61
  
GeForce 8800 GTS
71
  
GeForce 8800 GTX
80
  
GeForce 7950 GX2
85
  
015304560758
6
 

Temperaturna očitanja izvedena su preko drivera grafičke kartice, NVIDIA Control Panela odnosno Catalyst Control Panela. Najbolji posao obavlja hladnjak Radeonu, a najgori na GeForceu 7950 GX2. Premda GeForce 8800 GTX ima energetski najgladniji GPU i najviše memorije, hladnjak obavlja izvrstan posao. Smanjen takt GPU-a, skresani broj SP-ova te manja količina memorije osigurali su modelu GTS osjetno niže zagrijavanje.

3DMark06

Score
GeForce 8800 GTX
10630
  
GeForce 8800 GTS
8667
  
GeForce 7950 GX2
8270
  
Radeon X1950 XTX
6648
  
0200040006000800010000107
00
 
SM2.0 Score - GT1
GeForce 8800 GTX
40,244
  
GeForce 8800 GTS
30,674
  
GeForce 7950 GX2
28,702
  
Radeon X1950 XTX
19,874
  
0 816243240485
5
 
SM2.0 Score - GT2
GeForce 8800 GTX
39,994
  
GeForce 8800 GTS
31,44
  
GeForce 7950 GX2
31,027
  
Radeon X1950 XTX
22,491
  
0 816243240485
5
 
HDR/SM 3.0 Score - HDR1
GeForce 8800 GTX
45,327
  
GeForce 8800 GTS
33,999
  
GeForce 7950 GX2
30,326
  
Radeon X1950 XTX
27,344
  
0 816243240485
5
 
HDR/SM 3.0 Score - HDR2
GeForce 8800 GTX
52,83
  
GeForce 8800 GTS
40,59
  
GeForce 7950 GX2
38,239
  
Radeon X1950 XTX
28,887
  
0 816243240485
5
 
Fill Rate - Single-Texturing
GeForce 7950 GX2
9764,916
  
GeForce 8800 GTX
6931,833
  
Radeon X1950 XTX
6135,552
  
GeForce 8800 GTS
5152,553
  
02000400060008000100
00
 
Fill Rate - Multi-Texturing
GeForce 7950 GX2
23316,36
  
GeForce 8800 GTX
17666,85
  
GeForce 8800 GTS
11759,14
  
Radeon X1950 XTX
10337,46
  
045009000135001800022500240
00
 
Pixel Shader
GeForce 8800 GTX
445,611
  
GeForce 7950 GX2
395,381
  
GeForce 8800 GTS
302,279
  
Radeon X1950 XTX
278,172
  
08016024032040045
0
 
Vertex Shader - Simple
GeForce 7950 GX2
255,968
  
GeForce 8800 GTX
239,54
  
GeForce 8800 GTS
213,43
  
Radeon X1950 XTX
186,235
  
05010015020025026
0
 
Vertex Shader - Complex
GeForce 8800 GTX
108,513
  
GeForce 8800 GTS
96,552
  
GeForce 7950 GX2
93,799
  
Radeon X1950 XTX
61,893
  
020