Nvidia GeForce GTX480 – brza i vruća

Datum objave 30.03.2010 - Krešimir Matanović

GF100 arhitektura

Pred vama je Nvidijin najnoviji GPU kodnog naziva GF100. Promjena je to u odnosu na dosadašnju nomenklaturu, na koju se eto opet moramo privikavati. GF100 je čip zasnovan na Fermi arhitekturi, koja implementira hardversku DirectX 11 podršku što uključuje teselaciju i DirectCompute. U odnosu na prethodnu arhitekturu poboljšana je i "compute" arhitektura koja podržava efekte kao što su raytracing, OIT (order-independent transparency) i simulacije fluida. Treći je to Nvidijin GPU Computing proizvod, nakon G80 i GT200.

Ovaj se mega čip baš kao i AMD-ovi Cypressi proizvodi u Tajvanskom TSMC-u u 40nm prizvodnom procesu. TSMC je kao što znamo imao probleme sa yieldom zbog čega je AMD imao problema sa isporukom dovoljne količine kartica na tržište, a to se je svakako odrazilo i na proizvodnju GF100 čipa. S jedne strane imate tvornicu sa problemima u proizvodnji, a sa druge golemi čip od 3 milijarde tranzistora koji ta ista tvornica treba proizvesti. Problemi i kašnjenja su neminovni. No, nije tu TSMC jedini krivac, svakako im je lakše bilo proizvesti Cypress koji ima 2.15 milijarde, nego ovaj, gotovo 50% veći. Nvidija je jednostavno željela previše. GF100 u tih svojih 3 milijarde tranzistora i na preko 500 mm2 površine broji čak 480 stream procesora što je duplo više nego na prethodnom GT200 čipu. Teksturnih i filter jedinica ima svakih po 60 (smanjenje od po 20 u odnosu na GT200), a render back-endova je 48 što je za 16 više nego na GT200. Oni koji prate razvoj Fermi arhitekture sjetiti će se kako puni Fermi ima 512 stream procesora, odnosno 4x16x32 strukturu. Vjerojatno zbog problema u proizvodnji taj je broj za GTX480 smanjen, ali nije isključeno da se u budućnosti takav čip ne pojavi u jačem izdanju kartice (GTX490?). GPU ima ukupno šest 64-bitnih memorijskih particija, što znači kako je sučelje 384-bitno. Podržano je maksimalno 6 GB GDDR memorije.

GF100 je baziran na skalabilnoj mreži klastera za procesiranje grafike (u daljnjem tekstu GPC ili Graphics Processing Clusters), Streaming Multiprocessor arhitekturi i memorijskim kontrolerima. Jedan GF100 se sastoji od četiri GPC-a, petnaest SM-a i šest memorijskih kontrolera. Na gornoj slici tj. blok dijagramu GF100 čipa se vidi sučelje, GigaThread Engine, četiri GPC-a, šest memorijskih kontrolera, šest ROP odjeljaka i 768 KB L2 cache memorije. Svaki GPC ima četiri PolyMorph mehanizma. ROP odjeljci su smješteni tik do L2 memorije. Čitava stvar funkcionira tako da GPU naredbe dobivene iz CPU-a čita direktno preko sučelja, a GigaThread Engine dohvaća specifične podatke iz sistemske memorije te ih kopira u video memoriju. Za brzi pristup video memoriji tu su šest 64-bitnih GDDR5 memorijskih kontrolera. GigaThread mehanizam nakon toga kreira i šalje nitne blokove u razne SM-e. Pojedini SM-i raspoređuju ih u grupe od po 32 niti (warp) u CUDA jezgre i ostale izvršne jedinice. GigaThread mehanizam također preraspodjeljuje posao u SM-e kada je dogodi ekspanzija posla u grafičkom cjevovodu, što se dešava nakon faza teselacije i rasterizacije. GF100 kao što smo napisali ima 480 CUDA jezgri, organiziranih kao 15 SM-ova sa po 32 jezgre u svakom SM-u. Svaki SM je visoko paralelizirani mikroprocesor koji je u stanju obraditi do 48 warpova (1536 niti) u svakom trenutku. CUDA jezgra je unificirani procesor koji izvršava vertexe, pixele i izračunava kernele. Unificirana L2 arhitektura priručne memorije brine se o punjenju, spremanju i operacijama sa teksturama. GF100 ima 48 ROP jedinica za pixel blending, antialiasing i atomske memorijske operacije (prikaz višestrukih operacija kao jedne). ROP jedinice su organizirane u šest grupa od po osam jedinica. Za svaku grupu je zadužen jedan 64-bitni memorijski kontroler.

Pojedini GPC, kao dominantni high-end hardverski blok, se sastoji od raster mehanizma i do četiri SM-a. Glavne odlike su mu skalabilni raster mehanizam za podešavanje trokuta, rasterizaciju i Z-cull te skalabilni PolyMorph mehanizam za dohvat vertex značajki i teselaciju. Raster mehanizam se nalazi unutar GPC-a, a PolyMorph mehanizam unutar SM-a. Unutar GPC-a su sve ključne izršne jedinice za grafiku, tj. sve potrebno za procesiranje verteksa, geometrije, rastera, tekstura i piksela. Uz iznimku ROP funkcija, na GPC se može gledati kao na samo održivi GPU. GF100 kao što znamo ima četiri takva GPC-a. Novost u odnosu na prethodne arhitekture je i činjenica da SM ima četiri dedicirane teksturne jedinice, čime je eliminirana potreba za TPC-ima (Texture Procesing Cluster) koji su postojali u G80 i GT200 arhitekturi. Svaki od 16 PolyMorph mehanizama ima svoju dediciranu verteks dohvatnu jedinicu i teselator, štp povećava geometrijske performanse. Četriri paralelna Raster mehanizma dozvoljavaju postaljanje do četiri trokuta po taktu, što u suradnji sa PolyMorph mehanizmom znatno povećava performanse dohavta trokuta, teselacije i rasterizacije. PolyMorph mehanizam ima pet stanja - dohvat verteksa, teselacija, Viewport transformaciju (2-D trokut u kojeg se projicira trodimenzionalna scena), postavljanje atributa te Stream Output (izlaz verteksa prema memorijskom međuspremniku). Rezultati izračuna svake pojedine faze šalju se u SM, gdje se izvršavaju shaderi, te se rezultati ponovno vraćaju u nardenu fazu PolyMorph mehanizma. Nakon što su izvršene sve faze, rezultati se proslijeđuju u Raster mehanizam. GPC predstavlja napredak u arhitekturi cjevovoda geometrije jer teselacija zahtjeva veće performanse trokuta i rasterizacije. Kako bi jednostavnije shvatili dovoljno je napomenuti kako je uz uporebu dediciranog teselatora za svaki SM i Raster mehanizma za svaki GPC, GF100 čip čak osam puta brži od GT200 kada su u pitanju performanse geometrije.

Svaki se SM, kao što smo već spomenuli sastoji od 32 CUDA procesora. Svaki od procesora ima ALU i FPU jedinice sa punim cjevovodima. Prijašnji su GPU-i koristili IEEE 754-1985 floating point aritmetiku, dok Fermi arhitektura donosi novi IEEE 754-2008 floating-point standard, koji donosi FMA instrukcija (fused multiply-add) kako za single tako i za double precision izračune, čime se znatno povećava preciznost izračuna. U GT200, cjelobrojni ALU je bio ograničen na 24-bitnu preciznost za operacije množenja, dok je u Fermiju cjelobrojni ALU 32-bitni, a optimiziran je i za 64-bitne operacije. Svaki SM ima 16 load/store jedinica, čime se adrese izvora i odredišta računaju u 16 niti po taktu. Jedinice za podršku podatke uzimaju ili spremaju u priručnu memoriju ili DRAM. SFU ili jedinice specijalne funkcije izvršavaju transcendetalne instrukcije, ali i instrukcija grafičke interpolacije. Njihova brzina je jedna instrukcija po niti po taktu. Warp Schedulera su ukupno dva po SM-u, a njihov je zadatak paraleliziranje niti u grupe od po 32 (warpove) i slanje po jedne instrukcije iz svakog warpa u grupu od šesnaest jezgri, šesnaest load/store jedinica ili četiri SFU-a. Ugradnjom teksturnih jedinica u SM, povećanjem efikasnosti priručne mamorije i povećanjem takta jedinica postigle su se znatno veće performanse (četiri teksture po taktu). Teksturnih jedinica po SM-u ima četiri a podržano je bilinearno, trilinearno i anisotropic filtriranje. Redizajnom L1 arhitekture priručne memorije tekstura (svaki SM ima 64 KB on-chip memorije koja se može konfigurirati kao 48 KB dijeljene memorije sa 16 KB L1 cache memorije, ili 16 KB dijeljene memorije sa 48 KB L1 cache memorije, ovisno da li izvršava CUDA ili grafičke aplikacije), i korištenjem L2 memorije postignut je tri puta veći kapacitet nego na prethodnoj, GT200 arhitekturi.

GF100 ima ukupno 768 KB unificirane L2 cache memorije koja je zadužena za sve zahtjeve o punjenju, spremanju i operacijama sa teksturama. Hardverska arhitektura priručne memorije posebno pogoduje algoritmima za koje nisu prethodno poznate adrese (fizika, ray tracing, raštrkani podaci). Post processing filteri koji zahtjevaju da višestruki SM-i čitaju iste podatke sada trebaju manje "posjeta" memoriji što u konačnici povećava propusnost. Prednost unificirane cache arhitekture je u njenom boljem iskorištenju, a L2 arhitektura na GF100 zamjenjuje teksturni cache, ROP cache i on-chip FIFO (first-in first-out).

ROP podsistem je redizajniran, pa tako jedna ROP particija sadrži osam ROP jedinica. Svaka ROP jedinica može izbaciti 32-bitni integer piksel po taktu, tj. FP16 piksel za dva odnosno FP32 piksel za četiri takta. Kada je kvaliteta prikaza slike u pitanju, zbog navedenog ima pomaka na bolje. 8xMSAA performanse su se po Nvidijinim riječima znatno poboljšale zbog veće efikasnosti kompresije te dodatnih ROP jedinica. Tu je novi 32xCSAA (Coverage Sampling Antialiasing) mod koji je baziran an osam višestrukih i 24 pokrivna uzorka. CSAA sada podržava i alpha-to-coverage (transparency multisampling) na svim uzorcima, što se odrazilo renderiranju lišća i prozirnih tekstura, učinivši ih glađim. GF100 postiže jednaku AA kvalitetu kako za rubove poligona, tako i za alfa teksture uz minimalni gubitak performansi. Performanse mapiranja sjena su se također podigle, sa hardverski ubrzanim DirectX 11 four-offsetom Gather4.

Nvidijina 3D Vision tehnologija je pristuna i kod ove nove arhitekture, a novost je 3D Vision Surround. Ona omugućava 3D sliku rastegnutu preko tri monitora maksimalne rezolucije 5760x1080 za što će vam biti potrebne dvije GTX400 ili dvije GTX200 kartice u SLI konfiguraciji, tri 3D Vision capable monitora te Nvidijine 3D naočale. Za one koji ne žele igru u 3D okruženju, NVIDIA Surround će omogućavati igru u maksimalno 2560 x 1600 preko monitora koji dijele istu rezoluciju. Nvidija će pripremiti i Bezel Correction NVIDIA 3D Vision Surround koji će kompenzirati razmake nastale zbog okvira monitora. Surround je dakle tehnološki daleko od konkurentskog Eyefinitya, te je jedina prava prednost 3D igranje (za one koji ga vole i podnose).

GeForce GTX480

Nvidija je na Fermi arhitekturi dakle skrojila GF100 čip koji će za početak ugrađivati u lansirane GTX480 i GTX470 kartice. Nama su na test poslali jači model, koji kao što smo rekli broji 480 stream procesora. O tehnikalijama ćemo kasnije više, a sada se osvrnimo na izgled kartice. Prva stvar koja upada u oči jesu četiri toplovodne cijevi koje vire sa gornje strane oklopa (ima ih ukupno 5 al je jedna skrivena ispod oklopa). Po ovome, i specifikacijama lako je zaključiti kako se kartica dosta zagrijava i kako su za efikasno hlađenje potrebne ekstremnije mjere od dosada viđenih na tvorničkim karticama. Kartica je dužine 27 centimetara čime je za oko 1 cm kraća od konkurentske HD5870. Za razliku od nje koja ima plastični prednji oklop, GTX480 ima metalni dio koji je zapravo pokrov hladnjaka GPU-a kojeg možete vidjeti na donjim slikama.

Pri rastavljanju kartice potrebno je najprije skinuti plastični pokrov koji je plastičnim kopčama pričvršćen za veliki heatsink koji pokriva kompletnu karticu, a služi ponajprije za hlađenje memorijskih čipova, i PWM komponenti te kao nosač za ventilator. Nakon toga je potrebno skinuti GPU hladnjak koji je prišvršćen sa četiri vijka te heatsink koji je pričvršćen također sa vijcima. Nakon tih operacija ukazije nam se crni PCB sa vrlo gusto raspoređenim kompunentama. GPU i IHS na njemu su ogromnih dimenzija, svakako puno većih nego što smo navkli kod konkurencije. Tehničke karakteristike GPU-a smo već objasnili u a spomenimo samo kako GTX480 ima 480 stream procesora, 48 ROP jedinica, 768KB L2 cache memorije, 60 teksturnih jedinica, 15 PolyMorph mehanizama i šest 64-bitnih memorijskih kontrolera. Drugi model kojeg Nvidija predstavlja, GTX470 ima 448 stream procesora, 40 ROP jedinica, 640KB L2 cache memorije, 6 teksturnih jedinica i pet 64-bitnih memorijskih kontrolera.

480 procesora u GTX480 kartici kuca na 1401MHz, dok ostatak čipa radi na 700MHz. Kod GTX470 modela te brojke su nešto niže i iznose 1215MHz za stream procesore, te 607MHz za ostatak čipa. GDDR5 memorija koja u slučaju GTX480 kartice komunicira preko 384-bitnog sučelja radi na 924MHz (3.696Gbps), na GTX470 modelu komunicira preko 320-bitne sabirnice te radi na 837MHz (3.348Gbps). Na GTX480 modelu nalazi se 12 GDDR5 memorijskih čipova kapaciteta 128MB, tako da ukupno ima 1536MB memorije, dok je na GTX470 tih čipova 10 za ukupnih 1280MB memorije.

TDP GTX 480 kartice je 250W, dok je sama Nvidija priznala i kako ide malo više u pojedinim vrlo zahtjevnim naslovima. Bez opterećenja potrošnja kartice pada na 47W. GTX470 s druge strane ima TDP od 215W pri opterećenju i 33W bez opterećenja. Na GTX480 kartici se pri minimalnom opterećenju taktovi spuštaju na svega 101MHz za shadere, 50MHz za ostatak GPU-a te memorije na 65.7MHz. GTX480 kartica zahtjeva dodatno napajanje u obliku jednog 8-pinskog i jednog 6-pinskog PCIe Power konektora. Isto toliko je potrebno i HD5970 modelu, dok se HD5870 zadovoljava sa 6 + 6 kombinacijom. Iz ovakvih je specifikacija jasno kako će se obje kartice poprilično grijati i kako im rashladni sistemi moraju biti poprilično sposobni. GPU hladnjak kombinira bakrene toplovodne cijevi koje su u direktnom dodiru sa IHS-om sa tankim aluminijskim listovima kroz koje struji zrak pokretan turbinskim ventilatorom. Čitav hladnjak je poniklan, a na vrhu je aluminijski pokrov koji je vidljiv i sa vanjske strane kartice (služi kao heatsink).

Punom dužinom kartice proteže se aluminijski heatsink koji hladi ostale komponente na PCB-u (memorijske čipove te komponente napajanja). Sa stražnje strane kartice nema metalnog heatsinka kao na ATI karticama. Heatsink služi i kao nosač za Deltin turbinski ventilator koji se u radu vrti između otprilike 1700 i 3700 okretaja u minuti i povuče do 1.8A struje. Sve ovo čini jedan učinkoviti rashladni sistem koji ima vrlo tešku zadaću. U našim testovima će te vidjeti kolike su temperaturne vrijednosti, a za sada ćemo samo reći da su vrlo visoke.

Za razliku od konkurenta, AMD-a, koji koristi DisplayPort izlaze, Nvidija se je odlučila za mini HDMI izlaz te dva DVI-I izlaza. Neobičan potez, s obzirom da se na tržištu pojavljuje se više monitora sa DisplayPortom, a DVI-I se ionako može konvertirati u HDMI. Baš kao i pripadnici prethodne GT200 generacije napravljeni u 40nm proizvodnom procesu i ovaj model ima Nvidijinu VP4 tehnologiju koja podržava H.264, MPEG-2, VC-1 i MPEG-4 ASP formate. DTS-HD i Dolby TrueHD formati nisu podržani, pa su ATI kartice iz HD5xxx serije na tom polju i dalje vodeće. Kartica podržava 3-way SLI i na vrhu su gdje i obično dva SLI konektora. Kao što smo u opisu arhitekture spomenuli, ukoliko želite koristiti Surround ili 3D Vision Surround trebat će vam dvije ovakve kartice. Inače, ove tehnologije će te moći koristiti tek kada izađe 256 revizija upravljačkih programa. Toliko u opisu kartice a sada idemo vidjeti što može.

Test sistem, način testiranja i overclocking

Test sistem:

Test sistem :: Hardware
Platforme

DFI LanParty UT X58-T3eH8

Procesor(i)

Intel Core i7 920 @ 3.1GHz

Memorija

3x 2GB DDR3 Kingmax 1333

Grafičke kartice

Nvidia GeForce GTX480,

Driveri: Forceware 197.17;

Sapphire Radeon HD5890 2GB,

Sapphire Radeon HD5870 1GB,

Driveri: Catalyst 10.3

Muzička kartica

On Board

Hard disk(ovi)

Hitachi 500GB SATA II

DVD-RW HP GSA-H60L

Testni sistem :: Software
OS Windows 7 Ultimate 64-bit
Chipset datoteke

Intel 9.1.0.1007

DirectX verzija 11 (SDK Feb 2010)
Aliens vs. Predator Max. details, DX11
Batman Arkham Assylum

Very High

Battlefield Bad Company 2 Max. details, DX11
Crysis Warhead

v.1.3, Very High, DX10

DiRT 2

v1.1, Maximum details

Far Cry 2

v.1.2, Ultra High, DX10

Heaven Benchmark

Unigine engine, v2.0, DX11

Metro 2033 Max. details, DX11
MS Flight Simulator X Acceleration, DX10 preview
Resident Evil 5 v.1.0, Demo, Max. details, DX10
S.T.A.L.K.E.R. Call of Pripyat Demo, DX11

 

Način testiranja i overclocking

Iako je HD5870 kartica glavni konkurent GTX480, s obzirom da postoji razlika u cijeni u testove smo ubacili i dvoglavo čudovište HD5970. GTX480 je sa 500 USD negdje na pola puta između te dvije kartice pa je zbog objektivnosti testova i u konačnici odnosa cijene i performansi to bilo vrlo bitno. Ne želeći potencijalne kupce zamarati suvišnom brojkama nismo testirali u nižim rezolucijama od 1920x1200, jer to jednostavno nema nikakvog smisla. Prava rezolucija za sve tri uspoređene kartice bi tek bila 2560x1600 no takvog se monitora nismo uspjeli dokopati. Stoga smo većinu testova odradili na 8xAA i 16xAF postavkama. Forsiranje 8xAA postavki se pokazalo kao opcija koja više odgovara Nvidijinoj kartici pa su razlike između HD5970 i GTX480 u pojedinim slučajevima znatno manje nego kod 4xAA. U bateriju testova smo ubacili i podosta novih, DX11 naslova koje je većinom trebalo testirati uz pomoć Fraps-a. Zbog toga, i zbog specifičnog odabira pojedinih nivoa na kojima smo testirali brojke će biti ponešto niže ili više nego što će ih možda neki kupci imati, no kod ovakvog testiranja ionako je najbitnija razlika u performansama, a ne sam broj FPS-a. Testna mašina je već dobro poznata, a za ovu priliku smo samo takt procesora podigli na 3.1GHz kako ne bi bio usko grlo (premda su šanse minimalne s obzirom da je riječ o dovoljno moćnom sistemu).

Overclockirali smo sa EVGA-inim Precision alatom gdje je moguće manipulirati brzinom Shadera i memorije. brzina ostatka GPU-a se podiže sa Shaderima. Kako ne bi imali problema sa pregrijavanjem, ventilator smo podigli na 75% brzine vrtnje kada je poprilično bučan. Rezultati koje smo postigli nisu loši i dokazuju kako ovaj čip ima potencijala i za dalje. Naravno, za efikasno hlađenje i da sve ostane u normalnim razinama buke je potrebno imati nešto moćnije i tiše od tvorničkog hladnjaka. Na kraju svih testova, vidjeti će te tablicu sa naslovom S.T.A.L.K.E.R. u kojoj su vidljivi dobici u performansama.

Rezultati testova - 1.dio

Batman Arkham Asylum

1920x1200 @ 0xAA, Physx -Off (FPS)
Radeon HD5970
210
  
Radeon HD5870
169
  
GeForce GTX480
166
  
 
05511016522
0
 
1920x1200 @ 0xAA, Physx - High (FPS)
GeForce GTX480
74
  
 
02040608
0
 
1920x1200 @ 8xAA, Physx - High (FPS)
GeForce GTX480
62
  
 
0357
0
 

Prva serija testova će biti malo stariji naslovi koji ne podržavaju DirectX 11. Krećemo sa Batmanom u kojem kako znamo možemo koristiti Physix za dodatne efekte ukoliko koristimo Nvidijine kartice. U prvom smo testu Physx isključili i usporedili sve tri kartice. HD5970 je razumljivo znatno brža, a HD5870 u ovome testu za nekoliko FPS-a nadmašuje GTX480. Uključivanjem Physxa framerate drastično pada za više od duplo. Moćne ROP jedinice zaslužne su za malen pad prilikom upotrebe visokog stupnja antialiasinga.

Crysis Warhead

1920x1200 @ 4xAA, 16xAF (MIN. FPS)
GeForce GTX480
33
  
Radeon HD5970
24
  
Radeon HD5870
16
  
 
0102030405
0
 
1920x1200 @ 4xAA, 16xAF (AVG. FPS)
Radeon HD5970
49
  
GeForce GTX480
46
  
Radeon HD5870
37
  
 
0102030405
0
 

Warhead smo podigli na maksimalnu razinu detalja kako bi karticama otežali posao. Framerate nije visok no ionako su odnosi bitni. HD5970 je najbrža, dok HD5870 kaska za oko 25% iza GTX480. Zanimljivo je za primjetiti kao GTX480 ima najviši minimalni broj sličica u sekundi.

Far Cry 2

1920x1200 @ 4xAA, 16xAF (MIN. FPS)
Radeon HD5970
51,83
  
GeForce GTX480
53,38
  
Radeon HD5870
36,99
  
 
030609012
0
 
1920x1200 @ 4xAA, 16xAF (AVG. FPS)
Radeon HD5970
113,55
  
GeForce GTX480
101,77
  
Radeon HD5870
79,69
  
 
030609012
0
 

Slična priča kao i u prethodnom testu. HD5870 ovdje zaostaje oko 27% za GTX480 karticom. Za sada se čini kako je nova Nvidijina kartica znatno moćnija i kako će sa lakoćom preuzeti titulu najbrže single-chip kartice.

Flight Simulator X

1920x1200 @ AA, AF (MIN. FPS)
Radeon HD5970
31
  
GeForce GTX480
26
  
Radeon HD5870
19
  
 
01020304
0
 
1920x1200 @ AA, AF (AVG. FPS)
Radeon HD5970
36,167
  
GeForce GTX480
29,706
  
Radeon HD5870
23,5
  
 
01020304
0
 

Za svoj smo gušt izvrtili jedan snimljeni video u FSX-u i rezulate izmjerili Fraps-om. AA i AF su bili uključeni unutar same igre, na stupanj koji igra sama odredi. HD5870 ponovno zaostaje za oko 27%.

Resident Evil 5

1920x1200 @ 8xAA, 16xAF (AVG. FPS)
Radeon HD5970
122,4
  
GeForce GTX480
106,4
  
Radeon HD5870
93,8
  
 
025507510012
5
 
 

Za kraj DX10 testova tu je Resident Evil 5 u kojem 480-tka HD5870 modelu bježi za oko 13%.

Rezultati testova - 2. dio

 

Aliens vs. Predator

1920x1200 @ 0xAA, 16xAF (MIN. FPS)
GeForce GTX480
54
  
Radeon HD5970
51
  
Radeon HD5870
42
  
 
02040608
0
 
1920x1200 @ 0xAA, 16xAF (AVG. FPS)
GeForce GTX480
79,633
  
Radeon HD5970
75,98
  
Radeon HD5870
62,233
  
 
02040608
0
 

Prvi od DX11 testova smo mjerili Fraps-om s obzirom da nema ugrađeni benchmark. Odabrali smo Survival mod te u Blocku C punih 240 sekundi dočekivali Aliene. Kartice su se dobro uspuhale na ovome naslovu, a GTX480 i HD5970 su stvarale popriličnu buku. HD5870 kasni za oko 22% iza GTX480 kartice.

Battlefield Bad Company 2

1920x1200 @ 4xAA, 16xAF (MIN. FPS)
Radeon HD5970
36
  
GeForce GTX480
33
  
Radeon HD5870
28
  
 
025507510
0
 
1920x1200 @ 4xAA, 16xAF (AVG. FPS)
Radeon HD5970
95,67
  
GeForce GTX480
75,92
  
Radeon HD5870
64,53
  
 
025507510
0
 

I ovaj smo naslov Fraps-ali, a HD5870 je u ovome slučaju za oko 17% sporija od GTX480. Do sada je dakle Nvidijina kartica u svim testovima brža.

DiRT 2

1920x1200 @ 4xAA, 16xAF (MIN. FPS)
Radeon HD5970
73,6
  
Radeon HD5870
62,25
  
GeForce GTX480
61,8
  
 
030609
0
 
1920x1200 @ 4xAA, 16xAF (AVG. FPS)
Radeon HD5970
88,2
  
GeForce GTX480
75,3
  
Radeon HD5870
69,2
  
 
030609
0
 

Ovaj naslov ima ugrađen benchmark pa smo ga iskoristili. Tu se HD5870 za sada najbolje drži te gubi za samo 8%.

Heaven Benchmark

1920x1200 @ 4xAA, 16xAF, No Tesselation (FPS)
Radeon HD5970
61,1
  
GeForce GTX480
47,9
  
Radeon HD5870
37,84
  
 
0357
0
 
1920x1200 @ 4xAA, 16xAF, Normal Tesselation (FPS)
Radeon HD5970
42,3
  
GeForce GTX480
37,7
  
Radeon HD5870
20,73
  
 
0102030405
0
 
1920x1200 @ 4xAA, 16xAF, Extreme Tesselation (FPS)
GeForce GTX480
30,1
  
Radeon HD5970
27,6
  
Radeon HD5870
14,21
  
 
0 816243
2
 

Heaven Benchmark u svojoj drugoj verziji donosi stupnjevanu teselaciju koja na Extreme nivou poprilično guši sve kartice. Više "pate" ATI-ce pa po prvi puta imamo situaciju da HD5970 mora pokleknuti ispred GTX480.

Metro 2033

1920x1200 @ 0xAA, 16xAF (MIN. FPS)
Radeon HD5970
24
  
GeForce GTX480
23
  
Radeon HD5870
17
  
 
01020304
0
 
1920x1200 @ 0xAA, 16xAF (AVG. FPS)
Radeon HD5970
34,22
  
GeForce GTX480
29,08
  
Radeon HD5870
22,22
  
 
01020304
0
 

I ovaj smo naslov Fraps-ali, a detalje smo postavili na maksimum. Igra je poprilično zahtjevna pa i bez uklučenog antialiasinga dobro zaguši kartice. Zbog teselacije HD5870 gubi sa 30% zaostatka iza GTX480.

S.T.A.L.K.E.R. Call of Pripyat

1920x1200 @ 4xAA, DX11 (FPS)
Radeon HD5970
67,75
  
GeForce GTX480
54,75
  
Radeon HD5870
49,01
  
 
0357
0
 
1920x1200 @ 4xAA, DX11, SSAO (FPS)
Radeon HD5970
59,25
  
GeForce GTX480
39,25
  
Radeon HD5870
35,13
  
 
020406
0
 
 

Posljednji naslov u ovome testu je S.T.A.L.K.E.R., koji najviše voli brzu HD5970 karticu. HD5870 zaostaje za oko 12% iza GTX480.

Overclocking rezultat, potrošnja i zagrijavanje

S.T.A.L.K.E.R. Call of Pripyat

1920x1200 @ 4xAA, DX11, SSAO (FPS)
GeForce GTX480 @ OC
43
  
GeForce GTX480 @ DEF
39,25
  
 
01122334
4
 

 Dobitak overclockingom je solidnih 10%, no količina buke je jednostavno prevelika da bi se isplatilo. Sa efikasnijim hlađenjem bi se sigurno postiglo još više.

Potrošnja

Idle (W)
Radeon HD5870
155
  
GeForce GTX480
170
  
Radeon HD5970
180
  
 
010020030040050
0
 
Load (W)
Radeon HD5870
335
  
Radeon HD5970
461
  
GeForce GTX480
467
  
 
010020030040050
0
 

Svi testovi do sada su za Nvidijinu karticu bili pozitivni. Sada smo pak došli do dva koja to nikako nisu. Potrošnja ove kartice je stvarno enormna i 20-tak % veće performanse se nikako ne mogu opravdati čak 130W većom potrošnjom u odnosu na HD5870. Kada kartica nije opterećena potrošnja pada i zbog činjenice kako Shaderi tada rade na svega 101MHz, GPU na 50MHz a memorija na 65.7MHz.

Temperature

Idle (°C)
Radeon HD5870
41
  
GeForce GTX480
48
  
Radeon HD5970
58
  
 
025507510
0
 
Load (°C)
Radeon HD5870
85
  
Radeon HD5970
89
  
GeForce GTX480
95
  
 
025507510
0
 
 

Shodno potrošnji i temperature su vrlo visoke. Unatoč moćnom pasivnom rashladnom sistemu, onaj aktivni (ventilator) mora gotovo uvijek raditi prekovremeno. To znači kako se pri iole zahtjevnijem 3D radu zavrti na vrlo veliku brzinu (do 3700 okretaja u minuti) kako bi izbacio veliku količinu topline koju stvara masivni GPU. Temperature pri najvećem opterećenju dosežu i 95°C što je vrlo blizu graničnih 105°C. Ventilator je iznimno bučan, čak nešto bučniji nego na HD5970 modelu, dok onaj u HD5870 radi vrlo tiho u usporedbi sa njima. GTX480 kartica jedostavno vapi za dobrim vodenim blokom, ali i jedva čekamo bilo kakav aftermarket zračni hladnjak kako bi vidjeli može li se ukrotiti ovaj rastrošni čip.

Zaključak - Conclusion

Zaključak

GF100 u GTX480 kartici je definitivno preuzeo vodstvo kao najmoćniji GPU, a pripada mu i titula najkompleksnijeg. AMD-ov Cypress ovdje ipak mora potpisati kapitulaciju i za sada se povući. Po tome pitanju stvari dakle izgledaju lijepo za Nvidiju. No, GF100 ima i svoju mračniju stranu. Preko 3 milijarde tranzistora smještenih na površini od oko 500 kvadratnih milimetara su kao prvo vrlo skupi a kao drugo gutaju enormne količine električne energije. Velika potrošnja za sobom povlači i veliko zagrijavanje, tj. veliku disipaciju topline. Nvidija je to pokušala riješiti velikim hladnjakom za GPU kakav bi sa lakoćom hladio i 6-jezgreni procesor, te vrlo brzim i bučnim turbinskim ventilatorom. Sve bi trebalo biti jasno, sve brojke ste vidjeli a jedino vam nismo mogli dočarati količinu buke. Onaj tko se igrao sa HD5970 karticom će si to otprilike moći dočarati jer je u trenutcima razina buke jednaka pa čak i malo viša. U odnosu na te dvije kartice, glavni 480-tkin konkurent, HD5870 je tih kao bubica jer troši i do 130W manje. HD5870 je i 20 do 25% sporija, no to nije tako drastično jer je framerate u gotovo svim situacijama dovoljno visok. Ono što nam se najviše svidjelo kod GTX480 kartice je gotovo nikakav gubitak performansi u prijelazu sa 4xAA na 8xAA. Tu se Radeoni ipak više muče. Dodatan plus je i Physx jer je u najavi dosta naslova koji ga podržavaju, te 3D Vision za one koji to vole. Surround nažalost nije Eyefinity i tu je ATI u velikoj prednosi.

Toliko o hardverskoj strani, a sada malo o tome kako je ovo nažalost ipak samo "paper launch", kako još par tjedana (ako ne i više) neće biti proizvoda na policama, te kako je ovo još uvijek neisplativ čip za proizvodnju. Znamo da ni ATI još uvijek nije zadovoljan sa količinom dobrih GPU-a na jednom wafferu, a Nvidija ih ima još manje. Dok TSMC ne riješi probleme koje ima sa 40nm proizvodnim procesom do tada će svi patiti - proizvođači jer ne zarađuju, a kupci jer proizvoda na policama nema. Konačna materijalizacija GTX480 /470 kartica je iznimno pozitivna stvar. Konkurencija je zdrava za sve, a pogotovo kupce (svjedoci smo podizanja cijena od strane AMD-a - djelomično zato jer do sada nije bilo konkurencije, a djelomično jer se ne proizvodi dovoljna količina čipova). Zbog toga jedino, što preostaje je nada da će TSMC svoje probleme vrlo brzo riješiti

Preporučena cijena GTX470 modela je 349 USD, a GTX480 499USD. Kada dođu kod nas ti će se iznosi pretvoriti u Eure, a možda će biti i nešto skuplje. Što se isplativosti nabavke tiče i naše konačne preporuke ona odlazi na stranu HD5870. Naravno, ukoliko kupujete karticu te klase. GTX480 je brža i tu nema sumnje (pogotovo sa uključenom teselacijom), ima Physx i sada već pristojnu količinu CUDA aplikacija no 100 USD veća preporučena cijena, veliko zagrijavanje, velika potrošnja i velika količina buke koju proizvodi joj jednostavno ne idu u prilog. Za one koji su i dalje neodlučni savjet da pričekaju još koji mjesec i rasplet situacije.

 

Conclusion

GF100 chip in the GTX480 card has definitely taken the lead as the most powerful GPU, and the title of the most complex is also in the pocket. Cypress chips have to sign a capitulation for now. So far things look nice for Nvidia. However, GF100 has its dark side. Over 3 billion transistors placed on an area of about 500 square millimeters are very expensive and consume enormous amounts of electricity. Large consumption entails large heat dissipation. Nvidia has tried to solve that problem with a large GPU cooler that would easily cool a 6-core processor, and with a very fast and noisy ventilator. During heavy load it creates a large amount of noise, which is sometimes unbearable. Anyone who has played with the HD5970 card can imagine how loud it is. In relation to these two cards, HD5870 is really quiet because it consumes up to 130W or less. HD5870 is 20 to 25% slower, but it's not as drastic because the frame rate in almost all situations is sufficiently high. What we are most pleased with GTX480 card however, is almost no performance drop when you move from 4xAA to 8xAA. This is move is more troubling for Radeons. Another plus is the PhysX since a lot of upcoming titles support it and 3D Vision for those who love it. Surround unfortunately is not Eyefinity and the AMD is in great advantage there.

This was, and is unfortunately still only a "paper launch", as it will pass couple of weeks (if not more) when products hit the shelves. Another downside is that this is still an unprofitable chip. We know that AMD still not satisfied with the yield, and we can only imagine how Nvidia is. Until TSMC doesn`t solve its manufacturing problems everyone will suffer - Nvidia won`t make any money and customers won`t have enough products to buy. The materialization of the GTX480/470 cards is of course extremely positive thing. Competition is healthy for everyone, especially customers (we are witnessing a price raise by AMD - partly because there hasn`t been a competition to fight with, and partly because TSMC isn`t producing enough chips). Therefore, the only thing left to do is hope that TSMC solves it`s problems quickly.

Suggested price for the GTX470 model is 349 USD and 499USD for the GTX480. In Croatia this will convert in the same amount of €, and maybe even more in the first period. So, if you’re in the market for DX11 card in this class our recommendations goes to the HD5870. GTX480 is faster and there is no doubt (especially with tessellation enabled), has PhysX and now a fair amount of CUDA applications, but 100 USD higher recommended price, high heat dissipation, high consumption and a large amount of noise, is just not going in its favor. For those who are still undecided we recommend to wait a few months and the outcome of the situation.