ATI Radeon X1900 serija
By : Denis Arunović

Već smo i prije izlaska ATI-jeve serije X1800 slušali glasine o nasljedniku arhitekture koji bi trebao pomesti sva konkurentska rješenja. nVidijin odgovor na najjače modele X1800 serije, GeForce 7800 GTX 512, dao je ATI-ju još jedan dobar razlog da se požuri s predstavljanjem još novijih i bržih kartica. Kanadski je proizvođač to prije nekoliko dana i učinio, plasirajući na tržište kartice bazirane na čipovima razvijanim pod kodnim imenom R580 odnosno produkcijskim imenom X1900.

Novi je čip proizveden u jednakim pogonim i jednakom tehnologijom kao i njegov prethodnik - u tajvanskom TSMC-u, 90-nanometarskim procesom pod imenom Nexsys. Premda je osnovna arhitektura ostala je jednak u odnosu na R520, uvelike proširen je broj pixel shaderskih procesora pa ih R580 u odnosu na stariji čip ima čak tri puta više - 48 naprema 16. Unatoč proširenju broja jedinica odgovornih za matematičke operacije, nije se povećala količina jedinica za adresiranje tekstura, niti količina vertex shaderskih jedinica.

Shematski dijagram čipa R580 (pojednostavljen)

Konkretno, ovo znači da je ATI poprilično povećao matematičke mogućnosti čipa, računajući na to da će se u budućnosti pojaviti mnogo naslova koji će moći iskoristiti punu snagu njegovih pixel shaderskih procesora. Omjer pixel shaderskih jedinica u odnosu na one teksturne na R580 iznosi 3:1, što je mnogo drugačiji omjer od onog u čipu R520, gdje je broj pixel shaderskih procesora i teksturnih jedinica jednak. ATI ovo objašnjava činjenicom da mogućnosti samog grafičkog procesora rastu mnogo brže od brzine memorije. S obzirom da su jedinice za teksturiranje ponajviše ovisne o mogućnostima memorijskog podsistema, ATI kaže da nema smisla dodavati nove teksturne jednice, ako im nije moguće ponuditi i adekvatno brzu memoriju. Uz to, prema ATI-jevim analizama, trenutni i nadolazeći naslovi se mnogo više oslanjaju na aritmetičke shaderske operacije nego na shaderske operacije s teksturama, pa je stoga u moderan grafički procesor fokusirati na aritmetičke, a ne teksturne operacije. Dodatno iskorištavanje pixel shaderskih jedinica moguće je ostvariti proceduralnim teskturiranjem odnosno korištenjem aritmetičkih jedinica za generiranja tekstura na bazi vanjskih parametara.

Sličnu arhitekturu ima i Radeon X1600 odnosno čip R530, u kojem se nalazi 12 pixel shaderskih cjevovoda unutar samo jednog klasičnog "quada", te četiri teksturne jednice koje opslužuju svih 12 cjevovoda. Valja napomenuti kako ni kod R580, ni kod R530, ne možemo govoriti o klasičnim cjevovodima budući da se pod klasičnim cjevovodom podrazumijeva pixel shaderski cjevovod s vlastitiom teksturnom jedinicom. Uz to, u klasičnom cjevovodu pikseli se obrađuju po principu FIFO (First In First Out), dok na R580 i R530 (zapravo, na svim čipovima iz serije R5xx), pikseli mogu biti "izvađeni" iz cjevovoda, relevantne vrijednosti spremljene u registar, a cjevovod uporabljen za obradu nekog drugog piksela.

Arhitektura ALU-a za obradu piksela ostala je jednaka u odnosu na R520

Kad smo već kod "švrljanja" piksela po čipu, moramo se pozabaviti i mogućnostima thread dispatch procesora koji je odgovoran za avanture veselih piksela. Premda bi temeljitiji čitatelji po priloženom shematskom prikazu arhitekture R580 mogli zaključiti da R580 ima 12 thread dispatch procesora, to nije istina (shema čipa je dosta pojednostavljena) - i dalje su ih četiri, kao na R520. To znači da je unatoč trostrukom povećanju aritmetičkih jedinica, broj maksimalnih threadova i dalje ograničen na 512, odnosno 128 po thread dispatch procesoru. S obzirom da je pojedini dispatch procesor vezan uz po tri quada (12 pixel shaderskih procesora), čineći tako jednu pixel procesorsku jezgru, jasno je da je najmanja razina granularnosti pixel shaderskih procesora 12. Tako je recimo Radeon X1600 baziran na samo jednoj ovakvoj pixel procesorskoj jezgi.

Prije nego što se pozabavimo zadnjim bitnim novim featurom čipa R580, metodom Fetch4, valja spomenuti još jednu brojku - dvostruko povećanje cache memorije namijenjene računanju hirerahijskog Z-a. Dodatna memorija je tu, kaže ATI, da bi se povećale performanse u super-visokim rezolucijama (1920x1200, 2048x1536, 2560x1600) kojima se korisnici sve više služi. S obzirom na cijenu monitora koji mogu podržati ovakve rezolucije, vjerojujemo da mnogim korisnicima ovaj feature neće biti toliko koristan koliko ATI pretpostavlja.

Shematski prikaz metode Fetch4

Posljednja novost novog čipa je implementacija tehnike dohvata sampleova jednokanalnih tekstura pod imenom Fetch4. Dohvat sampleova za filtriranje preko standarnih DirectX rutina zahtijeva dohvaćanje četvekomponente vrijednosti (R, G, B kanal i Alpha kanal odnosno prozirnost) nekoliko puta te izračun potrebnih informacija preko pixel shadera korištenjem vrijednosti dobivenih dohvatom. Jedna od čestih primjena ovakvog algoritma je sjenčanje metodom shadow mappinga gdje je rubovi sjenki bez filitriranja izgledaju grubo, nerealno u odnosu na pravu stvar. Meke sjenke (famozni Soft Shadows) u većini se slučajeva dobijaju filtriranjem shadow mape gdje u igru ulozi Fetch4. Umjesto da se radi klasični dohvat četverokanalnog samplea i tako više puta, Fetch4 u jednom prolazu dohvaća sve četiri vrijednosti budući da "zna" da radi s jednokanalnom teksturom - shadow mapom. U mjesta predviđena za R, G, B i A vrijednosti spremaju se vrijednosti sva četiri dohvaćena jednokanalna teksela te ih se u jednom prolazu isporučuje pixel shaderima na obradu.

Ono što je zanimljivo u cijeloj priči je to što nVidijin hardver već duže vrijeme podržava metodu pod imenom PCF (Percentage Closer Filtering) koja mnogo efikasnije odrađuje cijelu stvar. PCF je originalno maslo Silicon Graphicsa, a nVidija je jednim prilično starim ugovorom dobila mogućnost upotrebljavati ga tako da je PCF metoda korištena i na vrlo starim rješenjima ove firme, kao što je npr. grafički procesor u originalnom XBoxu. S obzirom da je PCF pod licencom, ostali ga proizvođači grafičkih procesora, a između ostalih i ATI, nisu smjeli koristiti u svojim rješenjima. PCF također dohvaća četiri texela istovremeno iz jednokanalne teksture, no za dobijanje filtrirane vrijednosti nije potrebno rabiti pixel shadere - sve se računanje odvija već u sampleru tekstura. Za svaki se teksel računa binarna vrijednost (1 ako je teksel u sjeni, 0 ako nije) te se iz četiri ovakve vrijednosti računa postotni gradijent sjenčenja (0, 0.25, 0.5, 0.75 i 1.0). Ako su potrebni finiji gradijenti, sampliranje se jednostavno radi više puta.

Premda Fetch4 i PCF služi za jednake stvari, pri kodiranju se ove metode ne implementiraju jednako tako bez dodatnog truda programera Fetch4 neće rezultirati ubrzanjem performansi (s obzirom na starost PCF metode, pretpostavljamo da je ona već implementirana u gotovo svim igrama koje bi je mogle iskorištavati).

Sve u svemu, Fetch4 je zgodna metoda s kojom je ATI ponovo izmislio "toplu vodu". Premda je ovako nešto bilo nužno s obzirom da nemaju licencu na PCF, tek treba vidjeti koliko će programeri Fetch4 zaista rabiti. Premda nam je na test iz ATI-ja pristigao cijeli Crossfire sistem s dvije X1900 kartice, mi smo se odlučili fokusirati na testiranje model najjačeg model X1900 XTX, dok smo pregled Crossfire ostavili za kraj članka. Naime, premda Crossfire možda zvuči opako, držimo da se, kao i u slučaju SLI-ja, ne radi o nekakvoj revolucionarnoj tehnologiji pa mu stoga i ne pridajemo posebnu pažnju.

Braco i seka - X1900 XTX gore, X1800 XT dole

Kao što je moguće vidjet na priloženim fotkama, X1900 XTX i X1800 XT su vrlo slične kartice. Jedina vidljiva fizička razlika je pojačan sklop za napajanje kartice koji bi čipu i memoriji trebao osigurati jače napajanje. Kao i u slučaju Radeon X1800 XT, nova kartica je prilično zahtjeva po pitanju potrošnje pa vam ne preporučujemo nabavku ako nemate ili niste spremni nabaviti kvalitetno napajanje od 400 ili više vata.

Gabariti čipa su, kako što je bilo i očekivati s obzirom na arhikturu, porasli, a totalna "zapremina" tranzistora promjenila se za 64 milijuna - 320 na 384 milijuna. R580 čip je isto tako proizveden 90-nanometarskim procesom tvrtke TSMC pod imenom Nexsys. Na modelu X1900 XTX također je ugrađena nešto brža, 1.1-nanosekundna memorija GDDR3 kako bi se akomodirao viši radni takt.

X1900 XTX (gore) ima pojačan sklop za napajanje

Hlađenje je također ostalo jednako, ali smo ovaj put s njim mnogo zadovoljniji. Naime, naš testni X1900 XTX imao je sređen power management pa su driveri u 2D-u spuštali radni takt i napon memorije i grafičke jezgre. Također je dobro postavljen algoritam prilagodbe brzine ventilatora zavisno o zagrijavanju kartice pa nam se nije događalo da ventilator bez razloga poludi usred Windowsa kao što smo iskusili na seriji X1800 (na referentnim karticama). Sve je ovo rezultiralo činjenicom da je kartica praktički nečujna tijekom rada u 2D aplikacijama. Naravno, ovo se mijenja nakon ulaska u 3D, no buka je podnošljiva, barem za korisnike koji ne inzistiraju na ekstremno tihom računalu.

Premda je riječ o referentnoj kartici, implementiran je power management

Takt jezgre Takt memorije Količina memorije Preporučena cijena
Radeon X1900 XTX
650 MHz
1550 MHz DDR
512 MB
649 USD
Radeon X1900 XT
625 MHz
1450 MHz DDR
512 MB
549 USD
Radeon X1900 Xfire
625 MHz
1450 MHz DDR
512 MB
599 USD

Što se tiče različitih modela X19000 serije, ATI ih je izbacio tri, ne računajući model All-in-Wonder s integriranom TV karticom. Najjači model je XTX koji zamjenjuje od prije poznati Platinum Edition brand. Čini se da ATI stari brand ne želi više spominjati radi lošeg publiciteta koji se veže uz njega budući da Platinum Edition kartice nisu bile poznate po dostupnosti na tržištu. XTX u odnosu na slabije modele ima nešto brži takt grafičkog procesora i memorije, ali to je ujedno i jedina razlika, ako zanemarimo nemalu razliku u cijeni od čak 100 USD. Nešto jeftiniji modeli su X1900 XT i X1900 Crossfire koji su zapravo identični proizvodi s tom razlikom da Crossfire kartica na sebi ima i kompozicijski čip koji joj omogućava da prima signal od druge X1k kartice i kombinira ga sa svojim što dovodi do drastično većih grafičkih performansi.

Prije nego što se bacimo na testni sistem i same testove, moramo pohvaliti dostupnost novih kartica na tržištu. Premda je ATI s dostupnošću prije imao problema, čini se da su naučili iz svojih grešaka. Tako je tvrtka prije lansiranja X1900 serije skupila solidnu zalihu čipova te ih dostavila svojim partnerima. Rezultat svega je to što je X1900 kartice već moguće kupiti u hrvatiskim trgovinama, a nama su ponuđeni i prvi testni primjerci kartica od ATI-jevih partnera.
Test sistem :: Hardware
Platforme

Albatron K8 SLI

Procesor(i)

Athlon 64 FX-57

Memorija

2 x 512 MB Corsair DDR400 @ CAS 2-2-2-5, Command Rate 1T

Grafička kartica

ATI Radeon X1900 XTX 512 MB

ATI Radeon X1800 XT 512 MB

Driveri:: Catalyst X1900 release beta

nVidia GeForce 7800 GTX 512

Driveri:: ForceWare 81.98

Muzička kartica CL Audigy Player
SATA Kontroler nForce4 SLI
Hard disk(ovi)

Seagate Barracuda 7200.7 160 GB SATA

Optički pogon

Pioner DVR-106

 

Testni sistem :: Software
OS

Windows XP Professional

Service Pack SP2
Chipset datoteke nForce 6.70
DirectX verzija 9.0c
3DMark 2005 v1.20, 1600x1200
X3 Rolling thuder demo
F.E.A.R. v1.02, soft shadows off, max. details
Call of Duty 2 v1.01 beta, custom PCE demo, all max.
Serious Sam 2 Greendale demo, all max
HL2: Lost Coast prerelease, max. details, HDR on
SC3: Chaos Theory v1.04, lighthouse demo
Battlefield 2 Guru3D demo, max. details
Quake IV v1.05 beta, max. details, custom PCE demo
Chronicles of Riddick v1.1, sodini demo, PS2.0 path
Warhammer 40k: Dawn of War v1.4, all max, FRAPS
World of Warcraft v1.91, all max, FRAPS

Za potrebe ovog testa nabavili smo kremu AMD-ove erfere procesora s jednom jezgrom, Athlon 64 FX-57. S obzirom na kategoriju grafičkih kartica koje smo testirali, ovaj procesor je bio nužan kako bismo im dali "mjesta" da se razmašu. Unatoč tome što je u igri ovako brz i skup procesor, prema rezultatima testova nije teško zaključiti da bi testiranim grafičkim karticama dobro došao i osjetno brži procesor. Problem je što takvog na tržištu još uvijek nema.

X1900 XTX smo usporedili sa najjačom ATI-jevom karticom iz prethodne generacije, Radeonom X1800 XT, dok je nVidijine boje branio, tko drugi nego GeForce 7800 GTX 512.

Ako ste bacili pogled na tablicu s testnim softverom, vjerojatno ste primjetili da su neke stvari promijenjene. Tako su Call of Duty 2 i Quake IV osjveženi novim beta verzijama zakrpi, stari X2 smo zamijenili s novoizašlim X-om 3, a na kraju smo bateriji testova dodali i Warhammer 40k: Dawn of War te World of Wacraft. Razlog dodavanje novih igara je vrlo jednostavan - smatramo da u našem testnom arsenalu rabimo previše FPS igara.

Oni koji detaljnije proučavaju testove sigurno će primjetiti da ponovo nismo testiali s igrom Pacific Fighters. Razlog tome su zavrzlame oko kartica na kojima smo vršili testiranje (izuzetno kratko vrijeme dostupno za testiranje + kašnjenje povratka kartica iz drugih medija). Iz istog razloga u ovom dijelu testa nećete vidjeti rezultate 3DMarka 2006 kojeg smo uspjeli uporabiti samo dok smo testirali Crossfire.
3DMark 2005

Score
X1900 XTX
9402
  
7800 GTX 512
7381
  
X1800 XT
6684
  
015003000450060007500900095
00
 
GT 1 (fps)
X1900 XTX
42,7
  
7800 GTX 512
32,6
  
X1800 XT
27,8
  
0 8162432404
6
 
GT 2 (fps)
X1900 XTX
27,3
  
7800 GTX 512
21,7
  
X1800 XT
21
  
0 8162432404
6
 
GT 3 (fps)
X1900 XTX
45,6
  
7800 GTX 512
36,4
  
X1800 XT
32,7
  
0 8162432404
6
 

Kao i uvijek, počinjemo sa sintetičkim testovima, konkretno već sada zastarjelim 3DMarkom 2005. X1900 XTX u ovom testu ima potpunu dominaciju, kao što se moglo i očekivati s obzirom na količinu pixel shadera u njenoj jezgri. Na drugom mjestu nalazi se GeForce 7800 GTX 512, tek nešto iznad Radeona X1800 XT. Ako ovakve performanse budemo vidjeli i u realnim testovima, X1900 je zasigurno pun pogodak.

X3 Rolling Thunder

1600x1200 @ 4xAA + 16xAF
X1900 XTX
56,3
  
X1800 XT
48,87
  
7800 GTX 512
48,32
  
010203040505
8
 

Nastavljamo s jednim od novih testova iz našeg arsenala, ali i prilično novim naslovom - X3 Reunion. Ako se možda bunite zašto X3 nazivamo i Reunion i Rolling Thunder, eto i kratkog objašnjenja - Rolling Thunder je ime demoa dok je Reunion naziv same igre. X3 je SM3.0 igra i kao takva pokazuje moć nove ATI-jeve arhitekture. Dvije su starije kartice podjednake u performansama, što nije ni čudno s obzirom na to da je GTX 512 izdan kao odgovor na Radeon X1800 XT.

HL 2 Lost Coast

1280x1024 @ 4xAA + 16xAF
7800 GTX 512
76,17
  
X1900 XTX
69,09
  
X1800 XT
58,75
  
015304560757
8
 
1600x1200 @ 4xAA + 16xAF
7800 GTX 512
60,16
  
X1900 XTX
51,07
  
X1800 XT
43,43
  
015304560757
8
 

Tehnološki demo Lost Coast donio je popularnom Half Lifeu 2 dobrodošli facelifting po pitanju grafike. S obzirom da ovaj ogledni demo ima implementiranu jednu vrstu HDR osvjetljena koja radi u kombinaciji s AA algoritmima, ovaj smo feature rabili pri testiranju. Kao što vidimo, rezultati su za ATI poprilično neugodni budući da su obje kartice na kraju grafikona. Nažalost, nismo imali vremena provjeriti da li bi jednak poredak dobili nakon isključivanja HDR-a.
Call of Duty 2

1280x1024 @ 4xAA + 16xAF
X1900 XTX
43,5
  
X1800 XT
43,2
  
7800 GTX 512
42
  
0 8162432404
5
 
1600x1200 @ 4xAA + 16xAF
X1900 XTX
35,1
  
X1800 XT
33,6
  
7800 GTX 512
33
  
0 8162432404
5
 

Vrlo popularna igra Call of Duty 2 nije nam dala nekakve rezultate za pamćenje. Dva su objašnjenja ovakvih rezultata - ili je COD2 izuzetno procesorski ovisan (u što sumnjamo) ili engine igre mnogo više rabi jedinice za teksturiranje nego što je ATI predvidio. Kao što znamo iz uvoda, premda X1900 XTX ima tri puta više shaderskih jedinica, i dalje ima jednak broj jedinica za teksturiranje kao Radeon X1800 XT. Malenu prednost ATI-jeve najnovije kartice možemo pripisati nešto višem radnom taktu u odnosu na model X1800 XT, a ne povećanom broju pixel shaderskih jedinica.

F.E.A.R.

1280x960 @ 4xAA + 16x AF
X1900 XTX
70
  
X1800 XT
57
  
7800 GTX 512
51
  
7800 GTX 512 min.
32
  
X1900 XTX min.
31
  
X1800 XT min.
30
  
012243648607
2
 
1600x1200 @ 4xAA + 16xAF
X1900 XTX
52
  
X1800 XT
40
  
7800 GTX 512
35
  
X1900 XTX min.
25
  
X1800 XT min.
23
  
7800 GTX 512 min.
19
  
012243648607
2
 

Kod "straha" ponovo vidimo da nova ATI-jeva generacija kartica ima što pokazati ako je riječ o kodu koji joj odgovara. U ovom naslovu čak i X1800 XT nadjačava nVidijinu perjanicu, dok X1900 XTX uz pomoć svojih brojnih shaderskih procesora krši sve pred sobom. Ako nadolazeće igre budu stvarane na sličan način kao F.E.A.R., novi Radeoni doista imaju svijetlu budućnost.

Serious Sam 2

1280x960 @ 4xAA + 16xAF
7800 GTX 512
64,8
  
X1900 XTX
54,6
  
X1800 XT
48,7
  
7800 GTX 512 min.
43,7
  
X1900 XTX min.
24,8
  
X1800 XT min.
20,3
  
01020304050606
5
 
1600x1200 @ 4xAA + 16xAF
7800 GTX 512
46,3
  
X1900 XTX
43,4
  
X1800 XT
39,6
  
7800 GTX 512 min.
34,1
  
X1900 XTX min.
18,1
  
X1800 XT min.
17,4
  
01020304050606
5
 

Do prvih pravih problema nailazimo u Serious Samu 2 gdje ATI-jeve kartice, kao i u svim dosadašnjim testovima s ovim naslovom, pokazuju prilično loše performanse. Prosječni rezultat možda i nije toliko katastrofalan kao vrijednost minimalnog frameratea, kako na Radeonu X1900 XTX, tako i na Radeonu X1800 XT. Već smo prije potrvrdili da je riječ o problematičnom programiranju memorijskog kontrolera od strane ATI-ja, a kao što vidimo, situacija se nije popravila niti s najnovijim driverima.
Splinter Cell 3

1280x1024 4xAA + 16xAF
X1900 XTX
76,59
  
7800 GTX 512
75,05
  
X1800 XT
65,34
  
7800 GTX 512 min.
43,57
  
X1900 XTX min.
41,63
  
X1800 XT min.
37,28
  
015304560758
0
 
1600x1200 4xAA + 16xAF
X1900 XTX
58,54
  
7800 GTX 512
55,19
  
X1800 XT
48,18
  
X1900 XTX min.
32,42
  
7800 GTX 512 min.
32,3
  
X1800 XT min.
26,91