Uvod

Nakon prošlotjednog prikaza performansi Gigabyteove Radeon HD4850
kartice došao je na red i članak o arhitekturi HD4000 serije te prikaz CrossFire
performansi. Uspjeli smo se dokopati još jedne Gigabyteove HD4850 kartice
no ovaj puta u retail paketu pa Vam pokazujemo i u kakvom izdanju ćete ju
moći pronaći na policama. Ujedno smo na jednu od kartica postavili i NorthQ-ov
VGA hladnjak te zabilježili znatan pad temperatura u odnosu na standardni
AMD-ov hladnjak.

RV770 arhitektura

HD4800 serija donosi ponešto izmjenjenu arhitekturu u odnosu
na prijašnju HD3800 seriju. Fokus AMD-a u kreiranju HD4800 arhitekture je
bio na efikasnosti, tj. poboljšanju odnosa performansi po vatu, performansi
po dolaru i dodavanju novih značajki. Uz to htjeli su podiću procesnu moć
i AA performanse te implementirati DX 10.1, teselaciju, UVD2, PCIe 2.0 itd.
Ono čime se AMD posebno hvali je činjenica kako HD4850 kartica ima snagu 1
TeraFLOPS-a, dok HD4870 ima snagu 1.2 TeraFLOPS-a. To znači da ukoliko imate
potrebe i to znate iskoristiti, svoje računalo možete pretvoriti u mini superkompjuter
snage do 4.8 TeraFLOPS-a (4 x HD4870 u CrossFireX postavi).

Terascale grafički mehanizam ima novi format SIMD (Single Instruction,
Multiple Data) jezgri kojih sada ima ukupno 10. Svaka SIMD jezgra ima 80 32-bitnih
stream procesora pa tako dolazimo do ukupnog broja od 800 stream procesora.
U odnosu na prijašnju arhitekturu to je više nego trostruko povećanje. HD4800
ima optimizirane teksturne jedinice kojih broji 40 (stari je imao 16), te
novi dizajn teksturne cache memorije. Tu je i nova arhitektura memorijskog
sučelja sa GDDR5 podrškom koje nudi maksimalni bandwidth od 115GB/s. AntiAliasing
Resolve je povećan sa 32 na 64, Z/Stencil također sa 32 na 64.

Jezgra je u odnosu na prethodnu povećana za 1.4x te njena površina
iznosi 260mm2. Kada malo dublje zavirimo u SIMD jezgru vidimo kako svaka uz
80 stream procesora ima i 16KB lokalne podatkovne dijeljene memorije i svoju
kontrolnu logiku te radi sa dijeljenim setom dretvi. Svaka SIMD jezgra ima
i 4 teksturne jedinice te L1 cache, a preko 16KB globalne podatkovne dijeljene
memorije komunicira sa ostalim SIMD jezgrama. Nova arhitektura dozvoljava
da sposobnost dohvata tekstura skalira sa snagom shadera pri čemu je održan
4:1 ALU:TEX odnos. Sa novom arhitekturom povećale su se i performanse po mm2,
tako su performanse stream procesora porasle za 40% a teksturnih jedinaica
za 70%. Novi je i dizajn cache memorije teksturnih jedinica. L2 su tako poravnati
sa memorijskim kanalima, a L1 spremaju jedinstvene podatke po SIMD jezgri.
Vertex cache je odvojen i funkcionira kao zasebna jedinica između Crossbar
kontrolera i Data Request sabirnice.

Render Back-Endovi (ili ROP-ovi) su također doživjeli izmjene.
ukupno ih je četiri što je izjednačeno sa brojem memorijskih kanala koji se
brinu o bojama i AntiAliasingom. I u 32-bitnim i u 64-bitnim verzijama MSAA
RV770 donosi duplo povećanje performansi u odnosu na RV670 – do 16 pixela
po taktu za 2x i 4x uzorke te do 8 pixels po taktu za 8xAA.

Poboljšanja i promjene u dizajnu su dovele do povećanja Texture
Fill Rate-a, pa tako HD4870 (RV770XT) ima 781GTexel/s. Kada smo se već dotakli
označavanja čipova da onda i to objasnimo. HD4850 pogoni RV770PRO čip koji
radi na 625MHz, dok RV770XT pogoni HD4870 kartice te radi na 750MHz, u ostalim
karakteristikama su identični. AMD je u 260mm2 (oko 36% veći nego RV670) čipa
smjestio 956 milijuna tranzistora što je oko 43% više nego kod prijašnje serije
koja je imala "vražjih" 666 milijuna.

Jedna od većih novosti nove arhitekture je svakako odbacivanje
ring-bus memorijskog kontrolera predstavljenog još u R580 čipu. AMD se ovaj
puta odlučio za klasičniji distribuirani hub memorijski kontroler. Memorijskih
kontrolera ima ukupno 4 koji imaju širinu sabirnice 64-bita pa je tako ukupna
širina 256-bita. Novi kontroler podržava GDDR3 i GDDR5 memoriju. Upotreba
GDDR5 memorije u HD4870 donosi višestruke prednosti a najveća se vidi u vrlo
velikom bandwidthu. Iz 256-bita su uspjeli izvući 115GB/s, dok Nvidijini
GT200 čipovi izvlače 141GB/s iz 512-bita širine. AMD je ostvario partnerske
odnose sa Hynixom, Qimondom i Samsungom koji će biti dobavljači GDDR5 memorija.
GDDR5 ovih kompanija radi na 1.5V, ima gustoću 512Mbita, 1Gbit i 2Gbita, propusnost
između 12.8 i 28.0 GB/s te potrošnju od 2.5W pri 5Gbita/s.

Nova arhitektra donosi i dinamički Power Management. Ugrađeni
mikrokontroler na grafičkom procesoru stalno nadzire termalne senzore i aktivnost
pojedinih GPU blokova te PCIe sabirnicu. U skladu sa time podešava taktove
grafičkog procesora i memorije, kontrolira clock gating, napone i brzinu vrtnje
ventilatora. Kako sami tvrde ovim tehnikama su unaprijedili odnos performansi
po vatu dvostruko u odnosu na prethodnu generaciju. Kako uživo funkcionira
ova tehnologija vidjeli smo na HD4850 karticama kada taktovi u 2D-u padaju
na 500MHz za GPU i 700MHz za memoriju, pri čemu se ventilator sporije okreće,
a temperatura pada. Zlobnici bi rekli kako je AMD i trebao unaprijediti ove
tehnologije s obzirom na to koliko se RV770PRO zagrijava. Činjenica je da
su na veću jezgru, žedniju struje i k tome sklonu zagrijavanju postavili hladnjak
sa HD3850 kartica nimalo ne ohrabrije. Ipak, za očekivati je kako će svi proizvođači
kartice nuditi sa boljih hladnjacima na što ih je AMD na neki način i prisilio
ugradnjom ovako slabog hladnjaka, a sve u svrhu što manjih proizvodnih troškova
(što naravno rezultira niskom cijenom na tržištu).

Sa multimedijalne strane UVD je unaprijeđen u UVD 2, a karakterizira
ga pomoć pri HD video dekodiranju i dodana podrška za neke osnovne "post
processing" efekte. Tu je i ugrađeni audio sustav koji sada podržava
7.1 kanalni HD audio.

Krajem drugog ili početkom trećeg tromjesečja na tržište će
doći i nasljednik HD3870X2 modela koji nosi kodno ime R700. R700, odnosno
HD4870X2 će biti kartica sa dva RV770XT GPU-a na istom PCB-u, imati će GDDR5
memoriju a hladnjak će biti vrlo sličan onome na HD3870X2 karticama.