Glavni ciljevi dizajniranja novog grafičkog procesora kodnog
imena Cypress su bili potpuna hardverska i softverska integracija DX11 podrške
prije samog pojavljivanja API-a na tržištu, zatim maksimiziranje performansi
pod DX9, 10 i 10.1 API-ima, puna hardverska implementacija OpenCL1.0 i DirectCompute11 API-a,
dvostruki porast snage u odnosu na prethodnu seriju, te uvođenje Eyefinity
tehnogije kao i poboljšanje kvalitete prikaza. Nova TeraScale 2 arhitektura
tako donosi preko 2 TeraFLOPS-a procesorske snage (2.7 u slučaju HD5870 modela).
Prelazak na niži, 40nm proizvodni proces znači kako je sada na nešto veću
površinu bilo moguće "strpati" više nego duplo veći broj tranzistora
nego kod prethodne serije. RV770 je imao površinu od 263mm2, a u slučaju RV870
je ona 27% veća – 334mm2. U tih 334mm2 smješteno je
2.15 milijarde tranzistora što je povećanje od 125% (RV770 ih je imao 956
milijuna). To znači kako sada RV870 ima 20 SIMD (Single Instruction, Multiple
Data) jezgri od kojih svaka ima 16 thread procesora koji se pak svaki sastoji od
5 stream jezgri. Ukupno je to 1600 stream jezgri (shadera) što je duplo više
od RV770 čipa i čak pet puta više od RV670. Teksturnih jedinica je sada 80
(4 po SIMD jezgri). Propusnost tekstura je sada na 68 milijardi bilinearno
filtriranih teksela po sekundi, te do 272 milijardi 32-bitnih dohvata u sekundi.
I priručna memorija je doživjela promjene, L2 je udvostručen na 128kb po memorijskom
kontroleru, L1 priručna memorija ima do propusnost od 1TB/s, a komunikacija
između L1 i L2 se odvija brzinom od 435GB/s. Memorijsko sučelje i dalje podržava
GDDR5 memoriju te sada nudi maksimalni bandwidth od 153GB/s (115GB/s kod RV770).
AntiAliasing Resolve je povećan sa 64 na 128, a Z/Stencil sa 64 na 128. Poboljšano
je i dinamičko upravljanje snagom, koje spušta potrošnju kartice u stanju
mirovanja na svega 27W, dok pri maksimalnom optrećenju potrođnja ne bi smjela
prelaziti 188W (povećanje od 17% u odnosu na prethodnika). Tu je i hardverska
detekcija temperature napojnih regulatora kako bi se izbjeglo pregrijavanje.
Dodana je i ULPS (Ultra Low Power State) funkcija za multi-GPU konfiguracije.

Grafička jezgra ima dvostruki rasterizator i novu teselacijsku
jedinicu šeste generacije. Ona je programabilna preko DX11 Hulla i Domain
Shadera, ubačen je novi algoritam za smanjenje artefakata, a poboljšane su
performanse za konstantno ažuriranje buffera. Ubrzana je i Geometry Shading
funkcija, a i OpenGL podrška je doživjela izmjene (12-bitna subpiksel preciznost
i poboljšano renderiranje linija).

Thread procesori imaju 2.7 TeraFLOPS-a jednostruku i 544 GigaFLOPS-a
dvsotruku preciznost. Svaki od njih uključuje četiri stream jezgre i jednu
stream jezgru specijalne namjene, zatim jedinicu za grananje i registre opće
namjene. Dizajn donosi i povećanu inter-procesnu komunikaciju kroz niz poboljšanja.
Filtriranje tekstura je također doživjelo promjene, pa je tako Anisotropic
algoritam nov, i sada (kao na Nvidiji) nije ovisan o kutu gledanja (invarijantan
je) te nema pada performansi u odnosu na filter iz prethodne generacije. Poboljšan
je i LOD (level of detail) menadžment za višu kvalitetu. Render back-endovi
(ROP) su također izmjenjeni. Teksturne jedinice sada mogu čitati kompresirane
AntiAliasing buffere boje, a poboljšane su i CFAA performanse. Uzorkovanje
sjenčanja je povećano, kao i MRT (Multiple Render Targets, renderiranje više
neovisnih slika u jednom prolazu) performanse. Tu je i Supersample AA koji
je efikasnije implementiran a djeluje na shadere, teksture i rubove poligona,
te bez problema radi sa CFAA.

I memorijsko sučelje je doživjelo određene promjene. Okolina
memorijskog kontrolera je optimizirana, a dodan je EDC (Error Detection Code),
koji vrši CRC provjere na transferima podataka (poboljšana pouzdanost na višim
taktovima). GDDR5 je u mogućnosti doseći brzine od 5Gbps, a poboljšanjima
je omogućeno i brže mijenjanje napona i takta bez zastoja.

Sa strane Stream Computinga bitna je za napomenuti puna hadrverska
implementacija DirectCompute 11 i OpenCL 1.0 API-a, te usuglašenost sa
IEEE754-2008 standardom za računanje sa pomičnim zarezom. Novost je i Memory
Export Buffer koji spaja memorijske zapise te razmješta do 64 32-bitnih vrijednosti
po taktu. Dodane su i neke funkcionalnosti iznad OpenCL 1.0, kao što su 32-bitne
Atomic operacije, fleksibilno dijeljenje 32KB lokalnih podataka, dijeljenje
64KB globalnih podataka, globalna sinkronizacija kao i Pridodani/Potrošeni
bufferi.

Velika novost je i ATI Eyefinity tehnologija koja omogućava
spajanje do 6 30" monitora maksimalne rezolucije 7680×3200 ili masivnih
24.6 Megapiksela. Ovo je postignuto korištenjem fleksibilne arhitkture koja
podržava do šest 10-bitnih cjevovoda za monitore. Kombinacije koje se mogu
koristiti su praktički beskrajne, a neke od njih je moguće vidjeti i na slici
iznad. Po jednom GPU-u je moguće postaviti šest DisplayPort izlaza, a AMD
će u doglednoj budućnosti izbaciti i HD5870 Eyefinity6 Edition verziju kartice
sa 6 DisplayPortova. Ukoliko se pitate da li je HD5870 dovoljno moćna da zavrti
igru u 7680×3200, odgovor je da. AMD je to demonstrirao na primjeru WOW-a
koji se na toj rezoluciji vrtio u pristojnih 80-tak FPS-a, no dok sami ne
isprobamo nećemo im baš vjerovati :) Samsung će kao AMD-ov partner predstaviti
23" monitor rezolucije 1920×1080 koji ima ultra tanke stranice razvijen
specijalno za Eyefinity.