AMD nakon otprilike pet godina napokon iz temelja mijenja svoju GPU arhitekturu. Razlog tome je zastarjelost VLIW koncepta (najprije 5, zatim 4 u Cayman modelima), koji vrlo dobro radi s grafikom, no kod compute zadaća podbacuje zbog nemogućnosti stvaranja rasporeda unaprijed i nepostojanja dinamičkog raspoređivanja prilikom izvršavanja instrukcija. Nova arhitektura prelazi sa Streaming Processor arhitekture (četiri ALU-a (Radeon core), sa SFU-om i grananjem), na GCN arhitekturu sa tradicionalnim vektorskim 16-wide SIMD-om, tj. sa ILP-a (instruction level parallelism) na TLP (thread level parallelism). O samoj GCN arhitekturi ćemo detaljnije pisati kasnije u tekstu, a koncentrirajmo se za početak na GCN proizvode koje će AMD izbaciti u ovoj godini. Za razliku od Nvidije, AMD i ovaj put kreće od vrha i odmah predstavlja najjače modele iz nove Southern Islands porodice. Tako će počevši od siječnja 2012. godine na tržištu biti dostupan HD7970 model iz Tahiti segmenta, a odmah potom se očekuje i slabiji. Tahiti modeli su namijenjeni entuzijastima , dok će ih na tržište slijediti Pitcairn modeli namijenjeni svima željnim dobrih performansi po pristupačnijoj cijeni. I za kraj nam ostaju Cape Verde bazirani modeli, koji su namijenjeni nižem tržišnom segmentu. Što se pak "dvoglavog" Tahiti modela tiče, šuška se kako će na tržište izaći do kraja prvog kvartala 2012.

Nove Southern Islands proizvode osim nove GCN arhitekture, karakteriziraju i druge novosti. Jedna od njih je Eyefinity tehnologija druge generacije koja donosi niz poboljšanja dosadašnje tehnologije ali i neke novitete kao što je DDM Audio. Uz to je naravno i App Acceleration koji sada ima više smisla zbog GCN arhitekture i njenih dobrih GPGPU (General-purpose computing on graphics processing units) svojstava, a pod njega spadaju i Steady Video 2.0 te poboljšana UVD tehnologija. Novost je i prelazak sa 40 nm proizvodnog procesa predstavljenog prije dvije godine, na novi TSMC-ov 28 nm proizvodni proces, čime nastavljaju biti prvi s novim proizvodnim procesom još od 2005. godine i 90 nm. Southern Islands kartice će koristiti i PCEe sabirnicu treće generacije (3.0), koja ima bit rate od 8 Gigatransfera u jednoj sekundi a unazad je kompatibilna s postojećim PCIe standardima. Tu je i podrška za nadopunjeni Microsoftov DirectX 11.1 API, koji između ostalog donosi i WDDM 1.2 podršku. Novosti je kao što vidimo mnogo, a za početak krećemo s analizom GCN arhitekture.

Evolucija grafičkih procesora se prema AMD-u može podijeliti na tri ere. Prva je Fixed Function gdje su se API-ji sastojali od seta funkcijskih ulaznih točaka koje su se približno ili direktno mapirale na za njih dediciranu logiku u GPU-u. Posljednji takav API je bio DirectX 7.0, a hardver koji vežemo uz to razdoblje je prva serija Radeona (R100, RV200). Drugu eru je otvorio DirectX 8.0 s podrškom za shadere (ATI R200), a u trećoj se pojavljuje VLIW arhitektura paralelnih grafičkih jezgri. Sada AMD donosi novu Graphics Core Next arhitekturu koja donosi najnovije grafičke tehnologije zajedno sa visokim compute performansama. GCN donosi i nova rješenja za uštedu električne energije, optimizirana je za heterogene compute sisteme, skalabilna je te omogućava primjenu u Fusion sistemima.

Što ukratko novoga donosi GCN? Osnovni građevni blok je i dalje jedna ALU jedinica, no sada je osnovni radni blok GCN-a jedan 16-wide vektorski SIMD (Single Instruction Multiple Data). Jedan takav vektorski SIMD se sastoji naravno od 16 ALU jedinica, te jednog 64KB registra u kojem se drže podaci (ovaj SIMD ne treba miješati sa SIMD-om u Cayman arhitekturi). Vektorski je SIMD pak osnovni građevni blok najmanje neovisne funkcijske jedinice – CU-a (Compute Unit). Svaka se compute jedinica sastoji od četiri SIMD-a, hardverskog schedulera, jedinice grananja, L1 priručne memorije, lokalnog djelitelja podataka, četiri teksturne jedinice (svaka sa 4 load/store dohvatne jedinice) i specijalne skalarne jedinice (zadužena za aritnetičke operacije – uvjetne naredbe i transcendentalne operacije).

Kako sve radi? Jedna operacija i do 16 podatkovnih elemenata se dovode u vektorski SIMD te se procesuiraju u jednom taktu. Kao i kod ranije arhitekture, zapravo se dovodi jedan wavefront od 64 instrukcije pa je za izvršenje jednog wavefronta zapravo potrebno četiri takta, što opet znači da jedan CU u četiri takta odradi četiri wavefronta instrukcija. Fundamentalno, ovdje nastaje velika razlika u odnosu na VLIW arhitekturu. Gdje je VLIW paralelno obrađivao višestruke instrukcije iz istog wavefronta (paralelizacija na razini instrukcije), GCN izvršava jednu instrukciju iz višestrukih wavefrontova (paralelizacija na nivou threada). Tako je u slučaju postojanja ovisnih instrukcija, VLIW ostao neiskorišten i gasio pojedine ALU-e. Kod GCN-a se to neće događati upravo zbog činjenice da svaki SIMD izvršava pojedine instrukcije iz različitih wavefrontova. To ujedno znači kako će GCN sada imati visoke i konzistentne compute performanse, što VLIW nije mogao imati, dok će grafičke performanse više manje ostati jednake.

Ostatak je GPU-a ostao relazivno poznat. Frontend se sastoji od asinkronih naredbenih mehanizama i naredbenih procesora koji pune Compute jedinice, te dva geometry mehanizma. Iza CU-a se nalaze se rasteri (8 Render Back-endova – 32 color ROP-a po taktu i 128 Z/Stencil ROP-a po taktu), 768KB L2 priručne memorije, memorijski kontroleri (6 x 64 bitna kontrolera = 384 bita) i različite Fixed Function jedinice (video izlazi, PCIe kontroleri, UVD jedinica i Video Codec mehanizam (H.264 enkoder)). Sada kada smo barem malo razjasnili GCN, krenimo na konkretni proizvod – Tahiti.