AMD Instinct MI100
I dok je svijet PC igara zaokupljen AMD-ovim fenomenalnim Radeon RX 6800 i 6800XT grafičkim karticama temeljenim na revolucionarnoj RDNA2 gaming arhitekturi, svijet superračunala i masivnih podatkovnih centara pratio je lansiranje prve AMD-ove kartice za ubrzavanje temeljene na potpuno novoj arhitekturi. .
Što je toliko specifično za CDNA arhitekturu – u biti je to prvi superračunalni akcelerator koji nije GPU u tradicionalnom smislu te skraćenice. Naime, CDNA arhitektura usredotočena je na maksimiziranje svih onih dijelova GPU-a koji se zapravo koriste u svrhu ubrzavanja izuzetno zahtjevnih simulacija i specijaliziranih superračunarskih aplikacija. S druge strane, svi ostali potrebni dijelovi GPU-a za obradu piksela potpuno su uklonjeni s čipa!
Kao osnovu za stvaranje nove CDNA arhitekture, AMD je upotrijebio najnoviju reviziju dizajna GCN arhitekture. Jedinice teksture i jedinice za resterizaciju grafike su otpale, a jedinice “sjenčanja” preuređene su u tzv “Matrix Core Engine”. Različite jedinice unutar samog čipa povezane su ultra brzom sabirnicom poznatom iz AMD-ovih EPYC procesora – “Infinity Fabric”.
Rezultat AMD-ovog reinženjeringa GCN arhitekture u CDNA arhitekturu je AMD Instinct MI100 – najbrži superračunalni akcelerator s maksimalno mogućom snagom dvostruke preciznosti (FP64) od čak 11,6 TeraFLOPS-a!
Da bismo ove brojke stavili u kontekst, treba reći da je početkom ovog tisućljeća najmoćnije superračunalo na svijetu bio IBM-ov ASCI White. Zauzimao je površinu od dva košarkaška terena, težio je preko 100 tona i trošio ukupno 6 megavata električne energije. Ne računajući utrošenu električnu energiju, košto je 163 milijuna USD po današnjoj vrijednosti u dolarima! ASCI White imao je FP64 performanse od 12,3 TeraFLOPS-a!
Dvadeset godina kasnije, jedan AMD Instinct MI100 akcelerator troši 300 W, težak je 1,2 kg i ima FP64 računsku snagu od 11,6 TeraFLOPS-a.
AMD je dizajnirao Instinct MI100 akceleratorske kartice tako da je moguće povezati do četiri kartice u jednu jedinicu od 45 TeraFLOPS za FP64 i do 90 TeraFLOPS pojedinačne preciznosti (FP32). Inače, AMD Instinct MI100 opremljen je HBM2 memorijom kapaciteta 32 GB i ukupne propusnosti 1.230 GBps.
Ono što omogućuje potpuno novoj arhitekturi akceleratora da pokaže svoj puni potencijal u stvarnim superračunarskim sustavima i ključni razlog zašto će prva ExaFLOPS superračunala pokretati AMD akceleratori, jest AMD-ova ROCm softverska platforma otvorenog koda. U svojoj verziji 4.0, ROCm donosi objedinjenu podršku i za superračunala i za radne stanice za razvoj strojne inteligencije (MI).
Nakon službene prezentacije CDNA arhitekture, Instinct MI100 akceleratora i ROCm 4.0 platforme, postalo je jasno zašto je AMD izabran kao ekskluzivni dobavljač i CPU-a i kartica akceleratora za oba najbrža superračunala Exa-Scale: “Frontier” i “El Capitan”.


