AMD Carrizo Tech Day

Datum objave 03.06.2015 - Krešimir Matanović

AMD Carrizo Tech Day - prvi dio

amd_carrizo_tech_day_1 amd_carrizo_tech_day_2

AMD je prošli tjedan u okolici Munchena (Schloss Hohenkammer), okupio europske novinare kako bi nam predstavili tehnologiju i mogućnosti njihove nove Carrizo mobilne platforme. Danas ju i službeno predstavljaju na sajmu Computex u Taipeiu pa su i informacije koje smo mi saznali sada javne. Riječ je o potpuno novoj platformi koja donosi pravi SoC dizajn jednog APU-a i zapravo je zadnja iteracija Bulldozer arhitekture. Carrizo donosi unaprjeđenju GCN grafiku, x86 Excavator jezgre, integrirani southbridge, punu HSA 1.0 arhitekturu, AMD sigurnosni procesor (ARM) i još mnoštvo toga u 15 i 35W pakiranjima.

amd_carrizo_tech_day_3 amd_carrizo_tech_day_4

Kako bi dobili najbolje informacije o novoj platfromi AMD je doveo ključne ljude za Carrizo pa je tako Tech Day otvorio Kevin Lensing koji je stariji direktor za klijentske proizvode. On je naglasio kako ova šesta generacija APU-a (priznajemo, bolje zvuči od konkurentove pete generacije), cilja na najmasovnije tržište u kojem se trenutno nalazi čak 62 milijuna prijenosnika. Sami priznaju kako je to tržište na kojem su imali najmanje uspjeha i kako je Carrizo specifičan "tailor made" proizvod za prijenosnike u cjenovnom razredu 400 do 700 USD. Uz to, tvrde kako će sada korisnici za 500 USD dobiti više nego što su do sada imali jer će prijenosnik s Carrizom uz klasične zadatke poput surfanja internetom, muzike, e-maila i video chat-a moći u potpunosti odraditi i content creation, video streaming, photo i video management te gaming. Najjači pripadnik Carrizo obitelji APU-a, FX-8800P donosi glatke performanse u online igrama tipa DOTA 2 (preko 30 FPS-a u FullHD-u pri maksimalnim postavkama), zatim LOL (blizu 50 FPS-a u FullHD-u pri maksimalnim postavkama) te CS Global Offensive (blizu 40 FPS-a u Full HD-u pri maksimalnim postavkama). Online igranje je kao što znamo vrlo važan segment gaminga, a samo u Kini je preko 7 milijuna igrača. Uz grafiku u APU-u, i podrška je Dual Graphics konfiguracije standardna, a novost u ovom segmentu je i FreeSync podrška. Vrlo bitna za gaming je autonomija prijenosnika, a po njihovim mjerenjima tipičan prijenosnik sa FullHD-om i naj jačim FX-8800P APU-om će izdržati do dva sata na bateriji što je gotovo duplo više od sličnog prijenosnika sa FX-7600 APU-om.

amd_carrizo_tech_day_5

Uz Lensinga je tu bio i Darren Hayward koji je dizajner igara u Codemastersu. On je govorio o po našem mišljenju odličnom Dirt: Rally naslovu koji donosi povijesne i moderne rally automobile, poznate rally staze koje uključuju i Pikes Peak Hillclimb, a za vozače su tu i promjenjivi vremenski uvjeti koji će otežati igranje. Igra je podijeljena u prvenstvo i lige, online evente a novost je i mogućnost menadžmenta vlastitog rally tima. Neke od grafičkih značajki uključuju i HD Ambient Occlusion, Contact Hardening Shadows (veći realizam sjena), Forward+ (povećanje broja svjetala na sceni) te GPU Particles (efekti kiše i snijega se simuliraju na GPU-u (GPGPU)).

amd_carrizo_tech_day_6

S tehničke strane nam je o novoj Carrizo platformi govorio svakako najkompetentniji čovjek za to. Sam Naffziger je AMD-ov Corporate Fellow i odgovoran je za razvoj tzv. "low power" tehnologija. Sam je jedan od glavnih inovatora AMD-ovih low power tehnologija (vlasnik je 113 patenata), a ima 26 godišnje iskustvo u industriji počevši od HP-a, preko Intela a u AMD-u je još od 2006. godine.

amd_carrizo_tech_day_14

Ono po čemu je Carrizo poseban je što je riječ o prvom procesoru koji implementira HSA 1.0 arhitekturu, prvi koji donosi HEVC (x.265) podršku u mainstreamu, prvi koji ima ARM TrustZone procesor u sebi i prvi je to tzv. Performance APU u čistom SoC (System on Chip) dizajnu. Ono što na gornjoj slici vidimo je rezultat višegodišnjeg rada (na samom se dizajnu ovoga čipa radilo još od predstavljanja prve Bulldozer arhitekture). Na lijevoj je strani (crveno) GPU dio, dok se na desnoj razaznaju dva odvojena x86 modula, iznad kojoh je DDR/PHY dio, dok se ispod nalazi Northbridge i PCIe/Display mehanizmi, a u samom desnom donjem kutu je i Southbridge. Carrizo APU ima 29% više tranzistora nego Kaveri na istoj površini a donosi 15% više IPC performanse pri 40% nižoj potrošnji.

amd_carrizo_tech_day_15

Glavni ciljevi u izradi Carrizo platforme su bili povećanje autonomije (čemu doprinosi i prava SoC konfiguracija), zatim preuzimanje liderske pozicije na području video obrade, gaminga i GPU Compute performansi, te donošenje značajnih pomaka u performansama. Na dizajniranju ovoga APU-a je radilo više od 1000 inženjera/dizajnera duže od tri godine, što dovoljno govori o kompleksnosti posla. Neke implementacije su primjerice vrlo kratko trajale (HEVC je ubačen za par mjeseci), dok su druge ipak trajale duže. Carrizo APU-i su napravljeni u zrelom 28 nm proizvodnom procesu iz kojeg je izvučen maksimum, dolaze u FP4 pakiranju, a integriraju dva x86 modula (četiri Excavator jezgre), 8 Computing Unita treće generacije GCN grafičke arhitekture i u potpunosti su HSA 1.0 kompatibilni (Heterogeneous System Architecture). Podrška za DDR3 memoriju brzine 2133 MHz je standardna (premda će vjerojatno većina prijenosnika biti opremljena brzinom memorijom brzine 1600 MHz). Integrirani southbridge donosi 3 display mehanizma, TrueAudio podršku (Azalia HD Audio ili I2S), tu je novi UVD 6 mehanizam, podrška za x8 PCI-e 3.0, a napojna voda su sada tri - VDD, VDDNB i VDDGraphics.

amd_carrizo_tech_day_16

Excavator x86 moduli po prvi puta odbacuju tradicionalnu Steamrollerovu Library implementaciju (ručni dizajn) i prelaze na High Density Library dizajn koji je donio drastično smanjenje u površini modula, povećanje FP Scheduler efikasnosti za 38%, poboljšanje u multiply-accumulate operacijama za 35% te I-Cache kontrolu za 35%.  HD Library dizajn je donio izvrsne optimizacije po pitanju potrošnje energije no ujedno i ograničenja na 15W odnosno 35W TDP, jer preko 20W po modulu donosi smanjenje normalizirane frekvencije. To ujedno znači i kako vjerojatno nećemo vidjeti Excavator jezgre u procesorima višeg TDP-a. Novosti u Excavatoru uključuju i poduplavanje L1 Data priručne memorije (uz zadržavanje iste latencije) ali i smanjenje L2, bolje predviđanje grananja (, branch Target Buffer je povećan za 50% a dodana je i ubrzana Flush funkcija u FPU za brže "flushanje" pipelinea). Nove instrukcije uključuju AVX2, MOVBE, SMEP i BMI1/2, a dodana su i nova Standby power stanja. Sva su poboljšanja rezultirala s 4 do 15% povećanja IPC performansi. Preko povećanog takta i IPC-a unutar istih 15W TDP-a novi će APU-i primjerice postizati do 55% više performanse u Cinebenchu nego prethodna generacija. CPU sada predstavlja samo 16% jezgre, a kako Sam Naffziger objašnjava Bulldozer arhitektura je ionako bila više orijentirana ka serverima pa ju je bilo zapravo teško prilagoditi klijentskim potrebama. No, objašnjava dalje, sada sa svim ovim poboljšanjima i High Density Library dizajnom je konačno to to. Manju količinu L2 memorije kompenzira takt i veća količina L1 memorije. Upitan da li je SoC smjer za sve procesore rekao je da svakako jest, i kako su prednosti jasno vidljive te je uz upotrebu HD Library dizajna to smjer u kojem treba ići. No, ujedno je i spomenuo kako je ovo napravljeno na sazrelom proizvodnom procesu, vrlo visokog yielda i da zbog toga nije bilo većih problema. Saznali smo i kako Carrizo APU ima radni napon između 0.775V i 1.35V te kako je vrlo Turbo friendly. Jedna od stvari koja je doprinijela višim brzinama je i veća razdvojenost x86 modula pa je i disipacija bolja.

amd_carrizo_tech_day_17

Sa strane video reprodukcije su se također napravile fundamentalne izmjene. Kod Kaveria je tipičan slijed bio UVD zapisuje u memoriju, pa GFX čita i zatim zapisuje u memoriju, da bi zatim display čitao iz memorije. Kod Carrizo arhitekture su ti koraci skraćeni pa se sada reprodukcija (playback) odvija po principu da UVD zapisuje u memoriju a display mehanizam uz pomoć novog video procesing pipelinea sliku šalje direktno na display. Ovime se uštedjelo preko 500 mW snage pri reprodukciji. Kada smo kod UVD-a on je šeste generacije (pet puta više performanse od prethodnog UVD-a) i donosi nativni HEVC/H.265 dekoder sa 4K H.264 dekoderom. Tu je i 4K MJPEG decode funkcija, zatim VC-1/WmV profile D, MPEG-2, MVC i klasična MPEG-4/DivX podrška. UVD uvodi i dinamički power gating. Carrizo UVD u 25% vremena obradi jednu sliku/frame i ostatak vremena se u potpunosti isključi (dok druga slika ne pristigne na obradu) - ovo donosi 300 mW ušteda. U prijevodu, AMD tvrdi kako Carrizo donosi preko 9.5 sati playbacka na bateriji (razumnog kapaciteta).

AMD Carrizo Tech Day - drugi dio

amd_carrizo_tech_day_18

Još jedan bitan element svakog APU-a je i integrirana grafika, a Carrizo donosi osam GCN jezgri treće generacije (512 shadera), 512KB grafičke L2 memorije, poboljšane teselacijske performanse, DX12 podršku, Lossles delta color kompresiju itd. Rezultat je 819 GFLOPS-a grafičke snage. Novost za ovu generaciju je i kompresija boja, tj. držanje podataka o bojama u lossless kompresiranom formatu unutar frame buffera iz kojeg grafička jezgra može čitati i zapisivati čime se efikasnije koristi DRAM propusnost i povećavaju performanse.

amd_carrizo_tech_day_19

Implementacija HSA značajki u APU je bila iznimno zahtjevna jer je za potpunu koherenciju memorije između CPU-a i GPU-a bilo potrebno potpuno novi hardverski sklop. Za CPU je to lako jer on ionako ima višestruke izvore podataka s različitih memorija, no GPU je tradicionalno zaključan u svom malom svijetu i gleda samo svoju memoriju. Neke od značajki ubrzanja koje HSA donosi su ATC hijerarhija, potpuna koherencija priručne memorije između GPU-a i CPU-a, zatim podrška za Wavefront i Compute zadatke te dodavanje podrške za HSA QoS scheduling.

amd_carrizo_tech_day_20

Velika novost za Carrizo je i implementacija dediciranog 32-bitnog ARM Cortex A5 čipa koji je izoliran od ostatka APU-a iz sigurnosnih razloga, a ima pristup sistemskoj memoriji i resursima. Donosi hardversku logiku za kontrolu sigurnosti bootanja x86 jezgri i kriptografski koprocesor. Korisnici će prednosti ovoga moći iskoristiti putem AMD Trustzone aplikacija.

amd_carrizo_tech_day_21

S obzirom da sve procesne jezgre sada imaju iste adrese i jednako pristupaju virtualnoj i fizičkoj memoriji, imaju produženu muticore koherenciju, prebacuju posao brzo između procesora i donose podršku za ubrzanje Java, C++ AMP i Pythona možemo govoriti o punoj HSA 1.0 specifikaciji. HSA donosi velike prednosti u načinu na kojeg programeri/developeri mogu iskoristiti sve dostupne procesne jezgre i sada je samo bitno da to stvarno i počnu primjenjivati u praksi i da obični korisnici to osjete u svakodnevnom radu koristeći njihove softverske alate.

amd_carrizo_tech_day_7 amd_carrizo_tech_day_12

Tipični Carrizo prijenosnik će imati FullHD ekran, do 1TB tvrdi disk, 6 do 8GB radne memorije i tanju šasiju nego do sada. Ostaje A10 i A8 branding shema, uz dodatak "6th generation". Ono što smo saznali iz razgovora je da su već tisuće APU-a odaslane OEM-ima i kako će u vremenskom periodu između srpnja/kolovoza/rujna prvi primjerci prijenosnika iz Acera, Asusa, Lenova, Toshiba i HP-a biti na tržištu. AMD otvoreno govori i o ekonomskom benefitu za njihove partnere i kako su cijene prema partnerima niže i od Core M. I kupci će imati velike koristi - uz povoljnu cijenu prijenosnika tu su i bundlei igara. Sa FX i A10 prijenosnicima će moći birati između Dirt Rally i Batman 3 Beyond Gotham (LEGO) igara, dok će uz A8 dolaziti samo potonje. Velik je naglasak dan na usku suradnju AMD-a i Microsofta na potpunoj Windows 10 podršci pri čemu je Carrizo dizajniran da ubrza Win 10 rad, omogući sve njegove značajke te donese premium iskustvo zabave.  U to ulazi i HEVC dekodiranje i streaming (Skype for Business), ali i HEVC streaming između Xbox One konzole i PC-a. Veliku ulogu premium iskustva preuzima i DirectX 12 podrška ali i Muli Adapter renderiranje u kojem će određene elemente scene renderirati APU kao ispomoć grafičkoj kartici - kako na desktopu tako i  u mobilnom segmentu. AMD-ovci su nam i u praksi demonstrirali rad novih APU-a uz pomoć prijenosnika generičkog dizajna, a mogli smo vidjeti glatku 4K reprodukciju te usporedbu s konkurencijom ali i lossless prijenos i reprodukciju 1080p video materijala direktno s kamere.

amd_carrizo_tech_day_8 amd_carrizo_tech_day_10

Zanimljiva je i novotarija koja neće odmah biti dostupna po izlasku prijenosnika je i AMD Looking Glass tehnologija. Ona je jedina consumer visual search aplikacija za video i donosi HSA 1.0 podršku. Uz pomoć aplikacije je moguće odrediti lice koje će ona tražiti u svim video materijalima koje imamo na računalu. AMD već tradicionalno donosi i mogućnost upravljanja gestama koja sada dolazi na veći broj prijenosnika nego do sada jer ne zahtijeva skupi dodatni hardver a radi na generičkim aplikacijama.

amd_carrizo_tech_day_9amd_carrizo_tech_day_11

Bitno iskustvo s novim Godavari i Carrizo APU-ima je i ono igračko pa smo tako mogli isprobati kako radi igra Dirt Rally na novom A10-7870K APU-u ali i prijenosniku opremljenom FX-8800P APU-om. Ovu smo igru isprobali i ranije sa jačim desktop karticama i možemo samo reći kako je i na APU-u iskustvo igranja vrlo ugodno a bez većeg gubitka u grafičkim detaljima. Nakon svega što smo čuli i vidjeli Carrizo donosi veliki pomak u načinu na koji doživljavamo tradicionalni APU i predstavlja vrlo bitnu arhitekturu za AMD. Nadamo se kako ćemo uskoro i samo imati prilike isprobati prijenosnike bazirane na novoj arhitekturi i potvrditi sve navedene tvrdnje o performansama i novim iskustvima korištenja prijenosnika.