Maia 200 ulazi u igru Microsoft prvi put ozbiljno napada NVIDIA dominaciju

Microsoft je službeno predstavio svoj AI čip druge generacije Maia 200 i time jasno pokazao da više ne želi biti samo kupac NVIDIA hardvera nego i punokrvni proizvođač infrastrukture za umjetnu inteligenciju, a novi čip izrađen je u TSMC 3 nm procesu i pozicioniran kao najmoćnije Microsoftovo rješenje za inferenciju do sada, uz tvrdnju da donosi oko 30 posto bolji omjer performansi i cijene u odnosu na prethodnu generaciju te da u pojedinim metrikama nadmašuje Googleove TPU sustave i Amazonov Trainium.

Maia 200 dizajnirana je prvenstveno za rad s modelima velikih razmjera i u jedan čip pakira više od 140 milijardi tranzistora, pri čemu prema službenim podacima isporučuje više od 10 petaFLOPS-a pri FP4 preciznosti i preko 5 petaFLOPS-a pri FP8 preciznosti, uz potrošnju energije ograničenu na oko 750 W, dok memorijski podsustav uključuje 216 GB HBM3e memorije s propusnošću do 7 TB u sekundi, što omogućuje rad s iznimno velikim modelima bez stalnog oslanjanja na vanjsku memoriju. Microsoft naglašava da čip nije građen samo za današnje potrebe nego i za buduće generacije ultra velikih modela, a prve implementacije bit će usmjerene na interni tim za razvoj napredne umjetne inteligencije, generiranje sintetičkih podataka te pogon Copilot usluga i velikih modela poput GPT 5.2, čime Maia 200 odmah ulazi u najzahtjevnija produkcijska okruženja.

Strateški najvažniji dio priče nije samo sirova snaga nego smanjenje ovisnosti o NVIDIA platformi jer Microsoft prelazi na vlastitu arhitekturu optimiziranu za Azure i odustaje od NVIDIA InfiniBand ekosustava u korist standardnog Ethernet povezivanja, čime gradi dugoročnu tehnološku autonomiju i fleksibilnost u širenju podatkovnih centara.

Razvojni paket za Maia 200 već je dostupan odabranim partnerima u preview fazi, a Microsoft potvrđuje da je sljedeća generacija Maia 300 već u aktivnom dizajnu, što pokazuje da ne govorimo o jednokratnom eksperimentu nego o dugoročnoj strategiji stvaranja vlastite AI silicijske platforme. Analitičari ističu da Microsoft ovim potezom ne pokušava odmah srušiti NVIDIA dominaciju u treniranju modela nego ciljano napada segment inferencije gdje je ključan omjer cijene i performansi, posebno u scenarijima u kojima stotine milijuna korisnika istovremeno koriste Copilot i slične usluge, jer bi oslanjanje isključivo na skupe GPU sustave dugoročno bilo financijski neodrživo.

Korištenje TSMC 3 nm procesa dodatno potvrđuje da Microsoft ulaže ozbiljan kapital u naprednu proizvodnju i da želi igrati u istoj ligi kao najveći proizvođači čipova, a kako AWS, Google i Microsoft nastavljaju jačati vlastite akceleratore, tržište AI inferencije postupno se pretvara u bojno polje na kojem NVIDIA više neće imati apsolutni monopol nego sve jaču konkurenciju izravno iz redova svojih najvećih cloud partnera.

DRUGE NOVOSTI

Google predstavio Gemini 3.5 Flash i Gemini Spark: AI asistent sada radi zadatke umjesto korisnika

Wear OS 7 je stigao: Gemini AI, dulje trajanje baterije i potpuno novi widgeti za pametne satove

Google potpuno mijenja Search: 9 velikih AI novosti koje će promijeniti način pretraživanja interneta

Google lansirao Gemini Omni Flash: novi AI alat stvara video iz teksta, slika i zvuka