Bulldozer mikroarhitektura je primarno serverska, i dizajnirana je kako bi povećala skalabilnost u zahtjevnim "enterprise" primjenama. Na tržište će tako doći tri vrste procesora – dvije serverske – Valencia i Interlagos, te iz njih izvedeni Zambezi desktop modeli. Novi serverski, šesnaest jezgreni Bulldozeri, trebali bi osigurati 50% veću propusnost od postojećih 12 jezgrenih Opterona, a zadržati isti nivo potrošnje i termalne okvire. Poboljšana će biti virtualizacija, izvršavanje aplikacija baza podataka (više threadova), HPC korisnici će moći uštedjeti na prostoru zbog veće gustoće jezgri na manjem prostoru, a Cloud servisi će profitirati od velike memorijske skalabilnosti i naravno povećanja broja jezgri. Uz potpuno novu mikroarhitekturu, novost je i prelazak sa 45nm na 32nm Silicon-On-Insulator (SOI) Hi-K Metal Gate proizvodni proces (11 metalnih slojeva), AMD-ovog partnera Globalfoundriesa. Novi proizvodni proces tako omogućuje smještaj 33% više jezgri na istu površinu. To konkretno znači da će najjači desktop 8-jezgreni Bulldozer procesor imati nešto manju površinu od aktualnog 6-jezgrenog Thubana. Da, 16 je jezgri za sada rezervirano samo za serverske procesore, dok će desktop modeli imati 8, 6 i 4 jezgri ili 4, 3 i 2 Bulldozer modula kako će te kasnije saznati iz teksta.

Novi dizajn mikroarhitekture, gdje postoje dvije integer jezgre u jednom modulu, koje dijele zajednički front-end (fetch i decode jedinice), zajedno s velikom L2 cache memorijom i FPU-om, AMD-u je omogućio modularni pristup "gradnji" proceosora. Ta mogućnost ostavlja felksibilnost gradnje i omogućuje procesore kao što su nadolazeći Opteroni 6200 (Interlagos) sa 16 jezgri, kao i 8-jezgrene Opterone 4200 serije (Valencia). Takav je princip naravno baza i za nadolazeće desktop procesore (Zambezi). Zambezi će dolaziti u konfiguraciji s maksimalno osam jezgri, tj. četiri Bulldozer modula sa po dvije integer jezgre u svakom modulu. Nove jezgre nose 15h naziv, u odnosu na prethodnu K10 arhitekturu koja je nosila naziv 10h. Takav 8-jegreni procesor na 315mm2 površine, sadržava četiri Bulldozer modula, veliki dio površine zauzima priručna memorija, a tu je i integrirani northbridge, DDR3 memorijski kontroler, četiri HyperTransport fizička sloja i različita I/O sučelja. Procesor ima ukupno 128 KB L1 podatkovne priručne memorije, tj. 16 KB po jezgri (64-byte cacheline, write-through, 4-way associative). Uz podatkovnu priručnu memoriju tu je i instrukcijska L1, a nje ukupno ima 256 KB (64 KB po modulu, 64-byte cacheline, 2-way associative). Drugostupanjska priručna memorija (L2) broji ukupno 8MB, tj. 2MB po Bulldozer modulu (1MB po jezgri, 64-byte cacheline, 16-way associative). I za kraj nam ostaje ukupno 8MB L3 priručne memorije, tj. 2MB po modulu (64-byte cacheline, 16-way associative, MOESI), koja je kontrolirana od strane integriranog Northbridgea. Integrirani northbridge (sjeverni most) kontrolira i dva kanala DDR3 memorije širine 72 bita, te četiri HyperTransport linka (16-bit receive/16-bit transmit).

Arhitektura Bulldozer modula je zapravo ono što je najzanimljivije kod novih procesora. U jednom su modulu sadržane dvije izvršne jezgre, tj. jedan je modul u stanju odraditi dva threada simultano, a ostatak je logike dijeljen. No, ipak nije sve tako jednostavno. Svaka funkcija koja ne može na jednostavan način biti podjeljena (Integer pipelines, Level1 data caches) će postojati za svaku jezgru. Sve će se pak ostale funkcije (Floating point pipelines, Level2 cache) dijeliti između jezgara. Ovo omogućava da svaka od dvije jezgre koristi na svoj način funkcije viših performansi (floating point unit), jer se na taj način smanjuje ukupna aktivna površina jezgre.

Novost u ovakvoj konstrukciji je i dijeljeni front-end (fetch i decode). Sastoji se od odvojenih cjevovoda za predviđanje i dohvat, instrukcijskog prefetcha određenog predviđanjem, 2-way instrukcijske priručne memorije veličine 64KB, 32-bajtne fetch jedinice, instrukcijskih TLB-a (translation lookaside buffer) u dva nivoa – prvi se sastoji od 72 unosa različitih veličina stranica, a drugi je s 512 unosa (4-way, 4K pages), i na kraju Branch fusiona.

Dvije jezgre su zapravo dvije odvojene integer jedinice od kojih se svaka sastoji od dvije ALU jedinice i dvije AGU jedinice, koje su sposobne odraditi četiri nezavisne aritmetičke i memorijske operacije po taktu. Prijašnji AMD-ov dizajn mogao je odraditi jedan therad po jezgri no imao je samo 3 cjevovoda, koji su dijelili ALU i AGU funkcije. Novim se dizajnom znatno povećavaju multithreaded performanse, uz povećanje jedne jezgre od oko 12%. Integer jedinice koriste "thread retire" logkiu, svaka jezgra ima svoj scheduler i koristi se Physical Register File preimenovanje registara (pomaže u održavanju malog broja fizičkih registara). Svaka jezgra ima 16K L1 priručne memorije, a podatkovni TLB podržava 32 unosa (cully associative). Load/store operacije se u potpunosti izvode out-of-order, sa dva 128-bit "punjenja" po ciklusu, jednim 128-bitnim spremanjem po ciklusu i redom od 40 unosa punjenja i 24 unosa spremanja.

FPU jedinica je dijeljena od strane dvije integre jezgre i radi na principu co-procesora s izvještavanjem matične jezgre o završetku operacije. FPU ima dvostruke 128-bitne FMAC (Floating Point Multiply/Accumulate) cjevovode i dvostruke 128-bitne Packed Integer cjevovode. FMAC jedinice rade s FMA (Fused Multiply Accumulate) instrukcijama, kao i sa standardnim FMUL (multiply) i FADD (add). Ipak, FMA operacija je snažnija jer dozvoljava kalkulacije tipa A = B x C
+ D. U standardnoj FP jedinici, ovo bi oduzelo dva ciklusa, jedan za množenje i jedan za zbrajanje. FMAC može odraditi i FMUL i FADD, dok tradicionalni dizajn imaju dedicirane putanje za te operacije. Kada se moraju izvršavati višestruke FADD ili FMUL operacije, optimizacja posla se sada vrši dijeljenjem posla na oba FMAC-am umjesto da na izvršenje čekaju jedna iza druge u redu. S Bulldozer arhitekturom, AMD koristi i moćnije FMA4 operacije koje se koriste u HPC (High performance computing) primjeni, a imaju četiri operanda. Uz standardne instrukcijske setove novost je podrška za SSSE3, SSE4.1, SSE4.2, AES-NI
i AVX setove, a karakteristično samo za Bulldozer tu su i već spomenute FMA4 (HPC), te nove XOP instrukcije (numeričke, multimedijalne aplikacije i algoritmi koji se koriste za audio/radio).