Fundamentalna razlika između Fermi arhitekture uvedene sa GTX480 karticama i naknadno korištene sa 5 serijom, i nove Kepler arhitekture je masivno povećanje broja CUDA jezgri (shadera). I dok smo kod Fermija imali duplo veći shader takt u odnosu na ostatak čipa, kod Keplera je broj shadera veći (1536 vs. 512), ali rade na istom taktu kao i ostatak čipa. Povećanje performansi tako kod Keplera dolazi iz znatno većeg broja CUDA jezgri te višeg radnog takta onoga što bi se kod Fermija zvalo "ostatka" čipa. U osnovi i dalje je to Fermi arhitektura – čip je organiziran u skalabilnu mrežu klastera za procesiranje grafike (Graphics Processing Clusters), Streaming Multiprocesore i memorijske kontrolere. Konkretno GK104 (čip koji pogoni GTX680 karticu), sastoji se od četiri GPC-a, osam Streaming Multiprocesora (SMX) nove generacije i četiri memorijska kontrolera. U GK104, svaki GPC ima dedicirani raster mehanizam i dvije SMX jedinice. S ukupno osam SMX-a od kojih svaki ima 192 CUDA jezgre, dolazimo do ukupnog broja od 1536 CUDA jezgri u čipu. Memorijski podsistem je doživio promjene koje su rezultirale u velikom povećanju brzine memorije. Na GTX680 karticama GDDR5 moduli rade na vrlo visokih 1502MHz (6008MHz efektivno), što je najveća brzina do sada. Uz svaki od četiri memorijska kontrolera širine 64 bita, nalazi se 128LB L2 priručne memorije i osam ROP jedinica (single color sample). Zbog povećanja broja jedinica došlo je i do povećanja broja tranzistora u GPU-u pa ih tako GK104 broji čak 3.54 milijarde, što je za oko pola milijarde više nego kod GF110 (Fermi) čipa. Inače, površina jezgre ovoga 28 nm čipa je samo 294 kvadratna milimetra, što je znatno manje od dosadašnjih 500+ mm2 high end čipova. Takt je čipa rastao sa 772MHz na 1006MHz (shader clock je kao što smo napisali izbačen), pa je zbog toga i većeg broja CUDA jezgri snaga čipa rasla gotovo dvostruko na 3090 GFLOPS-a. Teksturnih je jedinica sada duplo više – 128, a fill-rate je 128.8 Gigatexela/s što je za oko 160% više nego kod GF110.

SM je i dalje srce Nvidijine unified GPU arhitekture, gdje se nalazi većina hardverskih jedinica za obradu grafike. CUDA jezgre unutar SM-a obavljaju pixel/vertex/geometry sjenčanje i physics/compute kalkulacije. Teksturne jedinice izvode filtriranje tekstura, a load/store jedinice dohvaćaju i spremaju podatke u memoriju. Jedinice specijalne funkcije (SFU) odrađuju transcendentalne i instrukcije grafičke interpolacije, a na kraju PolyMorph mehanizam odrađuje dohvat vertx-a, teselaciju, viewport transformaciju, podešavanje atributa i stream output.
Novost kod GK104 je SM nove generacije nazvan SMX (sjetimo se Fermi je imao 16 SM-ova, dok Kepler ima 8 SMX-ova). SMX u odnosu na SM ima šest puta više CUDA jezgri (192), osam puta više jedinica specijalne namjene (32), dva puta više Load/Store jedinica (32), četiri puta više teksturnih jedinica (16), te dva puta više warp schedulera. Sav je ovaj ekstra hardver bio potreban kako bi se nadoknadilo ukidanje shader clocka, tj. kako bi se performanse dodatno povećale. Kako bi pak potrošnja energije ostala u razumnim granicama, svaka je procesorska jedinica dizajnirana tako da se poveća clock gating efikasnost. Još jedna bitna izmjena u SMX-u je novi PolyMorph Engine 2.0 koji se brine da visoki faktori teselacije imaju čim manji učinak na performanse renderiranja. Spomenuta L2 priručna memorija je također doživjela napredak, pa joj je tako propusnost povećana na 512 bita po taktu, a shared address operacija na jednu po taktu (prije 1/9 po taktu), te independent address operacija na 64 po taktu (prije 24).

Velika je novost i GPU Boost funkcija koja je omogućena aktivnim nadziranjem potrošnje. U svakodnevnom korištenju (igranje igara), kartica će rijetko kada doseći svoj TDP, pa su u Nvidiji odlučili omogućiti automatsko podizanje takta sa 1006MHz na 1058MHz kako bi performanse kartice podigli za otprilike 5%. U nekim slučajevima takt se može podići i iznad te vrijednosti, a u Nvidiji tvrde kako su mjerili i preko 1.1GHz testirajući aplikacije koje nisu toliko zahtjevne. Nvidijini su inženjeri izračunali kako TDP GTX680 kartice prilikom normalnog korištenja neće prelaziti 170W pa je to drastično poboljšanje u odnosu na GTX580 (maksimala je 195W). Novost koja dolazi s 300 driverima je i Adaptive Vsync koji automatski kontrolira vertikalnu sinkronizaciju. Ispod 60 FPS-a se Vsync gasi kako bi se spriječilo zastajkivanje slike (do sada smo uvijek ovu funkciju gasili), no kada prosječan FPS prijeđe brojku od 60 Vsync se pali kako bi se pri tako visokom framerateu eliminiralo neugodno pucanje ili deranje tekstura koje se dešava kada je Vsync isključen. Kako ovo radi u praksi ostaje nam za vidjeti.

Nvidijinu FXAA tehnologiju koja koristi CUDA jezgre kako bi smanjila vidljivi aliasing, od sada je moguće koristiti i preko Control Panela u R300 driverima, i to za gotovo sve igre a ne samo one u koje je FXAA uključen u razvoju. Prava je novost u filtriranju TXAA tehnologija, koja iskorištava visoke FP16 performanse kod GTX680 kartica. TXAA je mješavina hardverskog antialiasinga, custom CG filmskog stila rješavanja AA i opcionalne vremenske komponente za poboljšavanje kvalitete slike. TXAA je dostupna u dva moda rada, 1 i 2, pri čemu prva nudi vizualnu kvalitetu 8xMSAA uz 2xMSAA performanse, a druga nudi kvalitetu koja nadilazi 8xMSAA uz 4xMSAA performanse. Kao i FXAA, i TXAA će biti implementirana u nadolazeće naslove, a MechWarrior Online, Secret World, Eve Online, Borderlands 2, Unreal 4 Engine, BitSquid, Slant Six Games i Crytek su se do sada obvezali koristiti ju.

Svi Kepler GPU-i imaju novi display mehanizam, koji je napravljen za novu generaciju 4k i 3GHz HDMI monitora, zatim za multi-display igranje sa NVIDIA Surround tehnologijom, multi-stream audio, i poboljšano transkodiranje video materijala. Display mehanizam na GTX 680 kartici u mogućnosti je "pogoniti" do četiri monitora simultano, uz podršku za nativni Surround iz jedne GTX680 kartice. Sve GTX680 kartice se isporučuju sa dva dual-link DVI konektora, kao i HDMI te DisplayPort izlazima. Svi Kepler GPU-i podržavaju i novi hardverski video H.264 encoder NVEC. Prije Keplera, svo se video kodiranje odrađivalo softverski preko mreže CUDA jezgri što je povećavalo potrošnju. Korištenjem specijalne hardverske jedinice NVENC-a, potrošnja je smanjena a brzina povećana za gotovo četiri puta. Aplikacije sada tako mogu birati žele li koristiti NVENC ili tradicionalno softversko kodiranje. NVENC nudi kodiranjevideo materijala full HD rezolucije (1080p), do osam puta brže od realnog vremena, podržava H.264 Base, Main i High Profile Level 4.1 (isti kao i Blu-ray standard), Multiview Video Coding, te kodiranje do 4096×4096.