Palit GeForce GTX680 Jetstream – brza i efikasna
Datum objave 11.04.2012 - Krešimir Matanović
Kepler arhitektura
Fundamentalna razlika između Fermi arhitekture uvedene sa GTX480 karticama i naknadno korištene sa 5 serijom, i nove Kepler arhitekture je masivno povećanje broja CUDA jezgri (shadera). I dok smo kod Fermija imali duplo veći shader takt u odnosu na ostatak čipa, kod Keplera je broj shadera veći (1536 vs. 512), ali rade na istom taktu kao i ostatak čipa. Povećanje performansi tako kod Keplera dolazi iz znatno većeg broja CUDA jezgri te višeg radnog takta onoga što bi se kod Fermija zvalo "ostatka" čipa. U osnovi i dalje je to Fermi arhitektura – čip je organiziran u skalabilnu mrežu klastera za procesiranje grafike (Graphics Processing Clusters), Streaming Multiprocesore i memorijske kontrolere. Konkretno GK104 (čip koji pogoni GTX680 karticu), sastoji se od četiri GPC-a, osam Streaming Multiprocesora (SMX) nove generacije i četiri memorijska kontrolera. U GK104, svaki GPC ima dedicirani raster mehanizam i dvije SMX jedinice. S ukupno osam SMX-a od kojih svaki ima 192 CUDA jezgre, dolazimo do ukupnog broja od 1536 CUDA jezgri u čipu. Memorijski podsistem je doživio promjene koje su rezultirale u velikom povećanju brzine memorije. Na GTX680 karticama GDDR5 moduli rade na vrlo visokih 1502MHz (6008MHz efektivno), što je najveća brzina do sada. Uz svaki od četiri memorijska kontrolera širine 64 bita, nalazi se 128LB L2 priručne memorije i osam ROP jedinica (single color sample). Zbog povećanja broja jedinica došlo je i do povećanja broja tranzistora u GPU-u pa ih tako GK104 broji čak 3.54 milijarde, što je za oko pola milijarde više nego kod GF110 (Fermi) čipa. Inače, površina jezgre ovoga 28 nm čipa je samo 294 kvadratna milimetra, što je znatno manje od dosadašnjih 500+ mm2 high end čipova. Takt je čipa rastao sa 772MHz na 1006MHz (shader clock je kao što smo napisali izbačen), pa je zbog toga i većeg broja CUDA jezgri snaga čipa rasla gotovo dvostruko na 3090 GFLOPS-a. Teksturnih je jedinica sada duplo više – 128, a fill-rate je 128.8 Gigatexela/s što je za oko 160% više nego kod GF110.
SM je i dalje srce Nvidijine unified GPU arhitekture, gdje se nalazi većina hardverskih jedinica za obradu grafike. CUDA jezgre unutar SM-a obavljaju pixel/vertex/geometry sjenčanje i physics/compute kalkulacije. Teksturne jedinice izvode filtriranje tekstura, a load/store jedinice dohvaćaju i spremaju podatke u memoriju. Jedinice specijalne funkcije (SFU) odrađuju transcendentalne i instrukcije grafičke interpolacije, a na kraju PolyMorph mehanizam odrađuje dohvat vertx-a, teselaciju, viewport transformaciju, podešavanje atributa i stream output.
Novost kod GK104 je SM nove generacije nazvan SMX (sjetimo se Fermi je imao 16 SM-ova, dok Kepler ima 8 SMX-ova). SMX u odnosu na SM ima šest puta više CUDA jezgri (192), osam puta više jedinica specijalne namjene (32), dva puta više Load/Store jedinica (32), četiri puta više teksturnih jedinica (16), te dva puta više warp schedulera. Sav je ovaj ekstra hardver bio potreban kako bi se nadoknadilo ukidanje shader clocka, tj. kako bi se performanse dodatno povećale. Kako bi pak potrošnja energije ostala u razumnim granicama, svaka je procesorska jedinica dizajnirana tako da se poveća clock gating efikasnost. Još jedna bitna izmjena u SMX-u je novi PolyMorph Engine 2.0 koji se brine da visoki faktori teselacije imaju čim manji učinak na performanse renderiranja. Spomenuta L2 priručna memorija je također doživjela napredak, pa joj je tako propusnost povećana na 512 bita po taktu, a shared address operacija na jednu po taktu (prije 1/9 po taktu), te independent address operacija na 64 po taktu (prije 24).
Velika je novost i GPU Boost funkcija koja je omogućena aktivnim nadziranjem potrošnje. U svakodnevnom korištenju (igranje igara), kartica će rijetko kada doseći svoj TDP, pa su u Nvidiji odlučili omogućiti automatsko podizanje takta sa 1006MHz na 1058MHz kako bi performanse kartice podigli za otprilike 5%. U nekim slučajevima takt se može podići i iznad te vrijednosti, a u Nvidiji tvrde kako su mjerili i preko 1.1GHz testirajući aplikacije koje nisu toliko zahtjevne. Nvidijini su inženjeri izračunali kako TDP GTX680 kartice prilikom normalnog korištenja neće prelaziti 170W pa je to drastično poboljšanje u odnosu na GTX580 (maksimala je 195W). Novost koja dolazi s 300 driverima je i Adaptive Vsync koji automatski kontrolira vertikalnu sinkronizaciju. Ispod 60 FPS-a se Vsync gasi kako bi se spriječilo zastajkivanje slike (do sada smo uvijek ovu funkciju gasili), no kada prosječan FPS prijeđe brojku od 60 Vsync se pali kako bi se pri tako visokom framerateu eliminiralo neugodno pucanje ili deranje tekstura koje se dešava kada je Vsync isključen. Kako ovo radi u praksi ostaje nam za vidjeti.
Nvidijinu FXAA tehnologiju koja koristi CUDA jezgre kako bi smanjila vidljivi aliasing, od sada je moguće koristiti i preko Control Panela u R300 driverima, i to za gotovo sve igre a ne samo one u koje je FXAA uključen u razvoju. Prava je novost u filtriranju TXAA tehnologija, koja iskorištava visoke FP16 performanse kod GTX680 kartica. TXAA je mješavina hardverskog antialiasinga, custom CG filmskog stila rješavanja AA i opcionalne vremenske komponente za poboljšavanje kvalitete slike. TXAA je dostupna u dva moda rada, 1 i 2, pri čemu prva nudi vizualnu kvalitetu 8xMSAA uz 2xMSAA performanse, a druga nudi kvalitetu koja nadilazi 8xMSAA uz 4xMSAA performanse. Kao i FXAA, i TXAA će biti implementirana u nadolazeće naslove, a MechWarrior Online, Secret World, Eve Online, Borderlands 2, Unreal 4 Engine, BitSquid, Slant Six Games i Crytek su se do sada obvezali koristiti ju.
Svi Kepler GPU-i imaju novi display mehanizam, koji je napravljen za novu generaciju 4k i 3GHz HDMI monitora, zatim za multi-display igranje sa NVIDIA Surround tehnologijom, multi-stream audio, i poboljšano transkodiranje video materijala. Display mehanizam na GTX 680 kartici u mogućnosti je "pogoniti" do četiri monitora simultano, uz podršku za nativni Surround iz jedne GTX680 kartice. Sve GTX680 kartice se isporučuju sa dva dual-link DVI konektora, kao i HDMI te DisplayPort izlazima. Svi Kepler GPU-i podržavaju i novi hardverski video H.264 encoder NVEC. Prije Keplera, svo se video kodiranje odrađivalo softverski preko mreže CUDA jezgri što je povećavalo potrošnju. Korištenjem specijalne hardverske jedinice NVENC-a, potrošnja je smanjena a brzina povećana za gotovo četiri puta. Aplikacije sada tako mogu birati žele li koristiti NVENC ili tradicionalno softversko kodiranje. NVENC nudi kodiranjevideo materijala full HD rezolucije (1080p), do osam puta brže od realnog vremena, podržava H.264 Base, Main i High Profile Level 4.1 (isti kao i Blu-ray standard), Multiview Video Coding, te kodiranje do 4096×4096.
Forum
Objavljeno prije 4 minute
Serije - dojmovi, komentari i preporukeObjavljeno prije 9 minuta
Aplikacije za prijavljivanje prometnih kameraObjavljeno prije 12 minuta
AutomobiliObjavljeno prije 15 minuta
A1 i ekstremna potronja baterijeObjavljeno prije 40 minuta
Alibaba, AliExpress iskustva?Novosti
Posljednji dani rasprodaje za Praznik rada! Doživotni Office 2021 Pro već od 35,24 €! Iskoristite najbolju cijenu za Microsoftove licence odmah!
Kolege već koriste XLOOKUP kako bi ubrzali rad s podacima dok ste vi zaglavljeni s ručnim filtriranjem. Dok se drugi opuštaju tijekom blagdana, vješti profesionalci već su iskoristili Godeal24 rasprodaju za Praznik rada kako bi nadogradili... Pročitaj više
Facebook testira "degradiranje" nekorisnog sadržaja
Meta trenutno testira gumb Downvote na nekim računima kako bi smanjila nekorisne komentare na Facebooku. Kada više ljudi pritisne gumb Downvote na komentaru posta, bit će manje vidljiv. Predstavnik Mete rekao je da je za razliku od prethodn... Pročitaj više
FBI nudi nagradu od 10 milijuna dolara za hakersku skupinu Salt Typhoon, navodno povezanu s Kinom
FBI nudi 10 milijuna dolara za informacije o hakerskoj skupini Salt Typhoon – evo zašto je to velika stvar. Američki FBI nedavno je ponudio nagradu do 10 milijuna dolara za informacije koje bi dovele do identifikacije ili uhićenja članova h... Pročitaj više
Huawei tiho razvija moćne AI čipove unatoč pritisku SAD-a
Prema Wall Street Journalu (WSJ), Huawei ubrzava razvoj svojih moćnih AI čipova, s očekivanjem zamjene dijela Nvidijinih vrhunskih čipova. Ovaj potez nastavlja pokazivati otpornost kineske industrije poluvodiča na napore Sjedinjenih Država... Pročitaj više
Zašto sve više zemalja želi zabraniti društvene mreže djeci?
Zabrane dolaze polako, ali sigurno. I ne, nije riječ o nekoj moralnoj panici – ovaj put su zabrinuti znanstvenici, roditelji, psiholozi… i sad sve više i više vlada. Društvene mreže su, kažu mnogi, novi toksin za djecu i mlade – i možda je... Pročitaj više
Sve novosti