Mape arhitekture u Pascalu. Obitelji video kartica Nvidia GeForce Referentne informacije. Pascal zaslonski kanal: spreman za HDR

2016. je već na izmaku, ali njegov doprinos gaming industriji ostat će još dugo s nama. Prvo, video kartice iz crvenog tabora dobile su neočekivano uspješnu nadogradnju u srednjem cjenovnom razredu, a drugo, NVIDIA je još jednom dokazala da nije uzalud zauzima 70% tržišta. Maxwellovi su bili dobri, GTX 970 je s pravom važila za jednu od najboljih kartica za taj novac, ali Pascal je sasvim druga stvar.

Nova generacija hardvera u licu GTX 1080 i 1070 doslovno je pokopala rezultate prošlogodišnjih sustava i vodećeg tržišta rabljenog hardvera, dok su "mlađe" linije u licu GTX 1060 i 1050 učvrstile svoj uspjeh u cjenovno pristupačnijim segmentima. Vlasnici GTX980Ti i drugih Titana plaču krokodilskim suzama: njihovi uber-pušci za mnogo tisuća rubalja izgubili su 50% cijene i 100% razmetanja odjednom. Sama NVIDIA tvrdi da je 1080 brža od prošlogodišnjeg TitanX-a, 1070 lako "natrpa" 980Ti, a relativno budžetna 1060 će naštetiti vlasnicima svih ostalih kartica.

Rastu li zaista odatle noge visokoj produktivnosti i što sa svim tim uoči blagdana i iznenadnih financijskih radosti, kao i čime se točno razveseliti, saznajte u ovom dugom i pomalo dosadnom članak.

Možete voljeti Nvidiju ili ... ne voljeti, ali poricati da je in ovaj trenutak je lider u području video inženjeringa bit će samo ubojica iz alternativnog svemira. Budući da AMD-ova Vega još nije najavljena, još nismo vidjeli vodeće RX-ove na Polarisu, a R9 Fury, sa svojih 4 GB eksperimentalne memorije, ne može se baš smatrati karticom koja obećava (VR i 4K još uvijek žele malo više, nego što ona ima) - imamo što imamo. Dok su 1080 Ti i uvjetni RX 490, RX Fury i RX 580 samo glasine i očekivanja, imamo vremena pogledati trenutnu postavu NVIDIA-e i vidjeti što je tvrtka postigla za posljednjih godina.

Nered i povijest nastanka Pascala

NVIDIA redovito daje razloge da se "ne volite". Povijest GTX 970 i njegovih "3,5 GB memorije", "NVIDIA, jebi se!" od Linusa Torvaldsa, potpuna pornografija u linijama desktop grafike, odbijanje rada s besplatnim i mnogo uobičajenijim FreeSync sustavom u korist vlastitog vlasničkog ... Općenito, ima dovoljno razloga. Jedna od najneugodnijih stvari za mene osobno je ono što se dogodilo s posljednje dvije generacije video kartica. Ako uzmemo grubi opis, onda su "moderni" GPU-i došli iz dana podrške za DX10. A ako danas tražite "djeda" 10. serije, onda će početak moderne arhitekture biti u regiji 400. serije video akceleratora i Fermi arhitekture. U njemu je nastala ideja o "blok" dizajnu iz tzv. "CUDA jezgre" u NVIDIA terminologiji.

Fermi

Ako su video kartice 8000., 9000. i 200. serije bile prvi koraci u svladavanju samog koncepta, "moderne arhitekture" s univerzalnim shader procesorima (kao AMD, da), onda je 400. serija već bila najsličnija onome što mi vidi u nekih 1070. Da, Fermi je još uvijek imao malu Legacy crutch iz prethodnih generacija: shader jedinica je radila na dvostruko većoj frekvenciji od jezgre odgovorne za izračunavanje geometrije, ali ukupna slika nekih GTX 480 nije puno drugačija od nekih nekih 780., SM multiprocesori su grupirani, klasteri komuniciraju putem zajedničke predmemorije s memorijskim kontrolerima, a rezultate rada prikazuje blok rasterizacije zajednički klasteru:


Blok dijagram GF100 procesora koji se koristi u GTX 480.

U 500. seriji bio je još uvijek isti Fermi, malo poboljšan "iznutra" i s manje braka, tako da su vrhunska rješenja dobila 512 CUDA jezgri umjesto 480 za prethodnu generaciju. Vizualno, dijagrami toka općenito izgledaju kao blizanci:


GF110 je srce GTX 580.

Na nekim mjestima su povećali frekvencije, malo promijenili dizajn samog čipa, nije bilo revolucije. Sve ista 40 nm procesna tehnologija i 1,5 GB video memorije na 384-bitnoj sabirnici.

Kepler

Dolaskom Keplerove arhitekture mnogo toga se promijenilo. Možemo reći da je upravo ova generacija NVIDIA video karticama dala vektor razvoja koji je doveo do pojave trenutnih modela. Ne samo da se promijenila arhitektura GPU-a, već i kuhinja za razvoj novog hardvera unutar NVIDIA-e. Ako je Fermi bio fokusiran na pronalaženje rješenja koje će pružiti visoke performanse, onda se Kepler kladio na energetsku učinkovitost, razumnu upotrebu resursa, visoke frekvencije i jednostavnost optimizacije game engine-a za mogućnosti arhitekture visokih performansi.

U dizajnu GPU-a napravljene su ozbiljne promjene: kao osnova nije uzet "vodeći" GF100 / GF110, već "proračun" GF104 / GF114, koji je korišten u jednoj od najpopularnijih kartica tog vremena - GTX. 460.


Cjelokupna procesorska arhitektura je pojednostavljena korištenjem samo dva velika bloka s četiri objedinjena shader multiprocesorska modula. Izgled novih vodećih modela izgledao je otprilike ovako:


GK104 instaliran u GTX 680.

Kao što vidite, svaka od računalnih jedinica značajno je dobila na težini u odnosu na prethodnu arhitekturu, te je nazvana SMX. Usporedite strukturu bloka s onim što je prikazano gore u Fermijevom odjeljku.


Multiprocesor SMX GPU GK104

Šestota serija nije imala video kartice na punopravnom procesoru koji sadrži šest blokova računalnih modula, vodeći je bio GTX 680 s instaliranim GK104, a samo je "dvoglavi" 690 bio hladniji od njega, na kojem je upravo uzgojena su dva procesora sa svim potrebnim vezama i memorijom. Godinu dana kasnije, vodeći GTX 680 s manjim promjenama pretvorio se u GTX 770, a kruna evolucije Kepler arhitekture bile su video kartice temeljene na kristalu GK110: GTX Titan i Titan Z, 780Ti i uobičajeni 780. Unutra - svih istih 28 nanometara, jedino kvalitativno poboljšanje (koje NIJE otišlo na potrošačke video kartice temeljene na GK110) - performanse s dvostrukim preciznim operacijama.

Maxwell

Prva video kartica temeljena na Maxwell arhitekturi bila je... NVIDIA GTX 750Ti. Nešto kasnije pojavili su se njegovi rezovi u vidu GTX 750 i 745 (isporučuju se samo kao integrirano rješenje), au vrijeme njihovog pojavljivanja kartice niže klase stvarno su uzdrmale tržište jeftinih video akceleratora. Nova arhitektura testirana je na čipu GK107: sićušnom komadu budućih perjanica s ogromnim hladnjacima i zastrašujućom cijenom. Izgledalo je otprilike ovako:


Da, samo je jedna računalna jedinica, ali koliko je kompliciranija od prethodnika, usporedite sami:


Umjesto velikog bloka SMX, koji je korišten kao osnovna "cigla za gradnju" u stvaranju GPU-a, koriste se novi, kompaktniji SMM blokovi. Keplerove osnovne računalne jedinice bile su dobre, ali su patile od slabe iskorištenosti kapaciteta - banalne gladi za instrukcijama: sustav nije mogao raspršiti instrukcije na veliki broj aktuatora. Pentium 4 je imao približno iste probleme: napajanje je bilo u stanju mirovanja, a pogreška u predviđanju grananja bila je vrlo skupa. U Maxwellu je svaki računalni modul bio podijeljen u četiri dijela, od kojih je svaki dobio svoj međuspremnik instrukcija i warp planer - istu vrstu operacija na grupi niti. Samim time učinkovitost je porasla, a sami GPU-i postali su fleksibilniji od svojih prethodnika, i što je najvažnije, uz malo krvi i prilično jednostavan kristal, razradili su novu arhitekturu. Priča ide u spiralu, hehe.

Najviše od svega, mobilna rješenja su imala koristi od inovacija: površina kristala porasla je za četvrtinu, a broj izvršnih jedinica multiprocesora gotovo se udvostručio. Srećom, upravo su serije 700. i 800. napravile glavnu zbrku u razvrstavanju. Samo unutar 700 bile su video kartice temeljene na arhitekturi Kepler, Maxwell pa čak i Fermi! Zato je stolni Maxwells, kako bi se odmaknuo od mešavine prethodnih generacija, dobio zajedničku seriju 900, iz koje su se naknadno izdvojile mobilne kartice GTX 9xx M.

Pascal - logičan razvoj Maxwellove arhitekture

Ono što je postavljeno u Kepleru i nastavljeno u Maxwell generaciji ostalo je u Pascalima: prve potrošačke video kartice izdane su na temelju ne baš velikog čipa GP104, koji se sastoji od četiri klastera za obradu grafike. GP100 pune veličine sa šest klastera otišao je na skupi poluprofesionalni GPU pod markom TITAN X. Međutim, čak i "ošišani" 1080 svijetli tako da se prošlim generacijama smuči.

Poboljšanje performansi

temelj temelja

Maxwell je postao temelj nove arhitekture, dijagram usporedivih procesora (GM104 i GP104) izgleda gotovo isto, glavna razlika je broj multiprocesora upakiranih u klastere. Kepler (700. generacija) je imao dva velika SMX multiprocesora, koji su u Maxwellu bili podijeljeni u 4 dijela svaki, osiguravajući potrebno vezivanje (promjena naziva u SMM). U Pascalu su postojećih osam u bloku dodana još dva, tako da ih je bilo 10, a kratica je ponovno prekinuta: sada se jednostruki multiprocesori ponovno nazivaju SM.


Ostalo je potpuna vizualna sličnost. Istina, unutra je bilo još više promjena.

Motor napretka

Unutar multiprocesorskog bloka ima nepristojno mnogo promjena. Kako ne bih ulazio u vrlo dosadne detalje što je preuređeno, kako optimizirano i kako je bilo prije, vrlo ću ukratko opisati promjene, inače neki već zijevaju.

Prije svega, Pascal je ispravio dio koji je odgovoran za geometrijsku komponentu slike. Ovo je neophodno za konfiguracije s više monitora i rad s VR kacigama: uz odgovarajuću podršku motora igre (a ta će se podrška uskoro pojaviti zahvaljujući naporima NVIDIA-e), video kartica može izračunati geometriju jednom i dobiti nekoliko geometrijskih projekcija za svaku od ekrana. Ovo značajno smanjuje opterećenje u VR ne samo u području rada s trokutima (ovdje je povećanje samo dvostruko), već iu radu s komponentom piksela.

Uvjetni 980Ti dvaput će očitati geometriju (za svako oko), a zatim je ispuniti teksturama i izvršiti naknadnu obradu za svaku od slika, obrađujući ukupno oko 4,2 milijuna točaka, od kojih će se oko 70% zapravo koristiti, ostatak će biti odrezan ili pasti u područje koje se jednostavno ne prikazuje za svako oko.

1080 će jednom obraditi geometriju, a pikseli koji ne uđu u finalnu sliku jednostavno neće biti izračunati.


S pikselskom komponentom sve je, zapravo, još hladnije. Budući da se povećavanje propusnosti memorije može učiniti samo na dva fronta (povećanje frekvencije i propusnosti po taktu), a obje metode koštaju, a GPU “glad” za memorijom s godinama je sve izraženija zbog rasta rezolucije. a razvoj VR ostaje poboljšati "besplatne" metode za povećanje propusnosti. Ako ne možete proširiti sabirnicu i podići frekvenciju - morate komprimirati podatke. U prethodnim generacijama hardverska kompresija je već bila implementirana, ali u Pascalu je podignuta na novu razinu. Opet ćemo učiniti bez dosadne matematike i uzeti gotov primjer iz NVIDIA-e. S lijeve strane - Maxwell, s desne strane - Pascal, one točke čija je komponenta boje bila podvrgnuta kompresiji bez gubitaka ispunjene su ružičastom bojom.


Umjesto prijenosa određenih pločica od 8x8 točaka, memorija sadrži "prosječnu" boju + matricu odstupanja od nje, takvi podaci zauzimaju od ½ do ⅛ izvornog volumena. U stvarnim zadacima, opterećenje memorijskog podsustava smanjilo se s 10 na 30%, ovisno o broju gradijenata i ujednačenosti ispuna u složenim scenama na ekranu.


Inženjerima se to nije činilo dovoljno, a za vodeću video karticu (GTX 1080) korištena je memorija s povećanom propusnošću: GDDR5X prenosi dvostruko više bitova podataka (ne instrukcija) po taktu i proizvodi više od 10 Gb/s na vrh. Prijenos podataka tako ludom brzinom zahtijevao je potpuno novi raspored memorije na ploči, a ukupna memorijska učinkovitost povećana je za 60-70% u usporedbi s vodećim modelima prethodne generacije.

Smanjite kašnjenja i zastoje

Video kartice odavno se ne bave samo grafičkom obradom, već i srodnim izračunima. Fizika je često vezana za okvire animacije i nevjerojatno je paralelna, što znači da je mnogo učinkovitije izračunavati na GPU-u. No najveći generator problema u posljednje vrijeme postala je VR industrija. Mnogi game engineovi, razvojne metodologije i hrpa drugih tehnologija koje se koriste za rad s grafikom jednostavno nisu bili dizajnirani za VR, slučaj pomicanja kamere ili promjene položaja glave korisnika tijekom renderiranja kadra jednostavno nije bio procesuiran. Ako ostavite sve kako jest, tada će desinkronizacija video streama i vaših pokreta uzrokovati napade morske bolesti i jednostavno ometati uranjanje u svijet igre, što znači da se "pogrešni" okviri jednostavno moraju baciti nakon renderiranja i započeti ponovno radi. A to su nova kašnjenja u prikazivanju slike na displeju. Nema pozitivan učinak na učinak.

Pascal je uzeo u obzir ovaj problem i uveo dinamičko balansiranje opterećenja i mogućnost asinkronih prekida: sada izvršne jedinice mogu ili prekinuti trenutni zadatak (spremajući rezultate rada u predmemoriju) kako bi obradile hitnije zadatke, ili jednostavno resetirati podvučeni okvir i započnite novi, značajno smanjujući kašnjenja u formiranju slike. Glavni dobitnici ovdje su, naravno, VR i igre, ali ova tehnologija također može pomoći u izračunima opće namjene: simulacija sudara čestica dobila je povećanje performansi od 10-20%.

Pojačanje 3.0

NVIDIA grafičke kartice dobile su automatski overclocking davno, još u 700. generaciji temeljenoj na Kepler arhitekturi. U Maxwellu je overclocking poboljšan, ali je i dalje, blago rečeno, tako-tako: da, video kartica je radila malo brže, sve dok je termalni paket to dopuštao, dodatnih 20-30 megaherca za jezgru i 50 -100 za memoriju, ožičeno iz tvornice, dalo je povećanje, ali malo . Radilo je ovako:


Čak i ako je postojala margina za temperaturu GPU-a, performanse se nisu povećale. S pojavom Pascala, inženjeri su protresli ovu prašnjavu močvaru. Boost 3.0 radi na tri fronte: analiza temperature, povećanje takta i povećanje napona na čipu. Sada su svi sokovi istisnuti iz GPU-a: standardni NVIDIA drajveri to ne rade, ali softver dobavljača omogućuje vam da jednim klikom izgradite krivulju profiliranja, koja će uzeti u obzir kvalitetu vaše određene instance video kartice.

EVGA je bila jedna od prvih na ovom polju, njen uslužni program Precision XOC ima NVIDIA certificirani skener koji sekvencijalno prolazi kroz cijeli raspon temperatura, frekvencija i napona, postižući maksimalne performanse u svim načinima rada.

Dodajte ovdje novu tehnologiju procesa, brzu memoriju, sve vrste optimizacija i smanjenje toplinskog pakiranja čipova, a rezultat će biti jednostavno nepristojan. Od 1500 "baznih" MHz, GTX 1060 može izgurati više od 2000 MHz ako naiđe dobra kopija, a proizvođač ne zezne s hlađenjem.

Poboljšanje kvalitete slike i percepcije svijeta igre

Performanse su povećane na svim frontama, ali postoji niz točaka u kojima nije bilo kvalitativnih promjena već nekoliko godina: u kvaliteti prikazane slike. I ovdje se ne radi o grafičkim efektima, njih osiguravaju programeri igara, već o tome što točno vidimo na monitoru i kako igra izgleda krajnjem korisniku.

Brza okomita sinkronizacija

Pascalova najvažnija značajka je trostruki međuspremnik za izlaz okvira, koji istovremeno pruža ultra-niska kašnjenja u renderiranju i osigurava vertikalnu sinkronizaciju. Izlazna slika pohranjuje se u jedan međuspremnik, posljednji renderirani okvir pohranjuje se u drugi, a trenutni se iscrtava u treći. Zbogom vodoravne pruge i trganje, zdravo visoke performanse. Ovdje nema kašnjenja koje odgovara klasičnom V-Syncu (budući da nitko ne sputava performanse video kartice i ona uvijek crta u najvećoj mogućoj brzini slika), a na monitor se šalju samo potpuno formirani okviri. Mislim da ću nakon nove godine napisati zasebnu veliku objavu o V-Sync, G-Sync, Free-Sync i ovom novom Nvidijinom algoritmu za brzu sinkronizaciju, previše je detalja.

Normalne snimke zaslona

Ne, te snimke zaslona koje sada postoje su samo šteta. Gotovo sve igre koriste hrpu tehnologije kako bi sliku u pokretu učinile nevjerojatnom i oduzima dah, a snimke zaslona postale su prava noćna mora: umjesto zapanjujuće realistične slike koja se sastoji od animacije, specijalnih efekata koji iskorištavaju osobitosti ljudskog vida, vidite neke nekako uglato ne razumijem što s čudnim bojama i apsolutno beživotnom slikom.

Nova NVIDIA Ansel tehnologija rješava problem sa snimkama zaslona. Da, njegova implementacija zahtijeva integraciju posebnog koda od programera igara, ali postoji minimum stvarnih manipulacija, ali je profit ogroman. Ansel zna kako pauzirati igru, prebacuje kontrolu nad kamerom u vaše ruke, a onda - prostor za kreativnost. Možete samo snimiti sliku bez GUI-ja i svog omiljenog kuta.


Možete prikazati postojeću scenu u ultra-visokoj razlučivosti, snimiti panorame od 360 stupnjeva, spojiti ih u ravninu ili ih ostaviti u 3D za gledanje u VR kacigi. Snimite fotografiju sa 16 bita po kanalu, spremite je kao neku vrstu RAW datoteke, a zatim se poigrajte s ekspozicijom, balansom bijele i ostalim postavkama kako bi snimke zaslona ponovno postale atraktivne. Očekujemo mnoštvo cool sadržaja od ljubitelja igara za godinu ili dvije.

Video obrada zvuka

Nove biblioteke NVIDIA Gameworks dodaju puno značajki dostupnih programerima. Uglavnom su usmjerene na VR i ubrzavanje raznih izračuna, kao i na poboljšanje kvalitete slike, ali jedna od karakteristika je najzanimljivija i vrijedna spomena. VRWorks Audio podiže rad sa zvukom na potpuno novu razinu, brojeći zvuk ne banalnim prosječnim formulama ovisno o udaljenosti i debljini prepreke, već izvodi kompletno praćenje audio signala, sa svim refleksijama iz okoline, reverberacijom i apsorpcijom zvuka u raznih materijala. NVIDIA ima dobar video primjer kako ova tehnologija radi:


Gledajte bolje sa slušalicama

Čisto teoretski, ništa ne sprječava izvođenje takve simulacije na Maxwellu, ali optimizacije u smislu asinkronog izvođenja instrukcija i novi sustav prekida ugrađen u Pascals omogućuju izvođenje izračuna bez značajnog utjecaja na broj sličica u sekundi.

Pascal ukupno

Zapravo, ima još više promjena, a mnoge od njih su toliko duboko u arhitekturi da bi se o svakoj od njih mogao napisati ogroman članak. Ključne novosti su poboljšani dizajn samih čipova, optimizacija na najnižoj razini što se tiče geometrije i asinkroni rad s punim rukovanjem prekidima, mnoštvo značajki skrojenih za rad s visokim rezolucijama i VR-om te, naravno, sulude frekvencije koje prošle generacije video kartica nisu mogle ni sanjati. Prije dvije godine 780 Ti jedva je prešao prag od 1 GHz, danas 1080 u nekim slučajevima radi na dva: i ovdje zasluga nije samo u smanjenoj procesnoj tehnologiji s 28 nm na 16 ili 14 nm: mnoge su stvari optimizirane na najniža razina, počevši od dizajna tranzistora, završavajući njihovom topologijom i vezivanjem unutar samog čipa.

Za svaki pojedinačni slučaj

Linija NVIDIA video kartica serije 10 pokazala se doista uravnoteženom i prilično gusto pokriva sve korisničke slučajeve igara, od opcije "igrati strategiju i diablo" do "Želim vrhunske igre u 4k". Testovi igara odabrani su prema jednoj jednostavnoj tehnici: pokriti što širi raspon testova s ​​najmanjim mogućim skupom testova. BF1 je izvrstan primjer dobre optimizacije i omogućuje vam da usporedite performanse DX11 i DX12 pod istim uvjetima. DOOM je odabran iz istog razloga, samo za usporedbu OpenGL-a i Vulkana. Treći "Witcher" ovdje djeluje kao koliko-toliko optimizirana igračka, u kojoj maksimalne grafičke postavke dopuštaju da bilo koji vodeći brod bude zeznut jednostavno na temelju usranog koda. Koristi klasični DX11, koji je vremenski testiran i savršeno razrađen u upravljačkim programima te je poznat programerima igara. Overwatch je ep za sve "turnirske" igre koje imaju dobro optimiziran kod, dapače zanimljivo je koliki je prosječni FPS u igrici koja nije jako teška s grafičke strane, naoštrena za rad u " prosječna" konfiguracija dostupna u cijelom svijetu.

Odmah ću dati neke općenite komentare: Vulkan je vrlo proždrljiv u pogledu video memorije, za njega je ova karakteristika jedan od glavnih pokazatelja, a vidjet ćete da se ova teza odražava u mjerilima. DX12 na AMD karticama ponaša se mnogo bolje nego na NVIDIA, ako "zeleni" pokazuju prosječno smanjenje FPS-a na novim API-jima, onda "crveni", naprotiv, pokazuju povećanje.

juniorska divizija

GTX 1050

Mlađa NVIDIA (bez slova Ti) nije zanimljiva kao njena nabrijana sestra sa slovima Ti. Njegova sudbina je gaming rješenje za MOBA igrice, strategije, turnirske pucačine i druge igrice u kojima detalji i kvaliteta slike malo koga zanimaju, a stabilan frame rate za minimalan novac je ono što je doktor naredio.


Na svim slikama nema osnovne frekvencije, jer je individualna za svaku instancu: 1050 bez dodatnih. snaga možda neće juriti, a njezina sestra sa 6-pinskim konektorom lako će uzeti uvjetnih 1,9 GHz. Što se tiče snage i duljine, prikazane su najpopularnije opcije, uvijek možete pronaći video karticu s drugim krugom ili drugim hlađenjem koje se ne uklapa u navedene "standarde".

DOOM 2016 (1080p, ULTRA): OpenGL - 68 FPS, Vulkan - 55 FPS;
The Witcher 3: Wild Hunt (1080p, MAX, HairWorks Off): DX11 - 38 FPS;
Battlefield 1 (1080p, ULTRA): DX11 - 49 FPS, DX12 - 40 FPS;
Overwatch (1080p, ULTRA): DX11 - 93 FPS;

GTX 1050 ima grafički procesor GP107, naslijeđen od starije kartice s blagim skraćivanjem funkcionalnih blokova. 2 GB video memorije neće vas pustiti da divljate, ali za discipline e-sporta i igranje neke vrste tenkova savršeno je, jer cijena za juniorsku karticu počinje od 9,5 tisuća rubalja. Dodatno napajanje nije potrebno, video kartica treba samo 75 vata s matične ploče preko PCI-Express utora. Istina, u ovom cjenovnom segmentu postoji i AMD Radeon RX460, koji je s ista 2 GB memorije jeftiniji, a kvalitetom gotovo da i ne zaostaje, a za otprilike isti novac možete dobiti RX460, ali u 4 GB verzija. Ne da su mu puno pomogli, ali neka rezerva za budućnost. Izbor dobavljača nije toliko važan, možete uzeti ono što je dostupno i ne izvlačite džep s dodatnih tisuću rubalja, što je bolje potrošiti na njegovana slova Ti.

GTX 1050 Ti

Otprilike 10 tisuća za uobičajeni 1050 nije loše, ali za napunjenu (ili punu, nazovite je kako želite) verziju traže malo više (u prosjeku 1-1,5 tisuća više), ali njegovo punjenje je mnogo zanimljivije . Usput, cijela serija 1050 proizvedena je ne iz rezanja / odbacivanja "velikih" čipova koji nisu prikladni za 1060, već kao potpuno neovisni proizvod. Ima manji proizvodni proces (14 nm), drugačije postrojenje (kristale uzgaja tvornica Samsung), a tu su i iznimno zanimljivi primjerci s dodatnim. napajanje: toplinski paket i osnovna potrošnja su i dalje isti 75 W, ali overclocking potencijal i mogućnost da se ide preko dopuštenog potpuno su drugačiji.


Ako nastavite igrati na FullHD razlučivosti (1920x1080), ne planirate nadogradnju, a vaš ostatak hardvera je star 3-5 godina, to je sjajan način da povećate performanse u igračkama uz male gubitke. Treba se fokusirati na ASUS i MSI rješenja s dodatnim 6-pinskim napajanjem, opcije iz Gigabytea nisu loše, ali cijena nije tako ohrabrujuća.

DOOM 2016 (1080p, ULTRA): OpenGL - 83 FPS, Vulkan - 78 FPS;
The Witcher 3: Wild Hunt (1080p, MAX, HairWorks Off): DX11 - 44 FPS;
Battlefield 1 (1080p, ULTRA): DX11 - 58 FPS, DX12 - 50 FPS;
Overwatch (1080p, ULTRA): DX11 - 104 FPS.

Srednja divizija

Video kartice 60. linije odavno se smatraju najboljim izborom za one koji ne žele potrošiti puno novca, a istovremeno igrati na visokim grafičkim postavkama u svemu što će biti objavljeno u sljedećih nekoliko godina. Počelo je s GTX 260, koji je imao dvije verzije (jednostavniju, 192 stream procesora i masniju, 216 “kamenčića”), nastavilo se u 400., 500. i 700. generaciji, a sada je NVIDIA ponovno ušla u gotovo savršenu kombinaciju cijena i kvaliteta. Ponovno su dostupne dvije "srednje" verzije: GTX 1060 s 3 i 6 GB video memorije razlikuju se ne samo u količini dostupnog RAM-a, već iu performansama.

GTX 1060 3GB

Kraljica esporta. Razumna cijena, nevjerojatna izvedba za FullHD (a u eSportu rijetko koriste višu rezoluciju: tu su rezultati važniji od ljepote), razumna količina memorije (3 GB, za minutu, bilo je prije dvije godine u vrhunskom GTX 780 Ti , koji košta nepristojan novac). Što se tiče performansi, mlađi 1060 bez problema svlada lanjski GTX 970 s nezaboravnih 3,5 GB memorije, a bez problema za uši vuče i pretprošlogodišnji superflagship 780 Ti.


DOOM 2016 (1080p, ULTRA): OpenGL - 117 FPS, Vulkan - 87 FPS;
The Witcher 3: Wild Hunt (1080p, MAX, HairWorks isključen): DX11 - 70 FPS;
Battlefield 1 (1080p, ULTRA): DX11 - 92 FPS, DX12 - 85 FPS;
Overwatch (1080p, ULTRA): DX11 - 93 FPS.

Ovdje je apsolutni favorit u pogledu cijene i ispušnih plinova verzija iz MSI-ja. Dobre frekvencije, tihi sustav hlađenja i razumne dimenzije. Za nju ne traže ništa, oko 15 tisuća rubalja.

GTX 1060 6GB

Verzija od 6 GB jeftina je ulaznica za VR i visoke rezolucije. Neće gladovati za memorijom, malo je brži u svim testovima i sigurno će nadmašiti GTX 980 gdje prošlogodišnja video kartica neće imati dovoljno 4 GB video memorije.


DOOM 2016 (1080p, ULTRA): OpenGL - 117 FPS, Vulkan - 121 FPS;
The Witcher 3: Wild Hunt (1080p, MAX, HairWorks Off): DX11 - 73 FPS;
Battlefield 1 (1080p, ULTRA): DX11 - 94 FPS, DX12 - 90 FPS;
Overwatch (1080p, ULTRA): DX11 - 166 FPS.

Želio bih još jednom primijetiti ponašanje video kartica pri korištenju Vulkan API-ja. 1050 s 2 GB memorije - FPS pad. 1050 Ti s 4 GB - gotovo jednak. 1060 3 GB - smanjenje. 1060 6 GB - rast rezultata. Mislim da je trend jasan: Vulkanu treba 4+ GB video memorije.

Problem je u tome što obje 1060 nisu male video kartice. Čini se da je toplinski paket razuman, a ploča je stvarno mala, ali mnogi proizvođači su odlučili jednostavno unificirati sustav hlađenja između 1080, 1070 i 1060. Netko ima video kartice visoke 2 utora, ali duge 28+ centimetara, netko je napravio oni kraći, ali deblji (2,5 utora). Birajte pažljivo.

Nažalost, dodatna 3 GB video memorije i otključana računalna jedinica koštat će vas ~ 5-6 tisuća rubalja povrh cijene verzije od 3 GB. Palit u ovom slučaju ima najzanimljivije opcije u odnosu cijene i kvalitete. ASUS je izbacio monstruozne rashladne sustave od 28 cm, koji su isklesani na 1080, 1070 i 1060, a takva video kartica nigdje neće stati, verzije bez tvorničkog overclockinga koštaju gotovo isto, a ispuh je manji, a traže se više za relativno kompaktan MSI od konkurenata na otprilike istoj razini kvalitete i tvorničkog overclockinga.

Glavna liga

Igrati za sav novac u 2016. je teško. Da, 1080 je ludo cool, ali perfekcionisti i hardveraši znaju da NVIDIA KRIJE postojanje super-perjanskog 1080 Ti, koji bi trebao biti nevjerojatno cool. Prve specifikacije već cure online, a jasno je da zeleni čekaju crveno-bijele da uskoče: neka vrsta uber-puške koju u trenu može staviti na mjesto novi kralj 3D grafike, veliki i moćni GTX 1080 Ti. Pa za sada imamo što imamo.

GTX 1070

Prošlogodišnje dogodovštine megapopularnog GTX 970 i njegove ne baš poštene memorije od 4 gigabajta aktivno su se sređivale i isisavale po cijelom internetu. To je nije spriječilo da postane najpopularnija gaming grafička kartica na svijetu. Uoči promjene godine u kalendaru, drži prvo mjesto u Steam Hardware & Software Survey. To je razumljivo: kombinacija cijene i performansi bila je jednostavno savršena. A ako ste propustili prošlogodišnju nadogradnju i 1060 vam se ne čini dovoljno lošim, GTX 1070 je vaš izbor.

Razlučivosti od 2560x1440 i 3840x2160 video kartica probavlja s praskom. Sustav za overclocking Boost 3.0 pokušat će dodati drva za ogrjev kada se opterećenje GPU-a poveća (to jest, u najtežim scenama, kada FPS pada pod naletom specijalnih efekata), overclockirajući procesor video kartice na nevjerojatnih 2100+ MHz. Memorija lako dobije 15-18% efektivne frekvencije iznad tvorničkih vrijednosti. Čudovišna stvar.


Pažnja, svi testovi se provode u 2.5k (2560x1440):

DOOM 2016 (1440p, ULTRA): OpenGL - 91 FPS, Vulkan - 78 FPS;
The Witcher 3: Wild Hunt (1440p, MAX, HairWorks isključen): DX11 - 73 FPS;
Battlefield 1 (1440p, ULTRA): DX11 - 91 FPS, DX12 - 83 FPS;
Overwatch (1440p, ULTRA): DX11 - 142 FPS.

Naravno, nemoguće je izvući ultra-postavke u 4k i nikada ne pasti ispod 60 sličica u sekundi ni ovom karticom ni 1080, ali možete igrati na uvjetnim "visokim" postavkama, isključivanjem ili blago smanjivanjem najproždrljivijih značajki u potpunosti rezolucije, a što se stvarnih performansi tiče, grafička kartica bez problema pobjeđuje čak i gotovo dvostruko skuplju lanjski 980 Ti. Gigabyte ima najzanimljiviju opciju: uspjeli su strpati punopravni 1070 u ITX standardno kućište. Zahvaljujući skromnom toplinskom paketu i energetski učinkovitom dizajnu. Cijene kartica počinju od 29-30 tisuća rubalja za ukusne opcije.

GTX 1080

Da, perjanica nema slova Ti. Da, ne koristi najveći GPU dostupan od NVIDIA-e. Da, ovdje nema cool HBM 2 memorije, a grafička kartica ne izgleda kao Zvijezda smrti ili, u krajnjem slučaju, Imperial krstarica klase Star Destroyer. I da, to je trenutno najbolja grafička kartica za igranje. Jedan po jedan uzima i pokreće DOOM u rezoluciji 5k3k pri 60fps na ultra postavkama. Sve nove igračke su mu podložne i sljedećih godinu ili dvije neće imati problema: dok nove tehnologije ugrađene u Pascal ne postanu raširene, dok motori igara ne nauče kako učinkovito učitati dostupne resurse ... Da, za nekoliko godine reći ćemo: “Evo, pogledajte GTX 1260, prije par godina vam je trebao flagship da igrate na tim postavkama”, ali za sada su najbolje od najboljih grafičkih kartica dostupne prije nove godine po vrlo povoljnim cijenama. cijena.


Pažnja, svi testovi se provode u 4k (3840x2160):

DOOM 2016 (2160p, ULTRA): OpenGL - 54 FPS, Vulkan - 78 FPS;
The Witcher 3: Wild Hunt (2160p, MAX, HairWorks Off): DX11 - 55 FPS;
Battlefield 1 (2160p, ULTRA): DX11 - 65 FPS, DX12 - 59 FPS;
Overwatch (2160p, ULTRA): DX11 - 93 FPS.

Ostaje samo odlučiti: treba li vam ili možete uštedjeti novac i uzeti 1070. Nema velike razlike između igranja na "ultra" ili "high" postavkama, budući da moderni motori savršeno crtaju sliku u visokoj razlučivosti čak i na srednjoj postavke: uostalom, imamo niste sapunaste konzole koje ne mogu pružiti dovoljno performansi za poštenih 4k i stabilnih 60fps.

Ako odbacimo najjeftinije opcije, onda će Palit opet imati najbolju kombinaciju cijene i kvalitete u verziji GameRock (oko 43-45 tisuća rubalja): da, sustav hlađenja je "debeo", 2,5 utora, ali video kartica je kraći od konkurenata, a par 1080 rijetko se ugrađuje. SLI polako umire, a ni životvorna injekcija brzih mostova mu ne pomaže puno. ASUS ROG opcija nije loša ako imate instalirano puno dodataka. ne želite pokriti dodatne utore za proširenje: njihova video kartica je debela točno 2 utora, ali zahtijeva 29 centimetara slobodnog prostora od stražnjeg zida do košare za tvrdi disk. Pitam se hoće li Gigabyte moći izdati ovo čudovište u ITX formatu?

Rezultati

Nove NVIDIA video kartice upravo su pokopale tržište rabljenog hardvera. Na njemu preživljava samo GTX 970, koji se može ugrabiti za 10-12 tisuća rubalja. Potencijalni kupci rabljenih 7970 i R9 280 često ga nemaju kamo staviti i jednostavno ga ne hrane, a mnoge opcije sa sekundarnog tržišta jednostavno ne obećavaju, a kao jeftina nadogradnja za nekoliko godina unaprijed nisu dobre: ​​malo je memorije, nove tehnologije nisu podržane. Ljepota nove generacije video kartica je u tome što čak i igre koje nisu optimizirane za njih rade puno veselije nego na veteranskim GPU ljestvicama prošlih godina, i teško je zamisliti što će se dogoditi za godinu dana, kada motori igara nauče koristiti punu moć novih tehnologija.

GTX 1050 i 1050Ti

Nažalost, ne mogu preporučiti kupnju najjeftinijeg Pascala. RX 460 obično se prodaje za tisuću-dvije manje, a ako vam je budžet toliko ograničen da uzimate video karticu “za najnoviju”, onda je Radeon objektivno zanimljivija investicija. S druge strane, 1050 je malo brži i ako su cijene u vašem gradu za ove dvije video kartice skoro iste, uzmite ga.

1050Ti je, pak, izvrsna opcija za one koji cijene priču i gameplay više od zvona i zviždaljki i realističnih dlaka na nosu. Nema usko grlo u vidu 2 GB video memorije, neće “pasti” nakon godinu dana. Možete staviti novac na to - učinite to. The Witcher na visokim postavkama, GTA V, DOOM, BF 1 - nema problema. Da, morat ćete odustati od brojnih poboljšanja, kao što su ekstra duge sjene, složena teselacija ili "skupi" izračun samosjenčanih modela s ograničenim praćenjem zraka, ali u žaru bitke zaboravit ćete na te ljepotice nakon 10 minuta igranja, a stabilnih 50-60 sličica u sekundi dat će puno više imerzivnog efekta od živčanih skokova s ​​25 na 40, ali s postavkama na "maximum".

Ako imate bilo koju Radeon 7850, GTX 760 ili mlađu video karticu s 2 GB video memorije ili manje, možete je sigurno promijeniti.

GTX 1060

Mlađi 1060 će zadovoljiti one kojima je broj sličica u sekundi od 100 FPS važniji od grafičkih zvona i zviždaljki. Ujedno će vam omogućiti ugodno igranje svih izdanih igračaka u FullHD rezoluciji s visokim ili maksimalnim postavkama i stabilnih 60 sličica u sekundi, a cijenom se jako razlikuje od svega što dolazi nakon njega. Stariji 1060 sa 6 gigabajta memorije je beskompromisno rješenje za FullHD s marginom performansi za godinu-dvije, poznavanjem VR-a i sasvim prihvatljivim kandidatom za igranje u visokim rezolucijama na srednjim postavkama.

Nema smisla mijenjati GTX 970 GTX 1060, trebat će još godinu dana. Ali dosadne 960, 770, 780, R9 280X i starije jedinice mogu se sigurno ažurirati na 1060.

Gornji segment: GTX 1070 i 1080

Malo je vjerojatno da će 1070 postati popularan kao GTX 970 (ipak, većina korisnika ima ciklus ažuriranja željeza svake dvije godine), ali u pogledu cijene i kvalitete, svakako je dostojan nastavak 70. linije. Samo grinda igre na mainstream 1080p, lako se nosi s 2560x1440, podnosi iskušenje neoptimiziranih 21 na 9, i prilično je sposoban prikazati 4k, iako ne na maksimalnim postavkama.


Da, i SLI može biti takav.

Pozdravljamo se sa svakim 780 Ti, R9 390X i ostalim prošlogodišnjim 980-icama, pogotovo ako se želimo igrati u visokoj rezoluciji. I, da, ovo je najbolja opcija za one koji vole napraviti paklenu kutiju u Mini-ITX formatu i plašiti goste 4k igrama na TV-u od 60-70 inča koji radi na računalu veličine aparata za kavu.
povijest grafičke kartice gtx 1050 Dodaj oznake

NVIDIA se priprema izdati novu seriju gaming grafičkih kartica, koju će otvoriti GeForce GTX 1080. Ovaj model će biti prvi proizvod gaming klase temeljen na Pascal arhitekturi. GeForce GTX 1080 će donijeti niz tehnoloških inovacija o kojima ćemo govoriti u ovom članku. Materijal će biti teorijske prirode, raspravlja o arhitektonskim značajkama i novim značajkama GeForce GTX 1080. Testiranje i usporedba s drugim video karticama pojavit će se kasnije.

Brzi napredak u minijaturizaciji silicijskih čipova posljednjih je godina usporen. Intel je čak napustio tik-tak strategiju, koja je uključivala redoviti prijelaz na tanju procesnu tehnologiju. Nekoliko generacija NVIDIA i AMD proizvoda promijenilo se na tržištu grafičkih akceleratora u okviru jedne 28-nm procesne tehnologije. Djelomično je to bilo korisno i prisililo je proizvođače da posvete više pozornosti razvoju arhitekture. Taj kvalitativni prijelaz bio je jasno vidljiv svojedobno pri prelasku s Keplera na Maxwell arhitekturu, kada se nova generacija pokazala produktivnijom i energetski učinkovitijom bez povećanja broja tranzistora ili čak smanjenja veličine kristala. Na primjer, GeForce GTX 980 temelji se na kompaktnijem GM204 čipu, što ne sprječava video karticu da pokaže veće performanse u usporedbi s GeForce GTX 780 Ti sa složenijim GK110 čipom.

Nova generacija GeForcea dobit će i novu arhitekturu i tanju procesnu tehnologiju. A GeForce GTX 1080 je pionir na mnogo načina. Ovo je prvi GPU Pascal arhitekture s GP104 GPU-om koji se temelji na 16nm FinFET procesnoj tehnologiji. Među važnim inovacijama NVIDIA ističe brzu GDDR5X memoriju. Nove tehnološke značajke omogućuju vam da podignete frekvencije na rekordne razine, definirajući novu razinu "majstorstva". A nove gaming tehnologije proširuju mogućnosti GeForcea, posebice u području rada s VR sadržajem. Ovo je pet glavnih značajki koje proizvođač ističe u novom proizvodu.

Vrijedno je napomenuti da je u početku Tesla P100 specijalizirani računalni akcelerator postao pionir Pascal arhitekture. Temelji se na GP100 procesoru. No budući da je proizvod fokusiran na sasvim drugo područje primjene, GeForce GTX 1080 je pionir među desktop grafičkim akceleratorima.

GPU GP104 je nasljednik GM204, tako da kada proučavate GeForce GTX 1080, možete graditi na GeForce GTX 980, iako je pridošlica brža od GeForce GTX 980 Ti i GeForce GTX Titan X. Pascal procesori koriste strukturu klastera sličnu njihovih prethodnika, gdje je GPC klaster (Graphics Processing Cluster) u biti neovisna računalna jedinica. GP100 se temelji na šest klastera, GP104 ima četiri klastera, a sljedeći čip GP106 trebao bi dobiti dva klastera. Četiri GPC-a čine novi GP104 GPU što bližim GM204. I blok dijagram ovog čipa također podsjeća na stari procesor.

Razlike u strukturi postaju vidljive nakon detaljnijeg ispitivanja. U prošloj generaciji klaster je uključivao četiri velike višeprocesorske SMM jedinice. U GP104 niže izvršne jedinice grupirane su u pet SM višeprocesorskih jedinica. Svaka tako velika jedinica za obradu podataka povezana je s vlastitom jedinicom za obradu geometrije Polymorph Enginea, kojih sada ima 20 umjesto 16 za GM204.

Jedan SM je podijeljen u četiri niza za obradu podataka s vlastitom kontrolnom logikom, a to je također slično strukturi starijih GPU-a. I u oba slučaja, multiprocesor radi sa 128 streaming jezgri (CUDA jezgre). SM ima 96 KB dijeljene predmemorije, odvojenu predmemoriju teksture i osam jedinica teksture. Kao rezultat toga, imamo konfiguraciju od 2560 stream procesora i 160 teksturnih jedinica. Novi procesor ima 64 ROP-a i 2 MB L2 cachea - nema razlike u odnosu na GM204.

Ima više memorijskih kontrolera, Pascal je promijenio cijeli memorijski podsustav. Umjesto četiri 64-bitna kontrolera, implementirano je osam 32-bitnih kontrolera, što osigurava širinu memorijske sabirnice od 256 bita. Nakon uspješne GeForce GTX 980, takva memorijska sabirnica u vrhunskom proizvodu više ne čudi. U isto vrijeme, učinkovitost sabirnice GeForce GTX 1080 veća je zbog novih algoritama za kompresiju podataka. Također, rast propusnosti osiguravaju mikro krugovi novog standarda GDDR5X, u kojem je efektivna vrijednost razmjene podataka ekvivalentna frekvenciji od 10 GHz. Uobičajena GDDR5 memorija bila je ograničena na frekvencije do 7 GHz. Video međuspremnik je povećan na 8 GB.

Zahvaljujući novoj procesnoj tehnologiji, GP104 je kompaktniji od GM204 s više računalnih jedinica. U isto vrijeme, novi procesor ima više mogućnosti za povećanje frekvencija. U početku je bila postavljena na osnovnu vrijednost od 1607 MHz s prosječnim taktom pojačanja od 1733 MHz. Vrijednosti vršne frekvencije su čak i veće. S takvim rekordnim frekvencijama GeForce GTX 1080 uklapa se u TDP od 180 W, što je nešto više od GeForce GTX 980. Ali novajlija je brža od top Ti verzije koja ima osjetno viši TDP.

Za vizualnu usporedbu, sažmimo karakteristike GeForce GTX 1080 i vrhunskih video kartica prethodnih generacija u jednu tablicu.

Video adapter GeForce GTX 1080 GeForce GTX Titan X GeForce GTX 980 Ti GeForce GTX 980 GeForce GTX 780 Ti
Jezgra GP104 GM200 GM200 GM204 GK110
Broj tranzistora, milijun komada 7200 8000 8000 5200 7100
Procesna tehnika, nm 16 28 28 28 28
Osnovna površina, sq. mm 314 601 601 398 561
Broj stream procesora 2560 3072 2816 2048 2880
Broj blokova teksture 160 192 176 128 240
Broj jedinica renderiranja 64 96 96 64 48
Frekvencija jezgre, MHz 1607-1733 1000-1075 1000-1075 1126-1216 875-926
Memorijska sabirnica, bit 256 386 386 256 384
Vrsta memorije GDDR5X GDDR5 GDDR5 GDDR5 GDDR5
Frekvencija memorije, MHz 10010 7010 7010 7010 7010
Veličina memorije, MB 8192 12288 6144 4096 3072
Podržana verzija DirectX-a 12.1 12.1 12.1 12.1 12.0
Sučelje PCI-E3.0 PCI-E3.0 PCI-E3.0 PCI-E3.0 PCI-E3.0
Snaga, W 180 250 250 165 250

NVIDIA-ine grafičke kartice srednjeg i vrhunskog ranga već dugo imaju tehnologiju GPU Boost, koja povećava frekvenciju GPU-a sve dok ne prijeđe ograničenja temperature ili snage. Minimalna vrijednost za 3D način je osnovna frekvencija, ali često pod normalnim opterećenjem igranja, frekvencije su uvijek više. Novi GeForces dobili su poboljšanu tehnologiju GPU Boost 3.0 s fleksibilnijim algoritmom za promjenu frekvencije ovisno o naponu napajanja u načinu rada frekvencijskog ubrzanja. GPU Boost 2.0 ima fiksnu razliku između osnovne vrijednosti i Turbo frekvencije. GPU Boost 3.0 omogućuje korištenje različitih pomaka frekvencije, što će bolje otkriti potencijal GPU-a. Teoretski, kada se parametri automatski mijenjaju u Boost modu s povećanjem ili smanjenjem napona, frekvencija će se mijenjati nelinearno, u nekim točkama Boost delta može biti veća nego što bi bila s GPU Boostom stara verzija. Korisnicima će biti dostupne nove fleksibilne mogućnosti podešavanja Boosta. Najnovija verzija uslužnog programa EVGA Precision već podržava GeForce GTX 1080, među njegovim značajkama je automatski skener s testom stabilnosti koji može generirati nelinearnu krivulju frekvencije pojačanja za različite napone. Prijelaz na novu procesnu tehnologiju i optimizacija jezgrene strukture omogućili su postizanje tako značajnog frekvencijskog ubrzanja da se maksimalni Boost u odnosu na deklarirane vrijednosti može povećati na 2 GHz.

Od pojave GDDR5, NVIDIA radi na sljedećoj generaciji memorije velike brzine. Rezultat interakcije s programerima memorije bila je pojava GDDR5X s brzinom prijenosa podataka od 10 Gb / s. Rad s tako brzom memorijom postavlja nove zahtjeve za ožičenje električnih krugova. Stoga su linije za prijenos podataka između GPU-a i memorijskih čipova redizajnirane, struktura samog čipa je promijenjena. Sve vam to omogućuje učinkovit rad s ultra-brzim video međuspremnikom. Među prednostima GDDR5X je niži radni napon od 1,35V.

S efektivnom memorijskom frekvencijom od 10.000 MHz, povećanje propusnosti u odnosu na uobičajenih 7012 MHz za trenutnu generaciju je gotovo 43%. Ali prednosti Pascala ne staju tu. GeForce podržava posebne algoritme za kompresiju podataka u memoriji, što omogućuje učinkovitije korištenje predmemorije i prijenos više podataka za istu propusnost. Podržano je nekoliko tehnika, ovisno o vrsti podataka odabire se drugačiji algoritam kompresije. Važnu ulogu igra algoritam delta kompresije boja. Zahvaljujući njemu, ne kodira se boja svakog pojedinačnog piksela, već razlika između piksela tijekom serijskog prijenosa podataka. Izračunavaju se podaci o prosječnoj boji pločice i pomaku boje za svaki piksel ove pločice.

Ova kompresija čini Maxwella visoko produktivnim, ali Pascal je još učinkovitiji. GP104 GPU dodatno podržava nove algoritme s još većom kompresijom za slučajeve gdje je razlika između boja minimalna.

NVIDIA kao primjer navodi dva slajda iz igre Project CARS. One pločice na kojima je primijenjena kompresija podataka obojene su u ružičastu boju. Gornji slajd prikazuje rad kompresije na Maxwellu, donji na Pascalu.

Kao što vidite, Pascal kompresija se također primjenjuje na ona područja gdje se ne izvodi na Maxwellu. Kao rezultat toga, gotovo cijeli okvir bio je komprimiran. Naravno, učinkovitost takvih algoritama ovisi o svakoj pojedinoj sceni. Prema NVIDIA-i, razlika u ovoj učinkovitosti između GeForce GTX 1080 i GeForce GTX 980 kreće se od 11% do 28%. Ako uzmemo 20% kao prosječnu vrijednost, tada uzimajući u obzir povećanje memorijskih frekvencija, rezultirajuće povećanje propusnosti je oko 70%.

Sljedeća generacija GeForcea podržava Async Compute s poboljšanim korištenjem računala za različiti tipovi zadaci. U modernim igrama, GPU-ovi mogu obavljati druge zadatke istovremeno s prikazom slika. To može biti izračun fizike tijela, naknadna obrada slike i posebna tehnika asinkrone vremenske distorzije (Asynchronous Time Warp) za mod virtualne stvarnosti. Prilikom izvođenja različitih zadataka nisu uvijek uključene sve računalne jedinice, a izvršenje svakog zadatka može trajati različito. Na primjer, ako negrafička izračunavanja traju dulje od grafičkih izračunavanja, tada još uvijek čeka da se svaki proces dovrši kako bi se prebacio na nove zadatke. U isto vrijeme, dio GPU resursa je u stanju mirovanja. Pascal je uveo dinamičko balansiranje opterećenja. Ako je jedan zadatak ranije završen, tada se oslobođeni resursi povezuju s drugim zadatkom.

Stoga je moguće izbjeći zastoje i povećati ukupnu izvedbu kombiniranim opterećenjem GPU-a. Kod takvog opterećenja bitnu ulogu igra i brzina prebacivanja između zadataka. Pascal podržava prekid zadatka na različitim razinama za najbrže moguće prebacivanje. Kada se primi nova naredba, procesor prekida zadatke na razini obrade piksela i toka, spremajući njihovo stanje za daljnji završetak, a računalne jedinice se preuzimaju za novi zadatak. Pascal podržava prekide na razini instrukcija, Maxwell i Kepler samo na razini niti.

Prekid na različitim razinama omogućuje vam točnije određivanje trenutka prebacivanja zadatka. Ovo je važno za tehniku ​​Asynchronous Time Warp, koja deformira već formiranu sliku prije nego što se ispiše na ispravak prema položaju glave. Uz Asynchronous Time Warp, potreban vam je brzi vodič za prebacivanje striktno prije nego što se okvir prikaže, inače su mogući artefakti u obliku "drhtanja" slike. Pascal se najbolje nosi s ovim zadatkom.

Pascal je predstavio hardversku podršku za tehnologiju višestrukih projekcija, koja vam omogućuje istovremeni rad s različitim projekcijama slike. Poseban blok Istovremena višestruka projekcija unutar PolyMorph Enginea odgovorna je za generiranje različitih projekcija prilikom obrade jednog toka geometrije. Ovaj blok istovremeno obrađuje geometriju za 16 projekcija s jednim ili dva središta perspektive. To ne zahtijeva ponovnu obradu geometrije i omogućuje repliciranje podataka do 32 puta (16 projekcija po dvije točke).

Zahvaljujući tehnologiji, možete dobiti ispravnu sliku na konfiguracijama s više monitora. Kada koristite tri monitora, slika se renderira za jednu projekciju. Ako se rubni monitori zakrenu pod blagim kutom kako bi se stvorio ambijentalni učinak, tada ćete dobiti netočnu geometriju u bočnim zonama. Višestruka projekcija stvara ispravnu sliku, formirajući ispravnu projekciju u skladu s kutom monitora. Jedini uvjet za ovaj način je da sama aplikacija podržava široki FOV.

Ova tehnika snimanja omogućuje najučinkovitiju upotrebu zakrivljenih ploča, a također otvara mogućnosti za ispravno iscrtavanje na drugim uređajima za prikaz, čak i na sfernom zaslonu.

Ova tehnologija proširuje mogućnosti Pascala u formiranju stereo slike iu sustavima virtualne stvarnosti (VR). U stereo modu, dvije slike iste scene generiraju se za svako oko. Hardverska podrška za simultanu višestruku projekciju omogućuje vam stvaranje svake projekcije za vaše oko jednom obradom geometrije pomoću Single Pass Stereo tehnologije. I značajno ubrzava rad u ovom načinu rada.

U VR sustavima korisnik koristi naočale s posebnim lećama koje unose određena izobličenja. Kako bi se to kompenziralo, slika je malo deformirana na rubovima, a korisnik na kraju promatra sliku ispravljenu lećom. Ali u početku video kartica ocrtava sliku u uobičajenoj ravnoj projekciji, a zatim dio periferne slike nestaje.

Tehnologija Lens Matched Shading može podijeliti sliku u četiri kvadranta i zatim uzorkovati piksele. To jest, slika se u početku projicira na nekoliko ravnina koje simuliraju zakrivljeni oblik leće.

Konačna slika se renderira u nižoj razlučivosti, nepotrebna područja su odrezana. U početku, slika Oculus Rifta je 1,1 megapiksela po oku, ali originalna ravna projekcija je prikazana na 2,1 megapiksela. Zahvaljujući Lens Matched Shadingu, početna slika bit će 1,4 megapiksela. To vam omogućuje značajno povećanje performansi u VR načinu rada.

Virtualna stvarnost obećavajući je smjer koji će proširiti iskustvo interakcije s virtualnim okruženjem i dati igračima nove senzacije. NVIDIA aktivno podržava razvoj VR-a. Jedan od ograničavajućih čimbenika za popularizaciju VR sustava su visoki zahtjevi za performansama grafičkog akceleratora. Posebne tehnologije i optimizacija hardvera doprinose kvalitativnom povećanju performansi u ovom smjeru. Tvrtka je izdala sveobuhvatan skup VRWorks iz posebnih API-ja, biblioteka i softverskih motora. Uključuje alate za rad sa Single Pass Stereo i Lens Matched Shading. Također uključuje tehnologiju MultiRes Shading, koja vam omogućuje promjenu rezolucije u bočnim zonama tijekom VR renderiranja kako biste smanjili opterećenje.

Učinak prisutnosti povezan je ne samo s vizualnim osjetima, već i s drugim osjetilima. Zvuk također igra važnu ulogu. Zato je NVIDIA razvila VRWorks Audio tehnologiju za ponovno stvaranje realističnog zvuka na temelju položaja izvora. zvučni valovi i refleksije od površina. Tehnologija koristi OptiX motor koji se izvorno koristio za renderiranje rasvjete metodom praćenja zraka. Prati put zvučnih "zraka" od izvora do reflektirajućih površina i natrag. Ova progresivna metoda omogućit će vam ponovno stvaranje realističnog zvuka, uzimajući u obzir akustične značajke virtualne sobe i uz nametanje reflektiranih zvukova. Saznajte više o NVIDIA VRWorks Audio u videu:

Učinak uranjanja možete poboljšati interakcijom s virtualnim okruženjem. Sada je interaktivnost implementirana kroz praćenje položaja i praćenje ručnih kontrolera. Na temelju PhysX-a stvoren je mehanizam koji određuje hoće li doći do interakcije tijekom virtualnog kontakta s jednim ili drugim objektom. Također s PhysX-om možete implementirati fizički pouzdane efekte kada ste izloženi virtualnom okruženju.

Nova generacija video kartica ima podršku za VR SLI. Ovaj način rada omogućuje da zasebni GPU obrađuje sliku za svako oko u VR načinu rada. Ova metoda eliminira kašnjenja u SLI radu i pruža bolje performanse. Podrška za VR SLI bit će implementirana u Unreal Engine 4 i Unity, što nam omogućuje da se nadamo većoj popularizaciji ove tehnologije kako dostupnost sustava virtualne stvarnosti bude rasla.

Jednostavna SLI tehnologija također je ažurirana. Starije GeForce video kartice uvijek su imale dva konektora za SLI mostove. Ovi mostovi su potrebni za međusobno prebacivanje svih video kartica u 3-Way i 4-Way SLI modovima. Sada u jednostavnom SLI-u, dvije video kartice mogu koristiti dva komunikacijska sučelja odjednom, povećavajući ukupnu propusnost.

Nova metoda prebacivanja zahtijeva nove dvostruke SLI HB mostove. Zadržana je podrška za dijeljeni način rada kada je povezan putem jednostavnog jednostrukog mosta. Dvostruki most se preporučuje za visoke rezolucije - 4K, 5K i sustave s više monitora. Također se preporučuje premošćivanje brzine pri 2K s monitorom od 120 Hz ili bržim. U jednostavnijim načinima, možete proći s mostom starog stila.

GeForce GTX 1080 je povećao brzinu samog sučelja – sa 400 MHz na 650 MHz. Može se implementirati s novim mostovima i nekim verzijama starog formata. Povećanje brzine prijenosa podataka u SLI-ju omogućuje glatke promjene okvira i određeno povećanje performansi u teškim načinima rada.

Mogućnosti multi-GPU renderiranja u DirectX 12 su poboljšane. S takvim konfiguracijama podržane su dvije glavne vrste rada: Multi Display Adapter (MDA) i Linked Display Adapter (LDA). Prvi vam omogućuje da radite zajedno s različitim GPU-ovima, uključujući kombiniranje potencijala integrirane i vanjske grafike. LDA je dizajniran za dijeljenje sličnih rješenja. Implicitni LDA se u biti koristi u SLI-ju, koji pruža široku kompatibilnost s aplikacijama na razini softvera. Eksplicitni LDA i MDA daju više mogućnosti programerima, ali na njima je da osiguraju ovaj način rada u svakoj aplikaciji.

Također je vrijedno napomenuti da je SLI podrška službeno najavljena samo u konfiguraciji od dvije GeForce GTX 1080. Složenije konfiguracije su teoretski moguće u eksplicitnim LDA i MDA modovima. Zanimljivo je da u isto vrijeme NVIDIA nudi otključavanje 3-Way i 4-Way načina rada pomoću posebnog koda za entuzijaste. Da biste to učinili, morat ćete napraviti poseban zahtjev na web stranici tvrtke za identifikator vašeg GPU-a.

Podrška za brzu sinkronizaciju dodana je GP104 GPU-u. Ova je tehnologija alternativa uključivanju ili isključivanju V-sync. U igrama s brzim tempom (osobito igrama za više igrača), visoki broj sličica u sekundi osigurava maksimalnu reakciju na radnje korisnika. Ali ako se prekorači stopa osvježavanja monitora, mogući su artefakti u obliku prekida slike. To neutralizira okomitu sinkronizaciju, što usput uzrokuje kašnjenje. Fast Sync omogućuje prikaz maksimalnog broja okvira bez mogućih razmaka. To je osigurano hardverskim promjenama u izlaznom cjevovodu slike. Trostruki međuspremnik koristi se umjesto tradicionalnog dvostrukog međuspremnika, a izlazi samo potpuno renderirani okvir.

Uz Fast Sync, možete igrati na običnom monitoru pri 100-200 fps bez vizualnih artefakata i s minimalnim kašnjenjima, kao u normalnom načinu rada s onemogućenom VSync. Ispod su rezultati istraživanja kašnjenja u prikazivanju slike različiti modovi u igri Counter-Strike: Global Offensive.

Kao što vidite, postoji mala razlika između Fast Sync i onemogućenog VSync-a, ali se ne može usporediti s odgodama izlaza okvira s aktivnim VSync-om.

Ako ne govorimo o maksimalnom odzivu, već o maksimalnoj glatkoći slike, onda to osigurava G-Sync tehnologija, koja se implementira u kombinaciji s posebnim monitorima. G-Sync omogućuje potpunu hardversku sinkronizaciju prikazanih okvira s brzinom osvježavanja zaslona.

GeForce GTX 1080 može izlaziti preko DVI, HDMI i DisplayPort. Podržani su DisplayPort 1.2 i HDMI 2.0b s HDCP 2.2, ali je grafička kartica također spremna za DisplayPort 1.3/1.4. Kada koristite potonji, 4K na 120 Hz ili 8K (7680x4320) na 60 Hz može se emitirati putem dva DisplayPort 1.3 kabela. Usporedbe radi, treba napomenuti da GeForce GTX 980 može ispisati samo 5120x3200 kada se prebaci preko dva DisplayPort kabela.

Standardna verzija GeForce GTX 1080 opremljena je s tri DisplayPort priključka, jednim HDMI i jednim Dual-Link DVI.

Procesor GP104 dobio je poboljšani blok video dekodiranja / kodiranja s podrškom za PlayReady 3.0 standard (SL3000) i HEVC hardversko dekodiranje s podrškom za visokokvalitetni 4K / 8K video. Pune mogućnosti GeForce GTX 1080 u odnosu na GeForce GTX 980 prikazane su u tablici ispod.

Na popisu inovacija GeForce GTX 1080 podrška za HDR sadržaj i zaslone. Ovaj standard je veliko otkriće u tehnologiji, pružajući 75% vidljivog prostora boja umjesto 33% za RGB pri dubini boje od 10/12 bita. Takvi zasloni prikazuju više nijansi, imaju veću svjetlinu i dublji kontrast, što vam omogućuje da vidite suptilnije nijanse boja. Trenutačno se već izdaju televizori s omogućenim HDR-om, a monitori se očekuju sljedeće godine.

Osim HDR dekodiranja, podržano je i hardversko kodiranje koje će omogućiti snimanje videa ovog standarda. Uskoro će biti dodana i značajka HDR streaminga za igraću konzolu Shield.

NVIDIA radi s programerima kako bi HDR donio u igranje na PC-u. Kao rezultat toga, Rise of the Tomb Raide, Tom Clancy's The Division, The Talos Principle, Paragon, drugi dio Shadow Warrior i druge igre dobit će HDR podršku.

Suvremeni gaming se mijenja, igrači pokazuju nove interese i želju da svoju omiljenu igru ​​pogledaju iz novog kuta. Ponekad se obična snimka zaslona pretvori u nešto više od običnog okvira iz igre. A uz NVIDIA Ansel svaki snimak zaslona može biti izvanredan. Ovo je nova tehnologija za snimanje slika sa skupom posebnih značajki. Ansel vam omogućuje primjenu filtara, poboljšanje slike, korištenje besplatne kamere i stvaranje panorama. Za punu funkcionalnost potrebna je aplikacijska podrška. Kako bi to učinio, Ansel nudi jednostavnu integraciju. Na primjer, za integraciju Ansela u The Witcher 3 programeri su dodali samo 150 redaka koda, a logička igra Witness trebala je 40 redaka koda.

Ansel stavlja igru ​​u način pauze i zatim vam omogućuje izvođenje raznih operacija. Na primjer, možete promijeniti kameru i odabrati bilo koji kut. Neka su ograničenja moguća samo ako programeri namjerno ograniče kretanje slobodne kamere.

Možete povećati razlučivost konačne slike i povećati LOD razinu kako biste postigli maksimalnu jasnoću u svim detaljima. Povećanje veličine kombinira se s dodatnim anti-aliasingom za najbolji učinak.

Štoviše, Ansel vam omogućuje stvaranje gigantskih slika do 4,5 gigapiksela. Takve se slike spajaju iz zasebnih fragmenata, što se izvodi na hardverskoj razini. Također, na konačnu sliku mogu se primijeniti razni post-efekti. Slika se može spremiti u RAW formatu ili EXR sa 16-bitnim kodiranjem boja. To će dati dovoljno mogućnosti za kasniji rad s njim.

Možete stvarati stereo panorame i snimke od 360 stupnjeva, koje zatim možete gledati u naočalama za virtualnu stvarnost.

Postoji veliki izbor efekata koji se mogu primijeniti na snimljenu sliku - zrnatost, cvjetanje, sepija, efekti objektiva i mnogi drugi, sve do stvaranja slike s efektom ribljeg oka. Široke Anselove mogućnosti su nevjerojatne. Igrač dobiva prilike koje prije jednostavno nisu postojale.

Nakon proučavanja arhitekture i novih tehnologija, moramo se osvrnuti na samu GeForce GTX 1080. Referentna verzija izgleda kao prethodni modeli s malo ažuriranim dizajnom i oštrijim obrisima.

Stražnja strana zaštićena je s dvije ploče, što podsjeća na "rezervaciju" GeForce GTX 980.

Ukupni dizajn hlađenja ostao je nepromijenjen. Hladnjak radi na principu turbine. Tu je velika baza, rebrasti hladnjak za hlađenje GPU-a, te dodatni hladnjak u blizini strujnog čvora za bolje hlađenje energetskih elemenata.

Sve ostale nijanse razmotrit ćemo u zasebnom članku, gdje ćemo istovremeno provesti usporedno testiranje. Ako govorimo o preliminarnim procjenama proizvođača, NVIDIA uspoređuje novi proizvod s GeForce GTX 980 i govori o prednosti od oko 70% u jednostavnim igrama i razmaku od više od 2,5 puta u VR modu. Razlika u odnosu na GeForce GTX 980 Ti će biti manja, ali o nekim konkretnim vrijednostima možemo govoriti nakon praktičnih testova.

zaključke

Vrijeme je da sumiramo naše teoretsko upoznavanje s GeForce GTX 1080. Ova video kartica trenutno je tehnološki najnapredniji proizvod među grafičkim akceleratorima. GeForce GTX 1080 po prvi put ima 16nm Pascal procesor i novu GDDR5X memoriju. Sama arhitektura je razvoj Maxwella s optimizacijama i novim značajkama za DirectX 12. Arhitektonska poboljšanja uvelike su poboljšana značajnim povećanjem frekvencija GPU-a i memorije. Vrlo značajan napredak u području VR renderiranja zahvaljujući novim tehnologijama koje ubrzavaju rad u ovom načinu rada. Progresivna inovacija je podrška za HDR zaslone i srodne sadržaje. Zahvaljujući novoj jedinici za video obradu, još više mogućnosti za reprodukciju i snimanje videa visoke razlučivosti, uključujući rad s HDR formatom. Ljubitelji ultra-dinamičkih igara za više igrača cijenit će tehnologiju Fast Sync. Poznavatelji virtualne ljepote bit će zadovoljni mogućnostima Ansela. Kupnjom GeForce GTX 1080 dobivate ne samo najbrži video akcelerator u ovom trenutku, već i najfunkcionalniji.

Službeno će ovaj model kupcima biti dostupan nakon 27. svibnja. Verzije referentnog dizajna izdanja Founders prvo će se naći u prodaji. Oni će imati veću cijenu. Nešto kasnije bit će objavljene nestandardne opcije, čija je cijena niža za 100 dolara. Pa, do trenutka kada se GeForce GTX 1080 pojavi na domaćem tržištu, pokušat ćemo, u sklopu velikog testa, u potpunosti otkriti njihov potencijal u usporedbi s postojećim vrhunskim video karticama.

Nvidia GeForce GTX 1080 Pascal recenzija | Upoznajte GP104 GPU

Uoči Computexa, Nvidia je odlučila predstaviti svoj dugo očekivani novitet - Pascal arhitekturu prilagođenu igračima. U nove GeForce GTX 1080 i 1070 grafičke kartice proizvođač ugrađuje grafički procesor GP104. Danas ćemo recenzirati stariji model, a mlađi bi se trebao naći u našim rukama početkom lipnja.

Pascal arhitektura obećava brže i više učinkovit rad, više računalnih modula, smanjeno područje matrice i brža memorija s nadograđenim kontrolerom. Pogodniji je za VR, 4K igranje i druge aplikacije koje zahtijevaju velike performanse.

Kao i uvijek, pokušat ćemo razumjeti obećanja proizvođača i testirati ih u praksi. Počnimo.

Hoće li GeForce GTX 1080 promijeniti odnos snaga u high-end segmentu?

Nvidia GeForce GTX 1080 je najbrža od dvije grafičke kartice za igre koje su najavljene ranije ovog mjeseca. Oba koriste GP104 GPU, koji je, usput rečeno, već drugi GPU Pascal mikroarhitekture (prvi je bio GP100, koji se pojavio na GTC-u u travnju). Izvršni direktor Nvidije Ren-Sun Huan zadirkivao je entuzijaste kada je široj javnosti predstavio novi proizvod, tvrdeći da će GeForce GTX 1080 nadmašiti dvije 980 u SLI.

Također je primijetio da GTX 1080, uz bolje performanse, ima nižu potrošnju energije od serije 900. Dvostruko je brži i tri puta učinkovitiji od bivšeg vrhunskog modela GeForce Titan X, ali ako pogledate popratne grafikone i grafikone, ispada da se tako impresivna razlika očituje u određenim zadacima vezanim uz virtualnu stvarnost. Ali čak i ako su ova obećanja samo djelomično potvrđena, još uvijek nas čekaju vrlo zanimljiva vremena u smislu razvoja high-end igara na PC-u.

Virtualna stvarnost polako uzima maha, ali visoki hardverski zahtjevi za grafički podsustav stvaraju značajnu prepreku pristupu tim tehnologijama. Osim toga, većina igara koje su danas dostupne ne zna kako iskoristiti prednosti višeprocesorskog renderiranja. To jest, obično ste ograničeni na mogućnosti jednog brzog video adaptera s jednim GPU-om. GTX 1080 je sposoban nadmašiti dvije 980 i ne bi se trebao boriti s današnjim VR igrama, eliminirajući potrebu za višeprocesorskim konfiguracijama u budućnosti.

4K ekosustav napreduje jednako brzo. Sučelja veće propusnosti kao što su HDMI 2.0b i DisplayPort 1.3/1.4 trebala bi do kraja ove godine otvoriti vrata 4K monitorima s panelima od 120 Hz i podrškom za dinamičke stope osvježavanja. Dok su se prethodne generacije AMD-ovih i Nvidijinih vrhunskih grafičkih procesora reklamirale kao 4K rješenja za igranje, korisnici su morali pristati na kompromise s kvalitetom kako bi održali prihvatljivu brzinu kadrova. GeForce Nvidia GTX 1080 mogla bi biti prva grafička kartica koja će biti dovoljno brza da održi visok broj sličica u sekundi pri rezoluciji 3840x2160 s maksimalnim postavkama detalja grafike.

Kakva je situacija s konfiguracijama s više monitora? Mnogi igrači spremni su instalirati tri monitora rezolucije 1920x1080, ali pod uvjetom da grafički sustav može podnijeti opterećenje, jer u ovom slučaju kartica mora renderirati pola milijuna piksela, budući da je rezolucija 7680x1440. Postoje čak i entuzijasti voljni uzeti tri 4K zaslona s kombiniranom rezolucijom od 11520x2160 piksela.

Potonja je opcija previše egzotična čak i za novu vrhunsku grafičku karticu za igre. No, procesor Nvidia GP104 opremljen je tehnologijom koja obećava poboljšanje iskustva za tipične zadatke novog modela, tj. 4K i Surround. Ali prije nego prijeđemo na nove tehnologije, pogledajmo pobliže procesor GP104 i njegovu temeljnu arhitekturu Pascal.

Od čega je napravljen GP104?

Od početka 2012. AMD i Nvidia koriste 28nm procesnu tehnologiju. Prelaskom na njega obje su tvrtke napravile značajan iskorak, predstavivši nam grafičke kartice Radeon HD 7970 i GeForce GTX 680. Međutim, tijekom sljedeće četiri godine morale su dosta toga eskivirati kako bi iz postojeće tehnologije izvukle više performansi. . Postignuća grafičkih kartica Radeon R9 Fury X i GeForce GTX 980 Ti doista su čudesna s obzirom na njihovu složenost. Prvi čip koji je Nvidia izgradila na 28nm procesu bio je GK104, koji se sastojao od 3,5 milijardi tranzistora. GM200 koji se nalazi u GeForce GTX 980 Ti i Titan X već ima osam milijardi tranzistora.

Prijelaz na 16nm TSMC FinFET Plus tehnologiju omogućio je Nvidijinim inženjerima implementaciju novih ideja. Prema tehničkim podacima, 16FF+ čipovi su 65% brži, mogu imati dvostruko veću gustoću od 28HPM ili troše 70% manje energije. Prilikom izrade svojih GPU-ova, Nvidia koristi optimalnu kombinaciju ovih prednosti. TSMC tvrdi da se temeljio na inženjeringu postojećeg 20 nm procesa, ali je koristio FinFET tranzistore umjesto ravnih tranzistora. Tvrtka kaže da ovaj pristup smanjuje količinu otpada i povećava učinak radnih ploča. Također se tvrdi da tvrtka nije imala 20-nanometarsku procesnu tehnologiju s brzim tranzistorima. Opet, svijet računalne grafike sjedi na 28 nm procesnoj tehnologiji više od četiri godine.


Blok dijagram procesora GP104

Nasljednik GM204 sastoji se od 7,2 milijarde tranzistora smještenih na površini od 314 mm2. Usporedbe radi, površina matice GM204 je 398 mm2 s 5,2 milijarde tranzistora. U punoj verziji, jedan GP104 GPU ima četiri grafička procesorska klastera (GPC). Svaki GPC uključuje pet klastera za obradu niti/teksture (TPC) i rasterizer. TPC kombinira jedan streaming multiprocesor (SM) i PolyMorph mehanizam. SM kombinira 128 jednostrukih preciznih CUDA jezgri, 256 KB registracijske memorije, 96 KB dijeljene memorije, 48 KB L1/teksturne predmemorije i osam teksturnih jedinica. Četvrta generacija PolyMorph motora uključuje novi logički blok, koji se nalazi na kraju cjevovoda geometrije prije bloka rasterizacije, on kontrolira funkciju simultane multi-projekcije (više o tome u nastavku). Ukupno dobivamo 20 SM-ova, 2560 CUDA jezgri i 160 jedinica za obradu tekstura.


Jedan multiprocesor za strujanje (SM) u GP104

GPU back-end uključuje osam 32-bitnih memorijskih kontrolera (256-bitna ukupna širina kanala), osam jedinica za rasterizaciju i 256 KB L2 predmemorije po jedinici. Na kraju imamo 64 ROP-a i 2 MB dijeljene L2 predmemorije. Iako je blok dijagram Nvidia GM204 procesora pokazao četiri 64-bitna kontrolera i 16 ROP-ova, oni su bili grupirani zajedno i funkcionalno ekvivalentni.

Neki od strukturnih elemenata GP104 slični su onima iz GM204, jer je novi GPU izgrađen od "građevinskih blokova" svog prethodnika. Nema ništa loše. Ako se sjećate, u Maxwell arhitekturi tvrtka se oslanjala na energetsku učinkovitost i nije uzdrmala blokove koji su jaka točka Kepler. Ovdje vidimo sličnu sliku.

Dodavanje četiri SM-a možda neće značajno utjecati na performanse. Međutim, GP104 ima nekoliko trikova u rukavu. Prvi adut su znatno više taktne frekvencije. Osnovni radni takt GPU-a je 1607 MHz. Specifikacije GM204, za usporedbu, pokazuju 1126 MHz. GPU Boost dostiže maksimalnu brzinu od 1733MHz, ali smo podigli naš uzorak na 2100MHz pomoću EVGA-inog uslužnog programa PrecisionX beta. Odakle tolika rezerva za overclocking? Prema Johnu Albinu, višem potpredsjedniku GPU inženjeringa, njegov tim je znao da će proces TSMC 16FF+ utjecati na arhitekturu čipa, pa su se usredotočili na optimizaciju vremena čipa kako bi uklonili uska grla koja sprječavaju postizanje viših brzina takta. Kao rezultat toga, brzina računanja s jednom preciznošću GP104 dosegnula je 8228 GFLOPs (na osnovnom taktu) u usporedbi s gornjom granicom od 4612 GFLOPs GeForce GTX 980. Brzina popunjavanja tekselima skočila je sa 155,6 Gtex/s na 980 (s GPU Boostom) na 277, 3 Gtex/s.

GPU GeForce GTX 1080 (GP104) GeForce GTX 980 (GM204)
SM 20 16
Broj CUDA jezgri 2560 2048
Osnovna GPU frekvencija, MHz 1607 1126
GPU frekvencija u Boost modu, MHz 1733 1216
Brzina izračuna, GFLOPs (na osnovnoj frekvenciji) 8228 4612
Broj jedinica teksture 160 128
Texel brzina punjenja, Gtex/s 277,3 155,6
Brzina prijenosa memorije, Gbps 10 7
Propusnost memorije, GB/s 320 224
Broj blokova rasterizacije 64 64
Veličina L2 predmemorije, MB 2 2
Termo paket, W 180 165
Broj tranzistora 7,2 milijarde 5,2 milijarde
Površina kristala, mm2 314 398 mm
Procesna tehnika, nm 16 28

Stražnja strana još uvijek uključuje 64 ROP-a i 256-bitnu memorijsku sabirnicu, ali Nvidia je uvela GDDR5X memoriju kako bi povećala dostupnu propusnost. Tvrtka je uložila puno truda u promociju nove vrste memorije, posebno u pozadini HBM memorije, koja se koristi u raznim AMD grafičkim karticama i HBM2, koju Nvidia ugrađuje u Teslu P100. Čini se da trenutno postoji manjak HBM2 memorije na tržištu, a tvrtka nije spremna prihvatiti HBM ograničenja (četiri hrpe od 1 GB ili poteškoće u implementaciji osam hrpa od 1 GB). Tako smo dobili GDDR5X video memoriju, čija je ponuda također ograničena, budući da GeForce GTX 1070 već koristi obični GDDR5. Ali to ne pokriva prednosti novog rješenja. GDDR5 memorija u GeForce GTX 980 imala je brzinu prijenosa podataka od 7 Gb/s. To je omogućilo 224 GB/s propusnosti preko 256-bitne sabirnice. GDDR5X počinje od 10 Gb/s, povećavajući propusnost na 320 GB/s (~43% povećanja). Prema Nvidiji, povećanje je postignuto kroz nadograđenu I/O shemu, a bez povećanja potrošnje energije.

Arhitektura Maxwell postala je učinkovitija u korištenju propusnosti optimiziranjem predmemorije i algoritama kompresije, a Pascal slijedi isti put s novim metodama kompresije bez gubitaka za ekonomičnije korištenje dostupne propusnosti memorijskog podsustava. Algoritam delta kompresije boja pokušava postići dobitak od 2:1, a ovaj je način rada poboljšan kako bi se mogao češće koristiti. Tu je i novi 4:1 mod, koji se koristi u slučajevima kada su razlike po pikselu vrlo male. Na kraju, Pascal predstavlja još jedan novi 8:1 algoritam koji primjenjuje kompresiju 4:1 na 2x2 blokove, razlika između kojih se obrađuje u 2:1 algoritmu.



Razliku nije teško ilustrirati. Prva slika prikazuje nekomprimiranu snimku zaslona iz Project CARS. Sljedeća slika prikazuje elemente koje Maxwell kartica može komprimirati, osjenčani su ljubičastom bojom. U trećem kadru možete vidjeti da Pascal još više komprimira scenu. Prema Nvidiji, ova razlika se prevodi u oko 20% smanjenja količine informacija u bajtovima koji se moraju dohvatiti iz memorije za svaki okvir.

Nvidia GeForce GTX 1080 Pascal recenzija | Dizajn referentne kartice

Nvidia je promijenila pristup dizajnu kartica. Umjesto "referenca", vlastitu verziju karte naziva Founders Edition (verzija kreatora). Nemoguće je ne primijetiti da je izgled GeForce GTX 1080 postao uglatiji, međutim, isti stari provjereni mehanizam za izbacivanje vrućeg zraka kroz bočnu traku koristi se u sustavu hlađenja.

Kartica ima masu od 1020 g i dužinu od 27 cm, prilično je ugodna na dodir jer kućište hladnjaka ne samo da izgleda metalno, već je i napravljeno od metala, točnije od aluminija. Mat srebrni dijelovi su lakirani i ako se karticom ne rukuje vrlo pažljivo, brzo će se izgrebati.

Stražnja ploča je podijeljena na dva dijela. Služi samo kao dekoracija i nema funkciju hlađenja. Kasnije ćemo saznati je li to prava odluka. Nvidia preporučuje uklanjanje ove ploče kada koristite SLI kako bi se postigao bolji protok zraka između kartica postavljenih blizu jedna drugoj.

S donje strane nema ničeg zanimljivog, iako smo primijetili da dijelovi crnog poklopca mogu doći u kontakt s matičnom pločom ispod, poput hladnjaka čipseta i SATA priključaka.

Na vrhu kartice vidimo jedan pomoćni osmopinski konektor za napajanje. S obzirom na službene specifikacije video kartice, kao i 60W snage koja se crpi iz utora na matičnoj ploči, jedan takav konektor trebao bi biti dovoljan za nominalni TDP od 180W. Naravno, provjerit ćemo koliko struje ova kartica zapravo troši i opterećuje li napojne vodove.

Tu su i dva SLI konektora. Uz nove Pascal grafičke kartice, Nvidia je predstavila nove mostove velike propusnosti. Kasnije ćemo ih pogledati detaljnije. Ukratko, do sada su službeno podržane SLI konfiguracije samo dvije video kartice, a oba se konektora koriste za rad dvokanalnog sučelja između GPU-a.

Tri potpuna DisplayPort konektora dostupna su na I/O ploči. Popis specifikacija DisplayPort 1.2, ali se očekuje da budu kompatibilni s DisplayPort 1.3/1.4 (barem kontroler zaslona može raditi s novim standardima). Tu je i HDMI 2.0 izlaz i dual-link DVI-D. Ne možete tražiti analogne konektore.

S druge strane kartice nalazi se veliki utor za hvatanje zraka i tri rupe za vijke za dodatno fiksiranje kartice u kućište.

Dizajn hladnjaka i snaga

Nakon pažljivog proučavanja izgleda, vrijeme je da pogledamo i nadjev skriven ispod aluminijskog kućišta. To se pokazalo težim nego što se na prvi pogled čini. Nakon rastavljanja, na stolu smo izbrojali 51 dio, uključujući i vijke. Ako uklonite ventilatore, dodat će se još 12.

Nvidia se konačno vratila korištenju prave komore za paru. Pričvršćen je na ploču s četiri vijka na vrhu GPU-a.

Centrifugalni ventilator trebao bi vam biti poznat. Izravno odvođenje topline podrazumijeva usis zraka na jednom mjestu, njegov prolaz kroz rebra hladnjaka i iz kućišta. Kućište hladnjaka, koje služi i kao okvir, ne samo da stabilizira karticu, već također pomaže u hlađenju pretvarača napona i memorijskih modula.

Nakon što smo uklonili sve vanjske komponente, došli smo do isprintana matična ploča. Za razliku od prethodnih rješenja, Nvidia koristi šestofazno napajanje. Pet faza služi GPU-u, a preostala faza napaja GDDR5X memoriju.

Na ploči možete vidjeti mjesto za drugu fazu, koje je prazno.

GP104 GPU pokriva površinu od 314 mm2, što je mnogo manje od njegovog prethodnika. Oko procesora su vidljive linije ostalih slojeva ploče. Da bi se postigle visoke taktne frekvencije, vodiči moraju biti što kraći. Zbog strogih zahtjeva, Nvidijinim partnerima će vjerojatno trebati više vremena da pokrenu proizvodnju.

GDDR5X memoriju predstavljaju Micron 6HA77 čipovi. Nedavno su krenuli u masovnu proizvodnju, jer smo ranije u tisku vidjeli 6GA77 čipove na procurjelim slikama nove Nvidijine video kartice.

Na 256-bitnu memorijsku sabirnicu preko 32-bitnih kontrolera spojeno je ukupno osam memorijskih modula. Na frekvenciji od 1251 MHz, propusnost doseže 320 GB / s.

Micronovi GDDR5X moduli koriste 170-pinski paket umjesto 190-pinskog GDDR5. Osim toga, nešto su manji: 14x10 mm umjesto 14x12 mm. Odnosno, imaju veću gustoću i zahtijevaju poboljšano hlađenje.

Okrenuvši karticu, pronašli smo slobodno mjesto za drugi konektor za napajanje. Stoga Nvidijini partneri mogu instalirati drugi pomoćni konektor za povećanje snage ili premjestiti postojeći na drugu poziciju.

Ploča također ima utor koji omogućuje okretanje strujnog konektora za 180 stupnjeva.

Kondenzatori se nalaze neposredno ispod GPU-a kako bi ublažili moguće udare. Također na ovoj strani ploče nalazi se PWM (ranije se nalazio na prednjoj strani). Ovo rješenje daje Nvidia partnerima mogućnost instaliranja drugih PWM kontrolera.

Ali vratimo se na regulator PWM regulatora napona. Nvidijina GPU Boost 3.0 tehnologija dobila je novi skup zahtjeva za regulaciju napona, što je rezultiralo značajnim promjenama. Očekivali smo vidjeti kontroler tipa IR3536A iz International Rectifiera uparen s 5+1 faznim dizajnom, ali Nvidia je koristila µP9511P. Ovo nije najbolja vijest za overklokere, budući da kartica ne podržava sučelje i protokol takvih alata kao što su MSI Afterburner i Gigabyte OC Guru. Prijelaz na novi kontroler, koji još nije dobro opisan, najvjerojatnije je zbog tehničkih karakteristika.

Budući da PWM kontroler ne može izravno upravljati pojedinačnim fazama pretvarača napona, Nvidia koristi moćne MOSFET drajvere s 53603A čipovima za pokretanje vrata MOSFET-a. Ali u usporedbi s nekim drugim opcijama, raspored sklopa izgleda uredno i uredno.

Ovdje postoje različite vrste MOSFET-a. 4C85N je prilično fleksibilan dvokanalni MOSFET za pretvorbu napona. Opslužuje svih šest faza napajanja i ima dovoljno velike električne i toplinske rezerve da izdrži opterećenja referentnog dizajna.


Pitam se kako će Nvidijina GPU Boost 3.0 tehnologija i modificirani regulator napona utjecati na potrošnju energije. Svakako ćemo provjeriti.

Nvidia GeForce GTX 1080 Pascal recenzija | Simultana višeprojekcijska i asinkrona računalna tehnologija

Simultani Multi-Projection Engine

Povećani broj jezgri, brzina jezgre i izvedba GDDR5X memorije od 10 Gbps ubrzavaju svaku igru ​​koju smo testirali. Međutim, arhitektura Pascal uključuje nekoliko značajki koje ćemo moći cijeniti tek u budućim igrama.

Jedna od novih značajki koju Nvidia naziva Simultaneous Multi-Projection Engine, ili višeprojekcijski motor, predstavljen hardverskim blokom dodanim PolyMorph motorima. Novi mehanizam može stvoriti do 16 projekcija geometrijskih podataka s jedne točke gledišta. Ili može pomaknuti točku gledišta kako bi stvorio stereoskopsku sliku dupliciranjem geometrije 32 puta u hardveru, bez pada performansi koji biste doživjeli da pokušavate postići ovaj efekt bez SMP-a.


Jedna ravninska projekcija

Pokušajmo razumjeti prednosti ove tehnologije. Na primjer, imamo tri monitora u Surround konfiguraciji. Lagano su okrenuti prema unutra kako bi "omotali" korisnika, tako da je praktičniji za igru ​​i rad. Ali igre ne znaju za to i prikazuju sliku u jednoj ravnini, pa se čini da je zakrivljena na spoju okvira monitora i općenito slika izgleda iskrivljeno. Za takvu konfiguraciju bilo bi ispravnije prikazati jednu projekciju ravno naprijed, drugu projekciju lijevo, kao iz panoramskog kokpita zrakoplova, a treću projekciju desno. Na taj će način prethodno zakrivljena panorama izgledati glatkije, a korisnik će dobiti puno širi kut gledanja. Cijelu scenu i dalje treba rasterizirati i obojiti, ali GPU ne mora renderirati scenu tri puta, što eliminira dodatne troškove.


Netočna perspektiva na zaslonima pod kutom



SMP ispravljena perspektiva

Međutim, aplikacija mora podržavati postavke širokog kuta gledanja i koristiti SMP API pozive. To znači da prije nego što možete iskoristiti ovu značajku, programeri igara je moraju ovladati. Nismo sigurni koliko su truda spremni uložiti za nekolicinu korisnika Surround uređaja s više monitora. Ali postoje i druge aplikacije za koje ima smisla implementirati ovu značajku što je prije moguće.


korištenjem jednoprolaznog stereo renderiranja, SMP stvara jednu projekciju za svako oko

Uzmimo virtualnu stvarnost kao primjer. Već je potrebna individualna projekcija za svako oko. Današnje igre jednostavno prikazuju slike na dva odvojena zaslona, ​​sa svim povezanim nedostacima i gubicima učinkovitosti. Ali budući da SMP podržava dva projekcijska centra, scena se može renderirati u jednom prolazu pomoću Nvidijine značajke Single Pass Stereo. Geometrija se obrađuje jednom, a SMP stvara svoju projekciju za lijevo i desno oko. Nadalje, SMP može primijeniti dodatne projekcije za značajku koja se zove Lens Matched Shading.


Slike nakon prvog prolaza sa značajkama Lens Matched Shading



Posljednja scena koja se šalje na slušalice

Ukratko, Lens Matched Shading pokušava učiniti VR renderiranje učinkovitijim izbjegavajući količinu posla koju tradicionalno renderiranje planarne projekcije obično mora obaviti da bi se iskrivila geometrija kako bi se uskladila s izobličenjem leće na slušalicama (tako da se pikseli renderiraju izgubljeni tamo gdje postoji najveća zakrivljenost). . Ovom se učinku može pristupiti korištenjem SMP-a za podjelu područja na kvadrante. Dakle, umjesto renderiranja i rada s kvadratnom projekcijom, GPU stvara slike koje odgovaraju filtru za izobličenje objektiva. Ova metoda sprječava stvaranje dodatnih piksela. Nećete primijetiti razliku u kvaliteti, sve dok programeri zadovoljavaju ili premašuju stopu uzorkovanja oka na HMD-u.

Prema Nvidiji, kombinacija tehnika Single Pass Stereo i Lens Matched Shading može pružiti do 2x poboljšanja performansi u VR u usporedbi s ne-SMP GPU-ima. Dio toga ima veze s prikazom piksela. Korištenjem Lens Matched Shadinga kako bi se izbjegla obrada piksela koji se ne bi trebali renderirati, stopa renderiranja u sceni s Nvidijinim uravnoteženim unaprijed postavljenim postavkama pala je s 4,2 MP/s (Oculus Rift) na 2,8 MP/s, stoga se opterećenje shadera na GPU-u smanjilo za jedan i pola puta. Single Pass Stereo tehnologija koja obrađuje geometriju samo jednom (umjesto ponovnog renderiranja za drugo oko) učinkovito eliminira polovicu geometrijske obrade koja se mora obaviti danas. Sada je jasno na što je Ren-Sun mislio kada je tvrdio "dvostruko povećanje performansi i trostruko povećanje učinkovitosti u usporedbi s Titanom X."

Asinkrono računalstvo

Arhitektura Pascal također uključuje neke promjene u vezi s asinkronim računalstvom, koje su povezane s DirectX 12, VR i AMD-ovom arhitektonskom prednošću iz više razloga.

Nvidia podržava statično dijeljenje resursa GPU-a za radna opterećenja grafike i računanja još od Maxwellove arhitekture. U teoriji, ovaj pristup je dobar kada su oba bloka aktivna u isto vrijeme. No, recimo da je 75% resursa procesora posvećeno grafici i on brže odradi svoj dio zadatka. Tada će ovaj blok biti u stanju mirovanja, čekajući da računalni blok završi svoj dio posla. Time se gube sve moguće prednosti istovremenog izvršavanja ovih zadataka. Pascal rješava ovaj nedostatak dinamičkim balansiranjem opterećenja. Ako upravljački program odluči da je jedna od particija nedovoljno iskorištena, može prebaciti svoje resurse kako bi pomogao drugoj, sprječavajući vrijeme mirovanja koje negativno utječe na performanse.

Nvidia je također poboljšala Pascalove mogućnosti prekida, odnosno mogućnost zaustavljanja trenutnog zadatka kako bi se riješio "hitniji" s vrlo kratkim vremenom izvršenja. Kao što znate, GPU-ovi su visoko paralelizirani strojevi s velikim međuspremnicima koji su dizajnirani da zauzmu slične resurse jedan pored drugog. Neaktivan shader je beskoristan, stoga mora biti uključen u tijek rada na sve načine.


Za VR je bolje da se zahtjevi za prekid šalju što je kasnije moguće kako bi se uhvatili najnoviji podaci praćenja

Sjajan primjer je značajka Asynchronous Time Warp (ATW) koju je Oculus predstavio s Riftom. U slučaju kada video kartica ne može proizvesti novi okvir svakih 11 ms na zaslonu od 90 Hz, ATW generira međuokvir koristeći posljednji okvir s podešenim položajem glave. Ali mora postojati dovoljno vremena za stvaranje takvog okvira, a, nažalost, grafički prekid nije baš precizan. Zapravo, Fermi, Kepler i Maxwell arhitekture podržavaju prekid na razini crtanja, što znači da se okviri mogu mijenjati unutar poziva crtanja, potencijalno gušeći ATW tehniku.

Pascal implementira prekid na razini piksela za grafiku, tako da GP104 može zaustaviti trenutnu operaciju na razini piksela, spremiti svoje stanje i prebaciti se na drugačiji kontekst. Umjesto milisekundi prekida o kojem je pisao Oculus, Nvidia tvrdi manje od 100 mikrosekundi.

U Maxwell arhitekturi, ekvivalent prekida na razini piksela u računskoj jedinici implementiran je putem prekida na razini niti. Pascal je također zadržao ovu tehniku, ali je dodao podršku za prekide na razini instrukcija u CUDA računalnim zadacima. Trenutačno Nvidia upravljački programi ne uključuju ovu značajku, ali uskoro će biti dostupna zajedno s prekidom na razini piksela.

Nvidia GeForce GTX 1080 Pascal recenzija | Izlazni cjevovod, SLI i GPU Boost 3.0

Pascal zaslonski kanal: spreman za HDR

Prošle smo se godine susreli s AMD-om u Sonomi u Kaliforniji, gdje su podijelili neke od detalja svoje nove Polaris arhitekture, kao što je cjevovod za izlaz slike koji podržava sadržaj visokog dinamičkog raspona i povezane zaslone.

Nije iznenađujuće da je Nvidijina Pascal arhitektura prepuna značajki poput ove, od kojih su neke čak bile dostupne u Maxwellu. Na primjer, kontroler zaslona u GP104 dobio je podršku za 12-bitnu boju, širok raspon boja BT.2020, elektro-optički prijenos SMPTE 2084 i HDMI 2.0b s HDCP 2.2.

Ovom popisu Pascal dodaje ubrzano 4K60p HEVC dekodiranje s 10/12-bitnom bojom kroz namjenski hardverski blok koji tvrdi da podržava standard HEVC verzije 2. Prethodno je Nvidia koristila hibridni pristup korištenjem softverskih resursa. Osim toga, kodiranje je bilo ograničeno na osam bitova informacija o boji po pikselu. Ali vjerujemo da je za podršku kontroverznoj specifikaciji Microsoft PlayReady 3.0 zahtijevao brže i učinkovitije rješenje.

Arhitektura također podržava HEVC kodiranje u 10-bitnoj boji pri 4K60p za snimanje ili strujanje u HDR-u, Nvidia čak ima posebnu aplikaciju za to. Korištenjem kodiranja procesora GP104 i softvera GameStream HDR koji će uskoro biti objavljen, moći ćete streamati igre visokog dinamičkog raspona na Shield uređaje spojene na TV kompatibilan s HDR-om. Shield je opremljen vlastitim HEVC dekoderom s podrškom za 10-bitnu boju po pikselu, što dodatno rasterećuje izlazni cjevovod slike.

GeForce GTX 1080 GeForce GTX 980
H.264 kodiranje Da (2x 4K60p) Da
HEVC kodiranje Da (2x 4K60p) Da
HEVC kodiranje 10-bitno Da Ne
H.264 dekodiranje Da (4K120p do 240Mbps) Da
HEVC dekodiranje Da (4K120p/8K30p do 320Mbps) Ne
VP9 dekodiranje Da (4K120p do 320Mbps) Ne
HEVC 10/12-bitno dekodiranje Da Ne

Uz podršku za HDMI 2.0b, GeForce GTX 1080 ima DisplayPort 1.2 certifikat i kompatibilan je s DP 1.3/1.4. U tom pogledu već nadmašuje još neobjavljeni Polaris, čiji kontroler zaslona zasad podržava samo DP 1.3. Srećom za AMD, specifikacije verzije 1.4 ne uključuju brži način prijenosa, a gornja granica je i dalje 32,4 Gbps postavljena HBR3 načinom.

Kao što je ranije spomenuto, GeForce GTX 1080 Founders Edition opremljena je s tri Display Port izlaza, jednim HDMI 2.0b konektorom i jednim DVI digitalnim dual-link izlazom. Kao i GTX 980, novost je sposobna prikazati sliku na četiri neovisna monitora istovremeno. Ali u usporedbi s rezolucijom od 5120x3200 preko dva DP 1.2 kabela, maksimalna rezolucija GTX 1080 je 7680x4320 piksela pri brzini osvježavanja od 60 Hz.

SLI sada službeno podržava samo dva GPU-a

Tradicionalno, vrhunske Nvidia grafičke kartice opremljene su s dva konektora za povezivanje dva, tri ili čak četiri akceleratora u SLI paketu. U pravilu se najbolje skaliranje postiže u konfiguracijama s dva GPU-a. Nadalje, troškovi se često ne opravdavaju, jer se pojavljuju mnoge zamke. Međutim, neki entuzijasti još uvijek koriste tri ili četiri grafička adaptera u potrazi za svakim dodatnim okvirom i prilikom da se pokažu prijateljima.

Ali situacija se promijenila. Zbog problema sa skaliranjem performansi u novijim igrama, bez sumnje povezanih s DirectX 12, GeForce GTX 1080 službeno podržava samo dual-GPU SLI konfiguracije, prema Nvidiji. Pa zašto su kartici potrebna dva konektora? Zahvaljujući novim SLI mostovima, oba konektora mogu se koristiti istovremeno za prijenos podataka u dvokanalnom načinu rada. Uz dvokanalni način rada, sučelje također ima povećanu I/O frekvenciju sa 400 MHz na 650 MHz. Kao rezultat toga, propusnost između procesora se više nego udvostručuje.


Vrijeme renderiranja okvira u Middle Earth: Shadow of Mordor s novim (plava linija na grafikonu) i starim (crnim) SLI mostom

Međutim, mnogi igrači neće iskusiti prednosti bržeg kanala. Bit će relevantan, prije svega, pri visokim razlučivostima i stopama osvježavanja. Nvidia je pokazala FCAT snimku dva GeForce 1080 GTX-a koji pokreću Middle earth: Shadow of Mordor na tri 4K zaslona. Povezivanje dviju kartica sa starim mostom rezultiralo je stalnim vremenskim skokovima okvira, što dovodi do predvidljivih problema s vremenom koji se manifestiraju kao zastajkivanje. S novim mostom broj skokova se smanjio, a oni su postali manje izraženi.

Prema Nvidiji, ne samo da SLI HB mostovi podržavaju dvokanalni način rada. Već poznati LED mostovi također mogu prenositi podatke na frekvenciji od 650 MHz kada su spojeni na Pascal kartice. Fleksibilne ili konvencionalne mostove najbolje je izbjegavati ako želite raditi u 4K ili višem. Detaljne informacije u vezi kompatibilnosti možete pronaći u tablici koju je dostavila Nvidia:

1920x1080@60Hz 2560x1440 @ 120Hz+ 2560x1440 4K 5K Surround
standardni most x x
LED most x x x x
Most visoke brzine prijenosa podataka (HB) x x x x x x

Što je uzrokovalo odbacivanje konfiguracija s tri i četiri čipa? Uostalom, tvrtka uvijek nastoji prodati više i postići veću produktivnost. Cinično je reći da Nvidia ne želi preuzeti odgovornost za gubitak prednosti pri povezivanju dvije ili četiri kartice u SLI, dok suvremeno tržište videoigara koristi sve suptilnije i složenije pristupe renderiranju. No tvrtka inzistira na tome da djeluje u najboljem interesu kupaca jer Microsoft daje veću kontrolu nad višeprocesorskim konfiguracijama programerima igara, koji zauzvrat istražuju nove tehnologije kao što je zajedničko renderiranje pojedinačnih okvira umjesto trenutnog okvira po okvira. prikazivanje (AFR).

Entuzijasti kojima je stalo samo do brzinskih rekorda i nisu zainteresirani za gore opisane faktore još uvijek mogu povezati tri ili četiri GTX 1080 u SLI koristeći stari softver. Moraju generirati jedinstveni "hardverski" potpis pomoću Nvidijinog programa koji može zahtijevati ključ za "otključavanje". Naravno, novi HB SLI mostovi neće raditi s više od dva GPU-a, pa ćete se morati ograničiti na stare LED mostove kako biste kombinirali rad tri/četiri GP104 na 650 MHz.

Ukratko o GPU Boost 3.0

U nastojanju da iz svojih GPU-ova izvuku još više performansi, Nvidia je ponovno poboljšala svoju GPU Boost tehnologiju.

U prethodnoj generaciji (GPU Boost 2.0), brzina takta se postavljala pomicanjem određene vrijednosti nagnute linije ovisnosti napona/frekvencije. Potencijalni prostor za visinu iznad ove linije obično je ostao neiskorišten.


GPU Boost 3.0 - postavljanje povećanja frekvencije po koraku povećanja napona

Sada vam GPU Boost 3.0 omogućuje postavljanje pojačanja frekvencije za pojedinačne vrijednosti napona, koje su ograničene samo temperaturom. Osim toga, ne morate eksperimentirati i provjeravati stabilnost karte u cijelom rasponu vrijednosti na krivulji. Nvidia ima ugrađeni algoritam za automatizaciju ovog procesa, stvarajući krivulju napona/frekvencije jedinstvenu za vaš GPU.

Nvidia GeForce GTX 1080 Pascal recenzija | Upoznajte GP104 GPU

Uoči Computexa, Nvidia je odlučila predstaviti svoj dugo očekivani novitet - Pascal arhitekturu prilagođenu igračima. U nove GeForce GTX 1080 i 1070 grafičke kartice proizvođač ugrađuje grafički procesor GP104. Danas ćemo recenzirati stariji model, a mlađi bi se trebao naći u našim rukama početkom lipnja.

Arhitektura Pascal obećava brže i učinkovitije performanse, više računalnih modula, smanjenu površinu matrice i bržu memoriju s nadograđenim kontrolerom. Pogodniji je za VR, 4K igranje i druge aplikacije koje zahtijevaju velike performanse.

Kao i uvijek, pokušat ćemo razumjeti obećanja proizvođača i testirati ih u praksi. Počnimo.

Hoće li GeForce GTX 1080 promijeniti odnos snaga u high-end segmentu?

Nvidia GeForce GTX 1080 je najbrža od dvije grafičke kartice za igre koje su najavljene ranije ovog mjeseca. Oba koriste GP104 GPU, koji je, usput rečeno, već drugi GPU Pascal mikroarhitekture (prvi je bio GP100, koji se pojavio na GTC-u u travnju). Izvršni direktor Nvidije Ren-Sun Huan zadirkivao je entuzijaste kada je široj javnosti predstavio novi proizvod, tvrdeći da će GeForce GTX 1080 nadmašiti dvije 980 u SLI.

Također je primijetio da GTX 1080, uz bolje performanse, ima nižu potrošnju energije od serije 900. Dvostruko je brži i tri puta učinkovitiji od bivšeg vrhunskog modela GeForce Titan X, ali ako pogledate popratne grafikone i grafikone, ispada da se tako impresivna razlika očituje u određenim zadacima vezanim uz virtualnu stvarnost. Ali čak i ako su ova obećanja samo djelomično potvrđena, još uvijek nas čekaju vrlo zanimljiva vremena u smislu razvoja high-end igara na PC-u.

Virtualna stvarnost polako uzima maha, ali visoki hardverski zahtjevi za grafički podsustav stvaraju značajnu prepreku pristupu tim tehnologijama. Osim toga, većina igara koje su danas dostupne ne zna kako iskoristiti prednosti višeprocesorskog renderiranja. To jest, obično ste ograničeni na mogućnosti jednog brzog video adaptera s jednim GPU-om. GTX 1080 je sposoban nadmašiti dvije 980 i ne bi se trebao boriti s današnjim VR igrama, eliminirajući potrebu za višeprocesorskim konfiguracijama u budućnosti.

4K ekosustav napreduje jednako brzo. Sučelja veće propusnosti kao što su HDMI 2.0b i DisplayPort 1.3/1.4 trebala bi do kraja ove godine otvoriti vrata 4K monitorima s panelima od 120 Hz i podrškom za dinamičke stope osvježavanja. Dok su se prethodne generacije AMD-ovih i Nvidijinih vrhunskih grafičkih procesora reklamirale kao 4K rješenja za igranje, korisnici su morali pristati na kompromise s kvalitetom kako bi održali prihvatljivu brzinu kadrova. GeForce Nvidia GTX 1080 mogla bi biti prva grafička kartica koja će biti dovoljno brza da održi visok broj sličica u sekundi pri rezoluciji 3840x2160 s maksimalnim postavkama detalja grafike.

Kakva je situacija s konfiguracijama s više monitora? Mnogi igrači spremni su instalirati tri monitora rezolucije 1920x1080, ali pod uvjetom da grafički sustav može podnijeti opterećenje, jer u ovom slučaju kartica mora renderirati pola milijuna piksela, budući da je rezolucija 7680x1440. Postoje čak i entuzijasti voljni uzeti tri 4K zaslona s kombiniranom rezolucijom od 11520x2160 piksela.

Potonja je opcija previše egzotična čak i za novu vrhunsku grafičku karticu za igre. No, procesor Nvidia GP104 opremljen je tehnologijom koja obećava poboljšanje iskustva za tipične zadatke novog modela, tj. 4K i Surround. Ali prije nego prijeđemo na nove tehnologije, pogledajmo pobliže procesor GP104 i njegovu temeljnu arhitekturu Pascal.

Od čega je napravljen GP104?

Od početka 2012. AMD i Nvidia koriste 28nm procesnu tehnologiju. Prelaskom na njega obje su tvrtke napravile značajan iskorak, predstavivši nam grafičke kartice Radeon HD 7970 i GeForce GTX 680. Međutim, tijekom sljedeće četiri godine morale su dosta toga eskivirati kako bi iz postojeće tehnologije izvukle više performansi. . Postignuća grafičkih kartica Radeon R9 Fury X i GeForce GTX 980 Ti doista su čudesna s obzirom na njihovu složenost. Prvi čip koji je Nvidia izgradila na 28nm procesu bio je GK104, koji se sastojao od 3,5 milijardi tranzistora. GM200 koji se nalazi u GeForce GTX 980 Ti i Titan X već ima osam milijardi tranzistora.

Prijelaz na 16nm TSMC FinFET Plus tehnologiju omogućio je Nvidijinim inženjerima implementaciju novih ideja. Prema tehničkim podacima, 16FF+ čipovi su 65% brži, mogu imati dvostruko veću gustoću od 28HPM ili troše 70% manje energije. Prilikom izrade svojih GPU-ova, Nvidia koristi optimalnu kombinaciju ovih prednosti. TSMC tvrdi da se temeljio na inženjeringu postojećeg 20 nm procesa, ali je koristio FinFET tranzistore umjesto ravnih tranzistora. Tvrtka kaže da ovaj pristup smanjuje količinu otpada i povećava učinak radnih ploča. Također se tvrdi da tvrtka nije imala 20-nanometarsku procesnu tehnologiju s brzim tranzistorima. Opet, svijet računalne grafike sjedi na 28 nm procesnoj tehnologiji više od četiri godine.

Blok dijagram procesora GP104

Nasljednik GM204 sastoji se od 7,2 milijarde tranzistora smještenih na površini od 314 mm2. Usporedbe radi, površina matice GM204 je 398 mm2 s 5,2 milijarde tranzistora. U punoj verziji, jedan GP104 GPU ima četiri grafička procesorska klastera (GPC). Svaki GPC uključuje pet klastera za obradu niti/teksture (TPC) i rasterizer. TPC kombinira jedan streaming multiprocesor (SM) i PolyMorph mehanizam. SM kombinira 128 jednostrukih preciznih CUDA jezgri, 256 KB registracijske memorije, 96 KB dijeljene memorije, 48 KB L1/teksturne predmemorije i osam teksturnih jedinica. Četvrta generacija PolyMorph motora uključuje novi logički blok, koji se nalazi na kraju cjevovoda geometrije prije bloka rasterizacije, on kontrolira funkciju simultane multi-projekcije (više o tome u nastavku). Ukupno dobivamo 20 SM-ova, 2560 CUDA jezgri i 160 jedinica za obradu tekstura.

Jedan multiprocesor za strujanje (SM) u GP104

GPU back-end uključuje osam 32-bitnih memorijskih kontrolera (256-bitna ukupna širina kanala), osam jedinica za rasterizaciju i 256 KB L2 predmemorije po jedinici. Na kraju imamo 64 ROP-a i 2 MB dijeljene L2 predmemorije. Iako je blok dijagram Nvidia GM204 procesora pokazao četiri 64-bitna kontrolera i 16 ROP-ova, oni su bili grupirani zajedno i funkcionalno ekvivalentni.

Neki od strukturnih elemenata GP104 slični su onima iz GM204, jer je novi GPU izgrađen od "građevinskih blokova" svog prethodnika. Nema ništa loše. Ako se sjećate, u arhitekturi Maxwell tvrtka se oslanjala na energetsku učinkovitost i nije uzdrmala blokove, što su bile jake strane Keplera. Ovdje vidimo sličnu sliku.

Dodavanje četiri SM-a možda neće značajno utjecati na performanse. Međutim, GP104 ima nekoliko trikova u rukavu. Prvi adut su znatno više taktne frekvencije. Osnovni radni takt GPU-a je 1607 MHz. Specifikacije GM204, za usporedbu, pokazuju 1126 MHz. GPU Boost dostiže maksimalnu brzinu od 1733MHz, ali smo podigli naš uzorak na 2100MHz pomoću EVGA-inog uslužnog programa PrecisionX beta. Odakle tolika rezerva za overclocking? Prema Johnu Albinu, višem potpredsjedniku GPU inženjeringa, njegov tim je znao da će proces TSMC 16FF+ utjecati na arhitekturu čipa, pa su se usredotočili na optimizaciju vremena čipa kako bi uklonili uska grla koja sprječavaju postizanje viših brzina takta. Kao rezultat toga, brzina računanja s jednom preciznošću GP104 dosegnula je 8228 GFLOPs (na osnovnom taktu) u usporedbi s gornjom granicom od 4612 GFLOPs GeForce GTX 980. Brzina popunjavanja tekselima skočila je sa 155,6 Gtex/s na 980 (s GPU Boostom) na 277, 3 Gtex/s.

GPU GeForce GTX 1080 (GP104) GeForce GTX 980 (GM204)
SM 20 16
Broj CUDA jezgri 2560 2048
Osnovna GPU frekvencija, MHz 1607 1126
GPU frekvencija u Boost modu, MHz 1733 1216
Brzina izračuna, GFLOPs (na osnovnoj frekvenciji) 8228 4612
Broj jedinica teksture 160 128
Texel brzina punjenja, Gtex/s 277,3 155,6
Brzina prijenosa memorije, Gbps 10 7
Propusnost memorije, GB/s 320 224
Broj blokova rasterizacije 64 64
Veličina L2 predmemorije, MB 2 2
Termo paket, W 180 165
Broj tranzistora 7,2 milijarde 5,2 milijarde
Površina kristala, mm2 314 398 mm
Procesna tehnika, nm 16 28

Stražnja strana još uvijek uključuje 64 ROP-a i 256-bitnu memorijsku sabirnicu, ali Nvidia je uvela GDDR5X memoriju kako bi povećala dostupnu propusnost. Tvrtka je uložila puno truda u promociju nove vrste memorije, posebno u pozadini HBM memorije, koja se koristi u raznim AMD grafičkim karticama i HBM2, koju Nvidia ugrađuje u Teslu P100. Čini se da trenutno postoji manjak HBM2 memorije na tržištu, a tvrtka nije spremna prihvatiti HBM ograničenja (četiri hrpe od 1 GB ili poteškoće u implementaciji osam hrpa od 1 GB). Tako smo dobili GDDR5X video memoriju, čija je ponuda također ograničena, budući da GeForce GTX 1070 već koristi obični GDDR5. Ali to ne pokriva prednosti novog rješenja. GDDR5 memorija u GeForce GTX 980 imala je brzinu prijenosa podataka od 7 Gb/s. To je omogućilo 224 GB/s propusnosti preko 256-bitne sabirnice. GDDR5X počinje od 10 Gb/s, povećavajući propusnost na 320 GB/s (~43% povećanja). Prema Nvidiji, povećanje je postignuto kroz nadograđenu I/O shemu, a bez povećanja potrošnje energije.

Arhitektura Maxwell postala je učinkovitija u korištenju propusnosti optimiziranjem predmemorije i algoritama kompresije, a Pascal slijedi isti put s novim metodama kompresije bez gubitaka za ekonomičnije korištenje dostupne propusnosti memorijskog podsustava. Algoritam delta kompresije boja pokušava postići dobitak od 2:1, a ovaj je način rada poboljšan kako bi se mogao češće koristiti. Tu je i novi 4:1 mod, koji se koristi u slučajevima kada su razlike po pikselu vrlo male. Na kraju, Pascal predstavlja još jedan novi 8:1 algoritam koji primjenjuje kompresiju 4:1 na 2x2 blokove, razlika između kojih se obrađuje u 2:1 algoritmu.



Razliku nije teško ilustrirati. Prva slika prikazuje nekomprimiranu snimku zaslona iz Project CARS. Sljedeća slika prikazuje elemente koje Maxwell kartica može komprimirati, osjenčani su ljubičastom bojom. U trećem kadru možete vidjeti da Pascal još više komprimira scenu. Prema Nvidiji, ova razlika se prevodi u oko 20% smanjenja količine informacija u bajtovima koji se moraju dohvatiti iz memorije za svaki okvir.

Prema nedavno objavljenim anegdotalnim dokazima, obitelj Pascal GPU-a mogla bi postati jedna od NVIDIA-inih najkompletnijih linija u posljednjih nekoliko godina. U samo nekoliko mjeseci tvrtka je predstavila četiri GPU-a temeljena na Pascalu i neće stati na tome. Prema riječima šefa tvrtke, predstavljeni su daleko od svih Pascal čipova, a da ne spominjemo prave proizvode. Navodno nas u skoroj budućnosti očekuju nove najave.

NVIDIA Pascal: osam proizvoda u četiri mjeseca

Od travnja ove godine NVIDIA je predstavila četiri čipa temeljena na Pascalu: GP100 sa 16 GB HBM2 memorije, GP102 s podrškom za GDDR5X, GP104 i GP106. U isto vrijeme, tvrtka je najavila osam proizvoda temeljenih na ovim GPU-ovima (isključujući pojedinačne proizvode raznih vrsta posebnih izdanja sljedećeg, kao i specijalizirane uređaje poput DGX-1): GeForce GTX 1080/1070 (GP104), GeForce GTX 1060 (GP106), TITAN X (GP102 + 12GB GDDR5X), Quadro P5000 (GP104GL + 16GB GDDR5X), Quadro P6000 (GP102GL + 24GB GDDR5X), Tesla P100 SXM i Tesla P100 PCIe (oba temeljena na GP100 + 16GB HBM2).

Dok su četiri GPU-a i osam proizvoda u četiri mjeseca izvanredno postignuće, primjetno je da tvrtka nije predstavila niti jedno novo rješenje za prijenosna računala, niti jednu novu grafičku karticu ispod 250 USD. Prema riječima šefa NVIDIA-e, tvrtka priprema nove GPU-ove temeljene na Pascalu, oni već postoje u siliciju, ali će na tržište izaći tek nakon nekog vremena.

NVIDIA: Svi Pascali su spremni, ali nisu svi predstavljeni

“Sve smo projektirali, provjerili i započeli proizvodnjuGPU temelji se na arhitekturiPascal», rekao je Jen-Hsun Huang, izvršni direktor NVIDIA-e, tijekom konferencijskog poziva s investitorima i financijskim analitičarima. "Međutim, još nismo predstavili sve te GPU-ove."

Nove konfiguracije

Međutim, nije toliko interna komponenta GP107, GP108 i GP102 ono što je od interesa za igrače i entuzijaste performansi, već činjenica da će svaki Pascal čip postojati u najmanje dvije osnovne konfiguracije (u smislu PCIe ID-a koji koristi NVIDIA upravljački program ) . To otvara mogućnosti za stvaranje mnoštva novih proizvoda temeljenih na čipovima GP100, GP102, GP104 i GP106.

Dakle, GP104 postoji u konfiguracijama GP104-A i GP104-B, kao i inačice s omogućenom akceleracijom za profesionalne primjene - GP104GL-A i GP104GL-B. Ne znamo čemu točno odgovaraju slova "A" i "B", ali možemo pretpostaviti da "A" označava mikro krug u maksimalnoj konfiguraciji. Dakle, GP104-A može parirati GeForce GTX 1080, a GP104-B može parirati GeForce GTX 1070.

Uzimajući u obzir da mikrosklopovi GP102 i GP106 također postoje u dvije konfiguracije (u svakom slučaju, to je naznačeno AIDA64 bazom podataka i NVIDIA drajverima), ali postoji samo jedan proizvod temeljen na njima (GeForce GTX 1060 i TITAN X), možemo dobro očekivati ​​nastanak novih rješenja temeljenih na njima. Hoće li ove kartice biti brže ili sporije od postojećih, vrijeme će pokazati. U svakom slučaju, GP102 može skalirati i "gore" (do 3840 stream procesora) i "dolje". Pritom se, naravno, ne može isključiti hipotetska mogućnost pojave treće verzije GP102-C, u slučaju da NVIDIA zatreba.

Na ovaj ili onaj način, očito je da NVIDIA planira proširiti obitelj grafičkih kartica temeljenih na Pascalu. Iako bi neposredni planovi trebali jasno uključivati ​​mobilne i mainstream GPU-ove, vrlo je vjerojatno da ćemo u budućnosti vidjeti nova rješenja za gaming računala visokih performansi.