Maxwell (mikroarchitektúra)

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2020. május 29-én felülvizsgált verziótól ; az ellenőrzések 4 szerkesztést igényelnek .
Maxwell
Kiadási dátum 2014 február
Gyártók TSMC
Pascal

A Maxwell az Nvidia által a Kepler mikroarchitektúra utódjaként kifejlesztett GPU mikroarchitektúra  kódneve . A Maxwell architektúrát a GeForce 700 sorozat későbbi modelljeiben vezették be , és a GeForce 800M sorozatban , a GeForce 900 sorozatban és a Quadro Mxxx sorozatban is használják. Az Nvidia a Keplert vette alapul az új Maxwell architektúrához, és számos területen finomította. A Maxwell architektúrában az SMX streaming többprocesszort átnevezték SMM-re ( angolul Streaming Maxwell Multiprocessor ), amelyet négy, 32 adatfolyam-processzorból álló blokkra osztottak. Az SMM-fürt összesen 128 adatfolyam-processzort tartalmaz. A kevésbé összetett vezérlőlogika biztosítja a feladatok hatékonyabb elosztását a CUDA magok között . A forgácsfelület 25%-kal nőtt 118 mm²-ről 148 mm²-re. Ezzel párhuzamosan a tranzisztorok száma 1,3 milliárdról 1,87 milliárdra nőtt, ami 44%-os növekedést jelent. Ennek oka a chip elrendezésének megváltozása.  

A mikroarchitektúrát James Clerk Maxwellről , az elektromágneses sugárzás elméletének megalapítójáról nevezték el .

Az Nvidia Maxwell architektúra jellemzői

Megnövelt lefoglalt megosztott memória

A Maxwell architektúra 64 KB elosztott (regisztrált) memóriát biztosít, míg a Fermiben vagy a Keplerben ez a memória fel van osztva az L1 gyorsítótár és az elosztott memória között. Maxwellben egy blokk legfeljebb 48 KB elosztott memóriát használhat, és ennek a memórianek a növekedése a többprocesszor terhelésének növekedéséhez vezethet. Ezt az L1 gyorsítótár és a textúra gyorsítótár funkcióinak egy külön blokkban való kombinálása tette lehetővé.

Gyorsabb atomműveletek a megosztott memóriában

A Maxwell architektúra beépített atomi műveleteket vezetett be 32 bites egész számokra az elosztott memóriában, valamint CAS műveleteket a 32 bites és 64 bites memóriaértékeken – ezek más atomi funkciók megvalósítására is használhatók. A Kepler és a Fermi esetében bonyolult Lock/Update/Unlock elvet kellett alkalmazni, ami többletköltségeket eredményezett.

Dinamikus párhuzamosság

A Kepler GK110-nél bevezetett dinamikus párhuzamosság lehetővé teszi a GPU számára, hogy feladatokat hozzon létre magának. Ennek a funkciónak a támogatása először a CUDA 5.0-ban jelent meg, lehetővé téve a GK110 szálai további magok futtatását ugyanazon a GPU-n.

Csempézett renderelés

Az Nvidia és a GeForce sorozatú videokártyák esetében először vezették be a csempe renderelési technológiát a teljesítmény növelése és a memóriaterhelés csökkentése érdekében. [1] [2] Ugyanakkor az AMD versenytársai gyakorlatilag nem rendelkeznek vele, ez a technológia jelenleg még hiányzik, az egyetlen kivétel a HBM memóriás VEGA sorozat.

Kepler és Maxwell összehasonlítása

Jellemzők Kepler Maxwell
GPU GK107 (Kepler) GM107 (Maxwell)
CUDA magok 384 640
alapfrekvencia 1058 MHz 1020 MHz
GPU boost frekvencia n/a 1085 MHz
gigaflops 812,5 1305.6
Számítási képességek 3.0 5.0
Elosztott memória / SM 16 KB / 48 KB 64 KB
Regisztrálja a fájlméretet / SM 256 KB 256 KB
A blokkok maximális száma 16 32
Memória frekvencia 5000 MHz 5400 MHz
L2 gyorsítótár mérete 256 KB 2048 KB
TDP 64 W 60 W
tranzisztorok 1,3 milliárd 1,87 milliárd
Kristály terület 118 mm² 148 mm²
Folyamat technológia 28 nm 28 nm

utód

A Maxwell után következő architektúra Pascal kódnév alatt jelent meg . [3]

Jegyzetek

  1. Kiderült az új NVIDIA architektúrák hatékonyságának fő titka . 3DNews – Daily Digital Digest. Letöltve: 2019. március 1. Az eredetiből archiválva : 2019. március 2.
  2. Csempe renderelés – a Maxwell/Pascal architektúra titkos receptje . www.hardwareluxx.ru Letöltve: 2019. március 1. Az eredetiből archiválva : 2019. március 2.
  3. NVIDIA frissíti a GPU ütemtervét; Bejelenti a Pascalt , archiválva 2014. március 25-én a Wayback Machine -nél // Az NVIDIA hivatalos blogja, 2014. március 25.