La serie GeForce 900 è una famiglia di GPU sviluppata da Nvidia, usata in PC desktop e portatili. Serve come introduzione per la fascia alta dell'architettura Maxwell (il codename del chip inizia per GM-XXX), che prende nome dal fisico scozzese James Clerk Maxwell.
La microarchitettura di Maxwell, il successore di Kepler, sarà per la prima volta proprio una CPU ARM.[1] Questo fa sì che le GPU Maxwell siano molto indipendenti dalla CPU principale secondo il CEO di Nvidia Jen-Hsun Huang.[2] Nvidia si aspetta tre principali caratteristiche con l'architettura Maxwell: miglioramento delle prestazioni grafiche, programmazione semplificata e una maggiore efficienza energetica rispetto alle serie GeForce 700 e GeForce 600.[3]
Maxwell è stata annunciata a settembre 2010.[4] La prima scheda GeForce dedicata al consumatore è stata rilasciata ad inizio 2014.[5] Nvidia sta programmando di rilasciare elaboratori ad alta velocità Tesla e schede grafiche professionali Quadro basata sull'architettura Maxwell verso fine 2014. Eventualmente, questa architettura verrà usata per processori mobile che seguono la famiglia di prodotti Erista del SoC Tegra.
La prima generazione Maxwell GM107/GM108 è stata rilasciata come GeForce GTX 745, GTX 750/750 Ti e GTX 850M/860M (GM107) e GTX 830M/840M (GM108). Questi nuovi chip forniscono poche nuove funzionalità; Nvidia si è voluta concentrare sull'efficienza e sul basso consumo energetico. Nvidia ha incrementato la memoria cache L2 da 256 KB di GK107 a 2 MB su GM107, riducendo l'ampiezza di banda per quanto riguarda la memoria necessaria. Di conseguenza Nvidia ha ridotto il bus della memoria da 192 bit su GK106 a 128 bit su GM107, risparmiando ulteriore energia.[6] Nvidia ha inoltre modificato il design degli streaming multiprocessor rispetto a Kepler (SMX), chiamandoli SMM. La struttura del warp scheduler è stata ereditata da Kepler, che permette ad ogni schedule di emettere fino a due istruzioni indipendenti per ogni altra e che sono in ordine dallo stesso warp. Il layout dell unità SMM è diviso in modo tale che ognuna delle 4 warp schedula un SMM che controlla 1 di 32 FP32 CUDA cores, 1 di 8 load/store units, e 1 di 8 unità per funzioni speciali. Tutto ciò è in contrasto con Kepler, dove ogni SMX posside 4 schedulers che controllano un gruppo condiviso di 6 su 32 FP32 CUDA cores, 2 di 16 load/store units, e 2 di 16 unità per funzioni speciali.[7] Queste unità sono connesse da una traversa che usa corrente per permettere alle risorse di essere condivise.[7] Questa traversa è stata rimossa in Maxwell.[7] Texture units e FP64 CUDA cores rimangono condivisi.[6] SMM permettono una allocazione più fine delle risorse rispetto a SMX, si risparmia corrente quando il carico di lavoro non è ottimale per la condivisione di risorse. Nvidia dichiara che 128 CUDA core SMM hanno il 90% delle performance di 192 CUDA core SMX.[6] Anche ogni Graphics Processing Cluster, o GPC, contiene fino a 4 unità SMX in Kepler, e fino a 5 unità SMM nella prima generazione di Maxwell.[6]
GM107 supporta CUDA Compute Capability 5.0 rispetto al 3.5 di GK110/GK208 e al 3.0 di GK10x. Dynamic Parallelism e HyperQ, due features di GK110/GK208, sono inoltre supportare in tutta la linea di prodotti Maxwell.
Maxwell dispone inoltre di un supporto nativo a shared memory atomic operations for 32-bit integers e shared memory 32-bit and 64-bit compare-and-swap (CAS), che possono essere implementato di usare altre funzioni atomiche.
Le GPU basate su tecnologia Maxwell contengono inoltre il blocco NVENC SIP introdotto in Kepler. L'encoder video Nvidia, NVENC, è da 1.5 a 2 volte più veloce rispetto alle schede video basate sull'architettura Kepler e questo significa che è in grado di decodificare video da 6 a 8 volte il tempo della riproduzione.[6]
Nvidia ha inoltre dichiarato un aumento di performance da 8 a 10 volte nella funzione PureVideo e video decoding grazie alla cache del video decoder cache accoppiate con l'incremento dell'efficienza della memoria. Tuttavia la codifica H.265 non è completamente supportata tramite codifica hardware, creando un mix tra codifica hardware e software.[6] Quando viene decodificato un video, un nuovo stato a basso consumo "GC5" è usato dalle GPU Maxwell per risparmiare corrente.[6]
Seconda generazione Maxwell (GM20x)
La seconda generazione di GPU Maxwell introduce una serie di nuove tecnologie: Dynamic Super Resolution[8], Third Generation Delta Color Compression[9], Multi-Pixel Programming Sampling[10], Nvidia VXGI (Real-Time-Voxel-Global Illumination), VR Direct[11][12][13], Multi-Projection Acceleration[9], e Multi-Frame Sampled Anti-Aliasing(MFAA)[14] tuttavia è stato rimosso il supporto a Coverage-Sampling Anti-Aliasing(CSAA).[15] È stato inoltre aggiunto il supporto a HDMI 2.0.[16][17]
La seconda generazione di Maxwell ha inoltre modificato il rapporto di ROP per controller di memoria da 8:1 a 16:1.[18] Nonostante ciò, alcuni di questi ROP sono generalmente inattivi nella GTX 970 perché non ci sono abbastanza SMM abilitati per assegnare ad essi lavoro e prima che venga ridotto il livello massimo di saturazione.[19]
La seconda generazione Maxwell ha inoltre fino a 4 unità SMM per GPC, al posto di 5 unità SMM per GPC.[18]
GM204 supporta CUDA Compute Capability 5.2 al posto del 5.0 presente nella GPU GM107/GM108 e al 3.5 presente nelle GPU GK110/GK208 e 3.0 sulle GPU GK10x.[9][18][20]
La seconda generazione di GPU Maxwell (GM20x) hanno un'unità NVENC aggiornata che supporta la codifica HEVC e H.264 a 1440p/60FPS e 4K/60FPS rispetto all'NVENC della prima generazione GM10x che supporta solamente la codifica H.264 a 1080p/60FPS.[13]
La GPU Maxwell GM206 supporta a pieno la codifica HEVC.[21]
Dopo Maxwell, la successiva architettura ha nome in codice Pascal.[47][48] Nvidia ha annunciato che le GPU basate su Pascal avranno come caratteristiche: stacked DRAM, Unified Memory, NVLink.[47][48]