A série GeForce 700 (estilizada como GEFORCE GTX 700 SERIES) é uma família de unidades de processamento gráfico desenvolvida pela Nvidia. Embora seja principalmente uma atualização da microarquitetura Kepler (chips de codinome GK), algumas placas usam Fermi (GF) e placas posteriores usam Maxwell (GM). As placas da série GeForce 700 foram lançadas pela primeira vez em 2013, começando com o lançamento da GeForce GTX Titan em 19 de fevereiro de 2013, seguida pela GeForce GTX 780 em 23 de maio de 2013. Os primeiros chips móveis da série GeForce 700 foram lançados em abril de 2013.
Visão geral
O GK110 foi projetado e comercializado tendo em mente o desempenho computacional. Ele contém 7,1 bilhões de transistores. Este modelo também tenta maximizar a eficiência energética através da execução de tantas tarefas quanto possível em paralelo de acordo com as capacidades de seus processadores de streaming.
Com o GK110, são vistos aumentos no espaço de memória e largura de banda para o arquivo de registro e o cache L2 em relação aos modelos anteriores. No nível SMX, o espaço do arquivo de registro do GK110 aumentou para 256KB composto por registros de 64K de 32 bits, em comparação com os registros de 32K de 32 bits do Fermi, totalizando 128 KB. Quanto ao cache L2, o espaço do cache GK110 L2 aumentou em até 1,5 MB, 2x maior que o GF110. Tanto o cache L2 quanto a largura de banda do arquivo de registro também dobraram. O desempenho em cenários de falta de registro também é aprimorado, pois há mais registros disponíveis para cada encadeamento. Isso acompanha o aumento do número total de registradores que cada thread pode endereçar, passando de 63 registradores por thread para 255 registradores por thread com GK110.
Com o GK110, a Nvidia também retrabalhou o cache de textura da GPU para ser usado para computação. Com 48 KB de tamanho, na computação, o cache de textura torna-se um cache somente leitura, especializado em cargas de trabalho de acesso à memória desalinhadas. Além disso, recursos de detecção de erros foram adicionados para torná-lo mais seguro para uso com cargas de trabalho que dependem de ECC.[3]
A série GeForce 700 contém recursos do GK104 e do GK110. Os membros baseados em Kepler da série 700 adicionam os seguintes recursos padrão à família GeForce.
Hyper-Q (funcionalidade MPI do Hyper-Q reservada apenas para Tesla)
Unidade de Gerenciamento de Rede
NVIDIA GPUDirect (funcionalidade RDMA do GPU Direct reservada apenas para Tesla e Quadro)
GPU-Boost 2.0
Melhoria SMX de foco de computação
Com o GK110, a Nvidia optou por aumentar o desempenho de computação. A maior mudança do GK104 é que, em vez de 8 núcleos FP64 CUDA dedicados, o GK110 tem até 64, proporcionando 8x a taxa de transferência FP64 de um GK104 SMX. O SMX também vê um aumento no espaço para arquivo de registro. O espaço do arquivo de registro aumentou para 256 KB em comparação com o Fermi. O cache de textura também foi aprimorado. Com um espaço de 48 KB, o cache de textura pode se tornar um cache somente leitura para cargas de trabalho de computação.[3]
Novas instruções aleatórias
Em um nível baixo, o GK110 vê instruções e operações adicionais para melhorar ainda mais o desempenho. Novas instruções de shuffle permitem que threads dentro de um warp compartilhem dados sem voltar para a memória, tornando o processo muito mais rápido do que o método load/share/store anterior. As operações atômicas também foram revisadas, acelerando a velocidade de execução das operações atômicas e adicionando algumas operações FP64 que antes estavam disponíveis apenas para dados FP32.[3]
Hyper-Q
O Hyper-Q expande as filas de trabalho de hardware GK110 de 1 para 32. O significado disso é que ter uma única fila de trabalho significava que o Fermi poderia estar ocupado às vezes, pois não havia trabalho suficiente naquela fila para preencher todos os SM. Por ter 32 filas de trabalho, o GK110 pode, em muitos cenários, obter maior utilização ao ser capaz de colocar diferentes fluxos de tarefas no que, de outra forma, seria um SMX ocioso. A natureza simples do Hyper-Q é ainda mais reforçada pelo fato de ser facilmente mapeado para MPI, uma interface comum de troca de mensagens frequentemente usada em HPC. Como algoritmos legados baseados em MPI que foram originalmente projetados para sistemas multi-CPU que se tornaram gargalos por falsas dependências, agora têm uma solução. Ao aumentar o número de tarefas MPI, é possível utilizar o Hyper-Q nesses algoritmos para melhorar a eficiência sem alterar o próprio código.[3]
Suporte Microsoft DirectX
As GPUs Nvidia Kepler da série GeForce 700 suportam totalmente o DirectX 11.0.
A Nvidia oferece suporte à API DX12 em todas as GPUs da classe DX11 fornecidas; estes pertencem às famílias arquitetônicas Fermi, Kepler e Maxwell.[1]
Paralelismo dinâmico
A capacidade de paralelismo dinâmico é para que os kernels possam despachar outros kernels. Com o Fermi, apenas a CPU poderia despachar um kernel, o que gera uma certa sobrecarga por ter que se comunicar de volta com a CPU. Ao dar aos kernels a capacidade de despachar seus próprios kernels filhos, o GK110 pode economizar tempo por não ter que voltar para a CPU e, no processo, liberar a CPU para trabalhar em outras tarefas.[3]
Produtos
GeForce série 700 (7xx)
A série GeForce 700 para arquitetura de desktop. Esperava-se que produtos mais baratos e de menor desempenho fossem lançados com o tempo. Kepler oferece suporte a recursos 11.1 com nível de recurso 11_0 por meio da API DirectX 11.1, no entanto, a Nvidia não habilitou quatro recursos não relacionados a jogos em Hardware no Kepler (para 11_1).[6][7]
2 A taxa de preenchimento do pixel é calculada como o número de ROPs multiplicado pela velocidade base do clock do núcleo
3 A taxa de preenchimento da textura é calculada como o número de TMUs multiplicado pela velocidade do clock base do núcleo.
4 O desempenho de precisão única é calculado como 2 vezes o número de shaders multiplicado pela velocidade base do clock do núcleo.
5 O desempenho de precisão dupla da GTX Titan e GTX Titan Black é 1/3 ou 1/24 do desempenho de precisão simples, dependendo de uma opção de configuração selecionada pelo usuário no driver que aumenta o desempenho de precisão simples se a precisão dupla for definida como 1/24 de desempenho de precisão simples,[8] enquanto o desempenho de precisão dupla de outros chips Kepler é fixado em 1/24 de desempenho de precisão simples.[9] O desempenho de precisão dupla dos chips GeForce série 700 Maxwell é 1/32 do desempenho de precisão simples.[10]
6 SLI suporta a conexão de até 4 placas gráficas idênticas para uma configuração SLI de 4 vias. Aqueles que suportam SLI de 4 vias podem suportar SLI de 3 e 2 vias, no entanto, uma placa de GPU dupla já implementa SLI de 2 vias internamente, portanto, apenas 2 placas de GPU dupla podem ser usadas em SLI para fornecer um SLI de 4 vias configuração.
GeForce série 700M (7xxM)
Algumas implementações podem usar especificações diferentes.
↑No OpenCL 3.0, a funcionalidade do OpenCL 1.2 tornou-se uma linha de base obrigatória, enquanto todos os recursos do OpenCL 2.xe OpenCL 3.0 se tornaram opcionais.
↑ abMax Boost depende da qualidade ASIC. Por exemplo, alguns GTX TITAN com mais de 80% de qualidade ASIC podem atingir 1019 MHz por padrão, a qualidade ASIC inferior será de 1006 MHz ou 993 MHz.
↑Maxwell suporta Vulkan versão 1.3, enquanto Kepler suporta apenas Vulkan versão 1.2, Fermi não suporta Vulkan API.
[24]
↑ abKepler oferece suporte a alguns recursos 11.1 opcionais no nível de recurso 11_0 por meio da API Direct3D 11.1; no entanto, a Nvidia não habilitou quatro recursos não relacionados a jogos para qualificar o Kepler para o nível 11_1.[25][26]
↑A GeForce GT 705 (OEM) é uma GeForce GT 610 renomeada, que por sua vez é uma GeForce GT 520 renomeada.
↑A GeForce GT 730 (DDR3, 64 bits) é uma GeForce GT 630 renomeada (Rev. 2).
↑A GeForce GT 730 (DDR3, 128 bits) é uma GeForce GT 630 renomeada (128 bits).
↑A GeForce GT 740 (OEM) é uma GeForce GTX 650 renomeada.
↑ abcComo um Kepler GPC é capaz de rasterizar 8 pixels por clock, as GPUs GK110 totalmente habilitadas (780 Ti/TITAN Black) podem gerar apenas 40 pixels por clock (5 GPCs), apesar de 48 ROPs e todas as unidades SMX estarem fisicamente presentes. Para GTX 780 e GTX 760, várias configurações de GPC com diferentes taxas de preenchimento de pixel são possíveis, dependendo de quais SMXs foram desativados no chip: 5/4 GPCs ou 4/3 GPCs, respectivamente.
↑ abA GeForce GTX 760 Ti (OEM) é uma GeForce GTX 670 renomeada.
Suporte descontinuado
A Nvidia anunciou que, após a versão 390.x dos drivers, não lançará mais drivers de 32 bits para sistemas operacionais de 32 bits.[45]
A Nvidia anunciou que as GPUs de notebook Kepler farão a transição para o suporte legado a partir de abril de 2019 e serão suportadas até abril de 2020.[46] Todas as GPUs de notebook da família 7xxM são afetadas por essa mudança.
A Nvidia anunciou que, após os drivers da versão 470, faria a transição do suporte de driver para os sistemas operacionais Windows 7 e Windows 8.1 para o status legado e continuaria a fornecer atualizações críticas de segurança para esses sistemas operacionais até setembro de 2024.[47]
A Nvidia anunciou que todas as GPUs de desktop Kepler restantes passariam para o suporte legado a partir de setembro de 2021 e seriam suportadas para atualizações críticas de segurança até setembro de 2024.[48] A Nvidia GeForce GTX 745, 750 e 750 Ti da família de GPUs de desktop 7xx não seria afetados por esta mudança.
No Windows, o último driver a oferecer suporte total ao CUDA com capacidade de computação de 64 bits 3.5 para Kepler no Windows 7 e Windows 8.1 de 64 bits é o 388.71, testado com o CUDA-Z e GPU-Z mais recente, depois desse driver, o CUDA de 64 bits suporte torna-se quebrado para GeForce 700 série GK110 com arquitetura Kepler.
O último driver em que a detecção do tipo de monitor está funcionando corretamente no Windows XP é 352.86.[49]