Nvidia-GeForce-600-SerieDie GeForce-600-Serie ist eine Serie von Desktop-Grafikchips der Firma Nvidia und Nachfolger der GeForce-500-Serie. Mit der GeForce-600-Serie, die aufgrund der neuen Architektur auch als Kepler-Generation bezeichnet wird, führte Nvidia eine unvollständige Unterstützung von DirectX 11.1 ein, denn es werden nur sechs der zehn neu hinzugekommenen Funktionen gegenüber DirectX 11.0 unterstützt.[1] Die GeForce-600-Serie wurde von der GeForce-700-Serie abgelöst. BeschreibungGeschichteGK104Am 22. März 2012 präsentierte Nvidia mit der GeForce GTX 680 die erste Grafikkarte der GeForce-600-Serie, mit welcher die neue Kepler-Architektur eingeführt wurde. Die GeForce GTX 680 basiert auf dem GK104-Grafikprozessor, der aus 3,54 Mrd. Transistoren besteht, sowie 1536 Streamprozessoren und 128 Textureinheiten, die in acht Shader-Clustern organisiert sind. Die GK104-GPU wird im 28-nm-Fertigungsprozess bei TSMC hergestellt und kommt auf eine Die-Fläche von 294 mm². Ursprünglich war der GK104 als Grafikchip für den Performance-Sektor geplant gewesen, was sich u. a. an der reduzierten „Double-Precision“-Leistung erkennen lässt, aber auch daran, dass frühere Beta-Treiber die GeForce GTX 680 unter dem Namen GeForce GTX 670 Ti führten. Nachdem Nvidia den GK100-Grafikprozessor zu Gunsten des GK110 strich, musste der GK104 auch für den High-End-Sektor verwendet werden, da der GK110 erst für die Kepler-Refresh-Generation zur Verfügung stehen sollte. Die GeForce GTX 680 wies bei ihrer Präsentation eine, je nach Auflösung, rund 10 Prozent höhere Performance gegenüber der Radeon HD 7970 vom Konkurrenten AMD auf, sowie 30 bis 35 Prozent gegenüber dem Vorgänger, der GeForce GTX 580. Damit war die GeForce GTX 680 zunächst die schnellste Single-Chip-Grafikkarte am Markt. In der Fachpresse wurde die Karte überwiegend positiv bewertet, was neben der Performance vor allen Dingen auf die Energieeffizienz zurückzuführen war, da sie gegenüber der langsameren Radeon HD 7970 und GeForce GTX 580 eine niedrigere Leistungsaufnahme aufwies. Auch der Referenzkühler wurde, im Verhältnis für eine Karte im High-End-Bereich, positiv bewertet. Am 29. April 2012 präsentierte Nvidia die Dual-Chip-Grafikkarte GeForce GTX 690, die auf zwei GK104-GPUs im Vollausbau basierte. Die Karte wies eine um ca. 40 Prozent höhere Performance gegenüber ihrem Vorgänger, der GeForce GTX 590, auf. Da AMD auf die bereits angekündigte Radeon HD 7990 verzichtete (nur einige Boardpartner veröffentlichten Eigendesigns unter diesem Namen), nahm die GeForce GTX 690 als schnellste Grafikkarte am Markt eine Monopolstellung ein. Da Nvidia die Leistungsaufnahme gegenüber früheren Dual-Chip-Grafikkarten deutlich senken konnte, bedingt durch die Vorteile der Kepler-Architektur, aber auch die Geräuschentwicklung (aufgrund der niedrigeren Wärmeentwicklung), wurde die Karte in der Fachpresse positiv bewertet. Dies war auch darauf zurückzuführen, dass Nvidia das Phänomen der „Mikroruckler“, was im SLI-Betrieb entsteht (genauso wie bei AMDs Crossfire), reduzieren konnte. Am 10. Mai 2012 präsentierte Nvidia die dritte Grafikkarte auf Basis der GK104-GPU, die GeForce GTX 670. Bei dieser wurde ein Shadercluster des GK104-Grafikprozessors deaktiviert (womit noch 1344 Streamprozessoren und 112 Textureinheiten aktiv waren), der Chiptakt reduziert und das Referenz-Platinenlayout überarbeitet. Dies führte dazu, dass die GeForce GTX 670 gegenüber der GTX 680 ca. 10 Prozent Performance verlor und in etwa genauso schnell war, wie die Radeon HD 7970 (solange keine extremen Auflösungen über „Full HD“ verwendet wurden). Erneut erhielt Nvidia positive Kritiken für die bessere Energieeffizienz gegenüber dem AMD-Konkurrenten, allerdings sorgte der vereinfachte Referenzkühler für negative Bewertungen, da er trotz der geringeren Wärmeentwicklung gegenüber der GeForce GTX 680 lauter war. Die meisten Boardpartner reagierten mit Eigendesigns auf den Referenzkühler, um der Kritik entgegenzuwirken. Am 16. August 2012 führte Nvidia die GeForce GTX 660 Ti im Markt ein. Die Karte ist technisch gesehen mit der GeForce GTX 670 identisch, nur das Speicherinterface wurde von 256 auf 192 Bit reduziert; Chipausbau, Platinenlayout, Taktraten und Speicherbestückung sind ansonsten unverändert. Das reduzierte Speicherinterface und die damit verbundene asynchrone Speicherbestückung führten dazu, dass die GeForce GTX 660 Ti gegenüber der GTX 670 rund 15 Prozent an Leistung verlor und somit ungefähr die Performance der Radeon HD 7950 aufwies. Die GeForce GTX 660 Ti war die erste Grafikkarte mit der GK104-GPU, die Nvidia für unter 300 € auf den Markt brachte und somit im wichtigen Performance-Sektor platzierte, für welchen der GK104 ursprünglich entworfen wurde. Für den OEM-Markt legte Nvidia eine weitere Variante der GeForce GTX 660 Ti auf, bei welcher zwei Shadercluster deaktiviert waren und die Taktraten weiter reduziert wurden. Diese Karte wurde unter dem Namen GeForce GTX 660 (ohne Ti) ausgeliefert, ist aber nicht mit der GeForce GTX 660 auf Basis des GK106-Grafikprozessores zu verwechseln. GK106Der GK106-Grafikprozessor wurde gut ein halbes Jahr nach dem GK104 und GK107 vorgestellt, was vermutlich auf ein Redesign von vier auf fünf Shader-Clustern zurückzuführen ist (daraus entsteht die Besonderheit, dass der GK106 als einzige Kepler-GPU ein asynchrones Verhältnis von GPC zu den SMX-Blöcken im Vollausbau besitzt). Letztendlich besteht der GK106 aus 2,54 Mrd. Transistoren auf einer Die-Fläche von 214 mm² und verfügt über 960 Streamprozessoren, sowie 80 Textureinheiten. Die erste Grafikkarte auf Basis des GK106 stellte Nvidia am 13. September 2012 mit der GeForce GTX 660 vor. Die GeForce GTX 660 hatte für Nvidia eine hohe Marktrelevanz, da, nachdem AMD bereits im März 2012 die Radeon HD 7850 und 7870 präsentiert hatte, Nvidia keinerlei konkurrenzfähigen Angebote in dem wichtigen Marktsegment um die 200 € aufweisen konnte. Vermutlich führte diese Situation zum Redesign des GK106, da dieser in seiner ursprünglichen Form mit nur vier Shaderclustern nicht mit der AMD-Konkurrenz mithalten konnte und Nvidia über ein halbes Jahr diesen Marktbereich aufgeben musste. Letztendlich platzierte Nvidia die GeForce GTX 660 sowohl von der Leistung, als auch der Preis, zwischen den AMD-Konkurrenten Radeon HD 7850 und 7870. Die Bewertungen zur GeForce GTX 660 fielen in der Fachpresse sehr unterschiedlich aus, was teilweise darauf zurückzuführen war, dass Nvidia kein Referenzdesign vorgab und somit die Hardwaretester völlig unterschiedliche Testsamples von verschiedenen Boardpartner bekamen, die sich sowohl bei der Performance, aber insbesondere beim Kühlerdesign (und somit der Geräuschentwicklung) unterschieden. Bei der GeForce GTX 660 griff Nvidia erneut auf die asynchrone Speicherbestückung aus 2 GB Vram und einem 192 Bit Speicherinterface zurück. Im Gegensatz zur GeForce GTX 660 Ti, bei welcher teilweise Performanceeinbrüche zu beobachten war, zeigten sich bei 3D-Anwendungen keinerlei Nachteil auf der GeForce GTX 660 durch diese Konfiguration. Die zweite Grafikkarte auf Basis des GK106 präsentierte Nvidia am 9. Oktober 2012 mit der GeForce GTX 650 Ti. Die Namensgebung sorgte hierbei für Verwirrung, da zuvor bereits eine GeForce GTX 650 eingeführt worden war, die aber auf dem deutlich langsameren GK107-Grafikprozessor basierte. Der GK106 kommt auf der GeForce GTX 650 Ti mit einem deaktivierten Shadercluster daher, womit noch vier aktive Cluster zur Verfügung stehen. Des Weiteren ist das Speicherinterface auf 128 Bit reduziert worden und die GPU-Boost-Funktion fehlte. Nvidia platzierte die Karte gegen die Radeon HD 7770, gegenüber der man eine rund 10 Prozent höhere Performance bei etwas geringerem Stromverbrauch aufweisen konnte. Allerdings setzte Nvidia den Startpreis zu hoch an, was neben der Namensgebung für Kritik sorgte. Um die relativ große Leistungslücke zwischen der GeForce GTX 660 und der GTX 650 Ti zu schließen und um auf die Radeon HD 7790 von AMD zu reagieren, führte Nvidia am 26. März 2013 die GeForce GTX 650 Ti Boost ein. Entgegen der Namensgebung handelt es sich bei der GeForce GTX 650 Ti Boost weniger um eine aufgebohrte GTX 650 Ti, sondern um eine GeForce GTX 660, bei der ein SMX-Block deaktiviert ist (also noch vier von fünf Shadercluster aktiv sind). Die restlichen Spezifikationen sind mit denen der GeForce GTX 660 identisch. Die Karte erreichte somit eine in etwa die Performance des AMD Konkurrenten Radeon HD 7850. GK107Der GK107-Grafikprozessor ist die kleinste GPU der Kepler-Generation. Er verfügt nur über zwei Shadercluster und kommt somit auf 384 Streamprozessoren sowie 32 Textureinheiten. Der GK107 besteht aus 1,3 Mrd. Transistoren auf einer Die-Fläche von 118 mm². Keine bisher veröffentlichte GK107-Grafikkarte unterstützt die GPU-Boost-Funktion, wobei gegenwärtig unklar ist, ob dieses Feature grundsätzlich vom GK107 nicht unterstützt wird oder Nvidia es bisher nicht aktiviert hat. Den GK107 verwendete Nvidia zunächst nur im Mobilsektor, bevor am 24. April 2012 die GeForce GT 630 und GT 640 vorgestellt wurden. Diese Karten waren, zusammen mit einigen Neuauflagen aus der älteren Fermi-Generation, aber nur für den OEM-Markt vorgesehen. Erst am 5. Juni 2012 stellte Nvidia auch eine GeForce GT 640 für den Retail-Markt vor, die aber in der Fachpresse massiv kritisiert wurde, was auf den zu hohen Preis zurückzuführen war. Am 13. September 2012 folgte dann die verbesserte GeForce GTX 650, bei welcher Nvidia den DDR3- durch schnelleren GDDR5-Speicher ersetzte. Trotz der damit erreichten Performanceverbesserungen, wurde auch diese Karte negativ bewertet, weil sie ebenfalls im Vergleich zur AMD-Konkurrenz zu teuer war. GK208Bei dem GK208-Grafikprozessor handelt es sich im weitesten Sinne um eine neue Revision der GK107-GPU mit nur noch einer Rasterpartition. Allerdings hat der Chip 512 kB Cache pro Rasterpartition (also auch 512 kB insgesamt) während es bei GK107 noch 128 kB pro Rasterpartition (insgesamt 256 kB) waren. Auch gibt es tatsächlich nur noch 8 TMUs pro SMX und nicht mehr 16. Zudem werden auch einige neue Compute Features die mit GK110 eingeführt wurden unterstützt (compute capability 3.5 statt 3.0 wie bei den anderen GK10x Chips). Im Gegensatz zu den restlichen Kepler-GPUs gab Nvidia keinen offiziellen Transistorwert oder Diegröße bekannt (letztere lässt sich mit Hilfe von Die-Screenshots auf rund 90 mm² schätzen). Die GPU wurde zunächst nur im Mobilbereich verbaut, bevor Nvidia am 29. Mai 2013 die zweite Revision der GeForce GT 630 und 640 auf Basis des GK208 vorstellte. Nvidia gibt für den GK208 als einzige Kepler-GPU die offizielle Unterstützung von DirectX 11.1 an, allerdings mit dem „Feature Level 11.0“, womit die exakte Supportsituation unklar ist.[2] RebrandingWie bereits bei älteren Grafikkartengenerationen üblich, wiederholte Nvidia bei der GeForce-600-Serie die Praxis, Grafikkarten der älteren Generation unter neuem Namen aufzulegen. Dieses Verfahren, welches in erster Linie für den OEM-Markt praktiziert wird, wird als „Rebranding“ bezeichnet. Als erstes legte Nvidia am 3. April 2012 die GeForce 510 und GT 520 als GeForce 605 und GT 620 neu auf. Am 24. April wurde das Verfahren mit der GeForce GT 545 (DDR3) und GTX 555 als GeForce GT 640 und GT 645 wiederholt. Am 15. Mai folgte dann erneut die GeForce GT 520 als GeForce 610, sowie die GeForce GT 430, GT 440 (DDR3) und GT 440 (GDDR5) als GeForce GT 620, GT 630 (DDR3) und GT 630 (GDDR5). ArchitekturAls Grundlage der GeForce-600-Serie dient die neuentwickelte Kepler-Architektur, benannt nach dem deutschen Mathematiker Johannes Kepler, die die bisherige Fermi-Architektur ablöst. Obwohl Nvidia die Kepler-Architektur als Neuentwicklung bezeichnet, stellt diese tatsächlich eine Weiterentwicklung der vorherigen Fermi-Generation dar. Primäre Änderung stellt dabei der Wegfall des „Hot Clock“ für die Shadereinheiten bzw. Streamprozessoren dar. Seit der Unified-Architektur des G80-Grafikprozessors verwendete Nvidia einen sogenannten „Hot Clock“, mit welchem die Shadereinheiten einen separaten, höheren Takt aufwiesen als die restliche GPU. Damit konnte Nvidia mit weniger Shadereinheiten höhere Leistungen erzielen, allerdings führte dies auch dazu, dass die GPUs eine gegenüber den Grafikprozessoren vom Konkurrenten AMD schlechtere Energieeffizienz aufwiesen. Mit dem Wegfall des „Hot Clock“ konnte Nvidia dieses Manko beheben und gleichzeitig mehr Shadereinheiten verbauen, da diese nun weniger Platz auf dem Die benötigen (als imaginäre Rechnung gibt Nvidia an, dass bei einer 10 Prozent geringeren Leistungsaufnahme 80 Prozent mehr Die-Fläche für die Shadereinheiten nutzen zu können).[3] Unabhängig von den überarbeiteten Streamprozessoren hat Nvidia das „Scheduling“ der Rechenbefehle vereinfacht und stärker auf die Software ausgelagert.[3] Des Weiteren ist die Raster-Engine nun in der Lage, sämtliche ROPs pro Takt mit einem Pixel zu versorgen, was auf der Fermi-Generation nicht möglich war.[3] Der Grundaufbau der Kepler-Architektur ist mit Fermi vergleichbar: Nach wie vor setzen sich die GPUs aus sogenannten „Graphics Processing Clusters“, kurz GPC, zusammen (der GK104 besteht als Beispiel aus vier GPCs).[3] Jeder GPC besteht aus zwei Shaderclustern (von Nvidia als SMX-Blöcke bezeichnet), die wiederum jeweils 192 Streamprozessoren sowie Load-and-Store-Einheiten und Special-Function-Units beherbergen. Des Weiteren sind in jedem Shadercluster nun 16 statt vier bis acht Textureinheiten verbaut, die pro Takt ein Pixel adressieren sowie texturieren können.[3] Der Aufbau der Rastereinheiten blieb unverändert: Nach wie vor sind diese in ROP-Cluster aufgeteilt, wobei jeder Cluster acht „Raster Operation Processors“ und einen 64-Bit-Speichercontroller beinhaltet.[3] Eine Besonderheit der Kepler-Architektur stellt die GPU-Boost-Funktion dar. Dabei handelt es sich um eine dynamische Übertaktungsfunktion, die die GPU immer dann höher taktet, wenn ein bestimmtes von Nvidia festgesetztes „Power Target Limit“ nicht erreicht wird. Weitere Faktoren sind die Leistungsaufnahme, Temperatur und die anliegenden Ströme. Der Grafikspeicher wird von dieser Funktion nicht beeinflusst.[4] DatenübersichtGrafikprozessoren
Modelldaten
Leistungsaufnahmedaten
Anmerkungen
WeblinksCommons: Nvidia-GeForce-600-Serie – Sammlung von Bildern, Videos und Audiodateien
Einzelnachweise
|