Skip to main content

Rein theoretisch: Kann Nvidias Next-Gen-Technik Titan-X-Leistung zum GTX-970-Preis bieten? - Digital Foundry

Eine erste Analyse der Next-Gen-Architektur Pascal und wie man sie in Mainstream-GPUs nutzen könnte.

Wenn High-Performance-Grafikkarten wie die Titan X, Fury X oder GTX 980 Ti euer Verlangen nach High-End-PC-Hardware nicht stillen, könnt ihr euch in diesem Jahr auf neue Hardware freuen, die das Potential dazu hat, die Grafik und Performance von Spielen auf die nächste Stufe zu befördern. Rückblickend haben AMD und Nvidia viel dafür getan, um die PC-Grafik Jahr für Jahr voranzubringen. Die Einführung der 14- und 16-nm-Chip-Herstellungsverfahren mit 3D-FinFET-Transistoren bietet GPU-Herstellern zum ersten Mal seit fünf Jahren wieder eine echte Innovation bei der Produktion. Jüngste Daten von Nvidia deuten an, dass uns mit der kommenden Pascal-Architektur etwas ganz Besonderes erwartet.

Alles deutet darauf hin, dass Nvidia bei der Einführung neuer Grafik-Hardware auf Basis des 16-nm-Prozesses gemeinsam mit dem Langzeitpartner TSMC die Führungsrolle übernehmen wird. Gerüchten zufolge werden Produkte Ende Mai auf Taiwans Computex Show gezeigt. In den letzten Wochen gab es in der asiatischen Presse einige Leaks und Gerüchte, aber der beste Hinweis auf den Pascal-Aufbau liefert uns die Vorstellung des Tesla-P100-Beschleunigers auf Nvidias GTC-Konferenz Anfang des Monats zusammen mit einer umfangreichen Liste an Spezifikationen.

Das neue Produkt ist für große Datenzentren und andere Kunden mit sogenannter Supercomputer-Technologie gedacht. Aber was noch wichtiger ist: Der neue Tesla basiert auf der Pascal-Technologie und die Spezifikation weisen stark darauf hin, dass dieser Prozessor am Ende zur Next-Gen-Titan oder einem ähnlichen Produkt wird. Der Name des Chips lautet GP100, was von Namen her zum GM200 der Titan X oder dem GK110 der ursprünglichen Titan passt - und einige der rohen Werte, die sich in den Daten verbergen, sind absolut bemerkenswert.

Schaut euch zuerst mal die Größe des Chips an. Es gab Bedenken, dass der 16-nm-Prozess noch eine Weile brauchen könnte, um ausgereift zu sein, dass es Jahre dauern könnte, bis größere und schwieriger herzustellende Prozessoren auf den Markt kommen. Allerdings ist der GP100 sogar größer als der GM200 - 610 mm² gegen 601 mm². Der Produktionsvorteil des 16-nm-Verfahrens wird auch durch die Zahl von 15,3 Milliarden Transistoren bestätigt - die aktuell modernsten Produkte enthalten 8 Milliarden Transistoren. Vielleicht am überraschendsten ist die Boost-Taktrate, die Höchstgeschwindigkeit des Chips. Sie liegt bei 1.480 MHz, was tatsächlich mehr ist, was man vernünftigerweise von einer Titan X erwarten kann, die bis an ihr absolutes Limit gebracht wird. Und hierbei handelt es sich um ein industrielles Produkt, dessen Taktraten meist eher konservativ im Vergleich zu Konsumenten-orientierten Grafikkarten sind.

Rich zeigt Pascals Vorzüge im Tesla-P100-Beschleuniger und wie sie sich auf Grafikkarten für den normalen Konsumenten auswirken könnten.Auf YouTube ansehen
Tesla M40 Tesla P100
GPU GM200 Maxwell GP100 Pascal
SMs 24 56
Basis-Taktrate 948 MHz 1.328 MHz
Boost-Taktrate 1.114 MHz 1.480 MHz
Texture Units 192 224
Arbeitsspeicher-Interface 384-bit GDDR5 4096-bit HBM2
L2-Cache 3.072 KB 4.096 KB
Transistoren 8 Milliarden 15,3 Milliarden
Die-Größe 601 mm2 610 mm2
Herstellungsverfahren 28 nm 16 nmFF
TDP 250 W 300 W

Auf dem Papier ist der Sprung vom GM200 zum GP100 absolut bemerkenswert. Die Rechenleistung steigt üblicherweise zusammen mit der Zahl der Transistoren. Nicht nur macht der 16-nm-Prozess genau das möglich, auch die Gesamtgeschwindigkeit des Prozessors steigt. Weitere Gründe sprechen dafür, dass hier ein großer Leistungssprung zu erwarten ist - viele glaubten, dass die Pascal-Architektur eine kleinere Die-Version von Maxwell wird. Das ist nicht der Fall, außerdem gibt es eine Umstrukturierung der CUDA-Kerne und einen weiteren großen Schub im L2-Cache. Wie sich das auf eine verbesserte Performance überträgt, bleibt natürlich erst mal abzuwarten.

Der Tesla P100 nutzt 16 GB-HBM2 Speicher, der über einen ultra-breiten 4.096-bit Bus angesteuert wird. Eine große Verbesserung gegenüber dem 384-bit GDDR5, der in der Titan X zum Einsatz kommt. Wir erwarten, dass eine Next-Gen-Titan sich ebenfalls an HBM2 hält (für die Konkurrenz von AMD, Codename Vega, ist das bereits bestätigt). Aber die Frage ist, wie viel VRAM in der "kleineren" Version der Karte zur Verfügung stehen wird, die sich an die Gaming-Zielgruppe richtet, also dem Äquivalent zur GTX 980 Ti.

An Nvidias GTC-Ankündigung fasziniert vor allem, wie viel die Firma preisgab. Das geht soweit, dass wir hier anscheinend schon einen extrem verfrühten Blick auf das bekamen, was 2017 die absolute Spitzen-GPU für Verbraucher werden könnte. Es ist unwahrscheinlich, dass wir schon dieses Jahr eine Karte auf Basis des GeForce GP100 bekommen. Was also bekommen wir stattdessen? An diesem Punkt kommen die Gerüchte aus der asiatischen Presse ins Spiel.

Neue Leaks zeigen sogar das Gehäuse des Referenzkühlers von Pascal. In einer Zeit 3D-gedruckter Fälschungen sind solche Bilder natürlich mit Vorsicht zu genießen. Das eigentliche Foto suggeriert aber, dass es direkt am Fließband geschossen wurde.

Die Leaks deuten an, dass Pascal-basierte Gaming-Karten im Juli dieses Jahres erscheinen, nachdem sie auf der Computex in Taipei rund einen Monat davor enthüllt wurden. Von mindestens zwei Karten ist die Rede, die anscheinend GTX 1070 und GTX 1080 heißen und ihre Maxwell-Gegenstücke ersetzen sollen. Die Namen erscheinen eher seltsam, aber ein weiterer Leak, der 1070- und 1080-Gehäuse zeigt, wirkt überzeugend. Das Ding ist: beide dieser Produkte sollen auf einem anderen, kleineren Pascal-Chip basieren, dem GP104.

Nvidia hat bereits bewiesen, dass ihr kleinerer Chip einer neuen Generation den Großen der vorangegangen in Sachen Performance übertreffen kann - genau das ist passiert, als die Geforce 980 die 780 Ti übertraf (die ultmative Version der ersten Titan). Die echte Frage ist aber, wie klein GP104 wirklich ist. Ein weiterer Leak, der den tatsächlichen Chip zeigt, deutet darauf hin, dass er sogar kleiner ist als das GTX-980-Äquivalent, der GM204 - irgendwo zwischen etwa 317mm2 und 330mm2, gegenüber den 398mm2 des alten Chips.

Aber es wird fast sicher die GTX 1070, die die Massenkarte dieses Line-Ups wird. Die Frage ist, wie mutig wird Nvidia damit? Als die 970 erschien, definierte sie den High-End-Markt für GPUs von Neuem. Man konnte sie über die Performance einer Standard-980 hinaus übertakten und sie schlug alles, was AMD zu bieten hatte, ohne Probleme - Produkte, die seinerzeit teilweise Hunderte Euro teurer waren. Der phänomenale Erfolg zeigte, das Risiko hatte sich gelohnt. Teilweise besaßen über fünf Prozent der gesamtem Steam-Nutzerbasis eine 970er. Selbst im März 2015 lag die Zahl noch bei 4,93 Prozent. Angesichts der gewaltigen Bandbreite an alten und neuen GPUs auf dem Markt ist das eine bemerkenswerte Zahl. Wird Nvidia das Gleiche noch einmal versuchen? Könnte eine übertaktete GTX 1070 die GTX 980 Ti genau so übertreffen wie die GTX 970 die 780 Ti damals?

Leaks über Leaks - dieses Bild zeigt angeblich den GP104-Chip, den wir bald in einer Verbraucher-Grafikkarte sehen werden. Die Speicherchips um den Prozessor herum könnten unser erster Blick auf Microns neue GDDR5X-Module sein.

Wir können uns gut vorstellen, dass Nvidia auch dieses Mal so verwegen sein wird. So phänomenal die GTX 970 auch war, AMDs Radeon R9 390 war ein großes Comeback für das rote Team. Abgesehen von Dark Souls 3 liefen alle Spiele in diesem Jahr genau so schnell oder schneller als auf der 970. In Quantum Break und Far Cry Primal zeigten sich besonders hohe Performance-Gewinne. Und dann ist da noch die Frage bezüglich Nvidias DX12-Performance. AMD verzeichnet da hohe Zuwächse, aber Nvidia schlägt sich in Spielen wie Hitman und Ashes of the Singularity nicht gerade überragend.

Es gibt noch so viele Dinge, die der Klärung bedürfen. Zum Beispiel wissen wir, dass der GP100 - der "große Pascal" - für Next-Gen HBM2-Speicher designt wurde. Aber was ist mit den Verbraucherkarten? Titan X und die 980 Ti haben so ziemlich alles aus dem GDDR5 rausgeholt, mit ihrem 384-bit Bus und den 7gbps-Modulen. Hält sich Nvidia an bewährter Technologie oder nimmt es sich Microns neuem GDDR5X mit der höheren Bandbreite an? Die jüngsten Leaks über den GP104 zeigen ihn mit aktuell nicht näher definierbaren Micron-Chips, was nahelegt, dass mindestens eine der Verbraucherkarten mit dem verbesserten RAM erscheint. [UPDATE, 28.04.15, 11:33 Uhr: Sieht so aus, als handele es sich bei den Micron-Chips tatsächlich um GDDR5X].

Die Zeit wird es zeigen. Aber angenommen, die Gerüchte und Leaks über eine Enthüllung auf der Computex und einer Veröffentlichung im Juli stimmen, müssen wir wohl nicht mehr so lange warten. Und wir werden natürlich mit Tests aller Pascal-Produkte bei der Hand sein, die wir bekommen können. Mit überarbeiteten Benchmarks samt neuer Titel in DirectX 11 und 12.

Schon gelesen?