Rein theoretisch: Kann Nvidias Next-Gen-Technik Titan-X-Leistung zum GTX-970-Preis bieten? - Digital Foundry

Eine erste Analyse der Next-Gen-Architektur Pascal und wie man sie in Mainstream-GPUs nutzen könnte.

Artikel von Richard Leadbetter Technology Editor, Digital Foundry

Veröffentlicht am 29. April 2016

Wenn High-Performance-Grafikkarten wie die Titan X, Fury X oder GTX 980 Ti euer Verlangen nach High-End-PC-Hardware nicht stillen, könnt ihr euch in diesem Jahr auf neue Hardware freuen, die das Potential dazu hat, die Grafik und Performance von Spielen auf die nächste Stufe zu befördern. Rückblickend haben AMD und Nvidia viel dafür getan, um die PC-Grafik Jahr für Jahr voranzubringen. Die Einführung der 14- und 16-nm-Chip-Herstellungsverfahren mit 3D-FinFET-Transistoren bietet GPU-Herstellern zum ersten Mal seit fünf Jahren wieder eine echte Innovation bei der Produktion. Jüngste Daten von Nvidia deuten an, dass uns mit der kommenden Pascal-Architektur etwas ganz Besonderes erwartet.

Alles deutet darauf hin, dass Nvidia bei der Einführung neuer Grafik-Hardware auf Basis des 16-nm-Prozesses gemeinsam mit dem Langzeitpartner TSMC die Führungsrolle übernehmen wird. Gerüchten zufolge werden Produkte Ende Mai auf Taiwans Computex Show gezeigt. In den letzten Wochen gab es in der asiatischen Presse einige Leaks und Gerüchte, aber der beste Hinweis auf den Pascal-Aufbau liefert uns die Vorstellung des Tesla-P100-Beschleunigers auf Nvidias GTC-Konferenz Anfang des Monats zusammen mit einer umfangreichen Liste an Spezifikationen.

Das neue Produkt ist für große Datenzentren und andere Kunden mit sogenannter Supercomputer-Technologie gedacht. Aber was noch wichtiger ist: Der neue Tesla basiert auf der Pascal-Technologie und die Spezifikation weisen stark darauf hin, dass dieser Prozessor am Ende zur Next-Gen-Titan oder einem ähnlichen Produkt wird. Der Name des Chips lautet GP100, was von Namen her zum GM200 der Titan X oder dem GK110 der ursprünglichen Titan passt - und einige der rohen Werte, die sich in den Daten verbergen, sind absolut bemerkenswert.

Was ist mit AMD?

Nicht nur Nvidia hat Zugang zu einem neuen Herstellungsverfahren, AMD ebenfalls. Das Unternehmen kann einen 14-nm-FinFET-Prozess von Global Foundries oder Samsung nutzen - vielleicht sogar von beiden. Theoretisch wäre ein 14-nm-Prozess einem 16-nm-Prozess gegenüber zu bevorzugen, aber so wie wir es verstehen, sind es zwei verschiedene Implementierungen von so ziemlich der gleichen Technologie. Für das iPhone 6S verwendet Apple zum Beispiel Chips beider Größen.

AMDs neue Architektur hört auf den Codenamen Polaris, in Entwicklung befinden sich Polaris-10- und Polaris-11-Chips. Wir rechnen damit, dass Polaris die Antwort von Team Rot auf Nvidias GP104 ist und GDDR5 oder GDDR5X verwendet. Next-Gen-HBM-Produkte werden später erwartet und sie haben ihren eigenen Codenamen: Vega. Ein mittlerweile gelöschtes LinkedIn-Profil von AMDs R&D Manager Yu Zheng deutet an, dass ein Vega-Produkt über 4.096 Shader verfügen wird, so wie die Fury X.

Abseits der architektonischen Übersicht gibt es wenig mehr, was wir derzeit bei Polaris herauslesen können. AMD selbst hat bisher nur einen winzigen Einblick in seine Möglichkeiten gewährt und deutete an, dass ein Polaris-Produkt (vermutlich Polaris 10) Star Wars: Battlefront auf mittleren Einstellungen in 1080p60 darstellen kann - und das mit einem 61 Prozent geringeren Stromverbrauch als bei Nvidias GTX 950, die 140 W erfordert.

Es ist ein seltsamer Vergleich, denn jüngste Leaks deuten an, dass Polaris 10 2.304 Shader verwendet, was es zu einem kostspieligeren Produkt und zu einem überaus fähigen Ersatz für die vorhandene R9 380 macht. Tatsächlich ist dieses Stück Silizium ein heißer Kandidat dafür, ein wichtiger Teil des Aufbaus für den den Prozessor der PlayStation Neo zu sein.

Um ehrlich zu sein ist es kein toller Vergleich - die GTX 950 basiert auf dem 28-nm-Prozess und läuft mit einem Spiel, das AMD-Hardware begünstigt. Hoffentlich werden auf der Computex Ende des kommenden Monats aussagekräftigere Daten veröffentlicht.

Schaut euch zuerst mal die Größe des Chips an. Es gab Bedenken, dass der 16-nm-Prozess noch eine Weile brauchen könnte, um ausgereift zu sein, dass es Jahre dauern könnte, bis größere und schwieriger herzustellende Prozessoren auf den Markt kommen. Allerdings ist der GP100 sogar größer als der GM200 - 610 mm² gegen 601 mm². Der Produktionsvorteil des 16-nm-Verfahrens wird auch durch die Zahl von 15,3 Milliarden Transistoren bestätigt - die aktuell modernsten Produkte enthalten 8 Milliarden Transistoren. Vielleicht am überraschendsten ist die Boost-Taktrate, die Höchstgeschwindigkeit des Chips. Sie liegt bei 1.480 MHz, was tatsächlich mehr ist, was man vernünftigerweise von einer Titan X erwarten kann, die bis an ihr absolutes Limit gebracht wird. Und hierbei handelt es sich um ein industrielles Produkt, dessen Taktraten meist eher konservativ im Vergleich zu Konsumenten-orientierten Grafikkarten sind.

Cover image for YouTube video — Rich zeigt Pascals Vorzüge im Tesla-P100-Beschleuniger und wie sie sich auf Grafikkarten für den normalen Konsumenten auswirken könnten.Auf YouTube ansehen

	Tesla M40	Tesla P100
GPU	GM200 Maxwell	GP100 Pascal
SMs	24	56
Basis-Taktrate	948 MHz	1.328 MHz
Boost-Taktrate	1.114 MHz	1.480 MHz
Texture Units	192	224
Arbeitsspeicher-Interface	384-bit GDDR5	4096-bit HBM2
L2-Cache	3.072 KB	4.096 KB
Transistoren	8 Milliarden	15,3 Milliarden
Die-Größe	601 mm²	610 mm²
Herstellungsverfahren	28 nm	16 nmFF
TDP	250 W	300 W

Auf dem Papier ist der Sprung vom GM200 zum GP100 absolut bemerkenswert. Die Rechenleistung steigt üblicherweise zusammen mit der Zahl der Transistoren. Nicht nur macht der 16-nm-Prozess genau das möglich, auch die Gesamtgeschwindigkeit des Prozessors steigt. Weitere Gründe sprechen dafür, dass hier ein großer Leistungssprung zu erwarten ist - viele glaubten, dass die Pascal-Architektur eine kleinere Die-Version von Maxwell wird. Das ist nicht der Fall, außerdem gibt es eine Umstrukturierung der CUDA-Kerne und einen weiteren großen Schub im L2-Cache. Wie sich das auf eine verbesserte Performance überträgt, bleibt natürlich erst mal abzuwarten.

Der Tesla P100 nutzt 16 GB-HBM2 Speicher, der über einen ultra-breiten 4.096-bit Bus angesteuert wird. Eine große Verbesserung gegenüber dem 384-bit GDDR5, der in der Titan X zum Einsatz kommt. Wir erwarten, dass eine Next-Gen-Titan sich ebenfalls an HBM2 hält (für die Konkurrenz von AMD, Codename Vega, ist das bereits bestätigt). Aber die Frage ist, wie viel VRAM in der "kleineren" Version der Karte zur Verfügung stehen wird, die sich an die Gaming-Zielgruppe richtet, also dem Äquivalent zur GTX 980 Ti.

An Nvidias GTC-Ankündigung fasziniert vor allem, wie viel die Firma preisgab. Das geht soweit, dass wir hier anscheinend schon einen extrem verfrühten Blick auf das bekamen, was 2017 die absolute Spitzen-GPU für Verbraucher werden könnte. Es ist unwahrscheinlich, dass wir schon dieses Jahr eine Karte auf Basis des GeForce GP100 bekommen. Was also bekommen wir stattdessen? An diesem Punkt kommen die Gerüchte aus der asiatischen Presse ins Spiel.

Neue Leaks zeigen sogar das Gehäuse des Referenzkühlers von Pascal. In einer Zeit 3D-gedruckter Fälschungen sind solche Bilder natürlich mit Vorsicht zu genießen. Das eigentliche Foto suggeriert aber, dass es direkt am Fließband geschossen wurde.

Die Leaks deuten an, dass Pascal-basierte Gaming-Karten im Juli dieses Jahres erscheinen, nachdem sie auf der Computex in Taipei rund einen Monat davor enthüllt wurden. Von mindestens zwei Karten ist die Rede, die anscheinend GTX 1070 und GTX 1080 heißen und ihre Maxwell-Gegenstücke ersetzen sollen. Die Namen erscheinen eher seltsam, aber ein weiterer Leak, der 1070- und 1080-Gehäuse zeigt, wirkt überzeugend. Das Ding ist: beide dieser Produkte sollen auf einem anderen, kleineren Pascal-Chip basieren, dem GP104.

Nvidia hat bereits bewiesen, dass ihr kleinerer Chip einer neuen Generation den Großen der vorangegangen in Sachen Performance übertreffen kann - genau das ist passiert, als die Geforce 980 die 780 Ti übertraf (die ultmative Version der ersten Titan). Die echte Frage ist aber, wie klein GP104 wirklich ist. Ein weiterer Leak, der den tatsächlichen Chip zeigt, deutet darauf hin, dass er sogar kleiner ist als das GTX-980-Äquivalent, der GM204 - irgendwo zwischen etwa 317mm² und 330mm², gegenüber den 398mm² des alten Chips.

Aber es wird fast sicher die GTX 1070, die die Massenkarte dieses Line-Ups wird. Die Frage ist, wie mutig wird Nvidia damit? Als die 970 erschien, definierte sie den High-End-Markt für GPUs von Neuem. Man konnte sie über die Performance einer Standard-980 hinaus übertakten und sie schlug alles, was AMD zu bieten hatte, ohne Probleme - Produkte, die seinerzeit teilweise Hunderte Euro teurer waren. Der phänomenale Erfolg zeigte, das Risiko hatte sich gelohnt. Teilweise besaßen über fünf Prozent der gesamtem Steam-Nutzerbasis eine 970er. Selbst im März 2015 lag die Zahl noch bei 4,93 Prozent. Angesichts der gewaltigen Bandbreite an alten und neuen GPUs auf dem Markt ist das eine bemerkenswerte Zahl. Wird Nvidia das Gleiche noch einmal versuchen? Könnte eine übertaktete GTX 1070 die GTX 980 Ti genau so übertreffen wie die GTX 970 die 780 Ti damals?

Leaks über Leaks - dieses Bild zeigt angeblich den GP104-Chip, den wir bald in einer Verbraucher-Grafikkarte sehen werden. Die Speicherchips um den Prozessor herum könnten unser erster Blick auf Microns neue GDDR5X-Module sein.

Wir können uns gut vorstellen, dass Nvidia auch dieses Mal so verwegen sein wird. So phänomenal die GTX 970 auch war, AMDs Radeon R9 390 war ein großes Comeback für das rote Team. Abgesehen von Dark Souls 3 liefen alle Spiele in diesem Jahr genau so schnell oder schneller als auf der 970. In Quantum Break und Far Cry Primal zeigten sich besonders hohe Performance-Gewinne. Und dann ist da noch die Frage bezüglich Nvidias DX12-Performance. AMD verzeichnet da hohe Zuwächse, aber Nvidia schlägt sich in Spielen wie Hitman und Ashes of the Singularity nicht gerade überragend.

Es gibt noch so viele Dinge, die der Klärung bedürfen. Zum Beispiel wissen wir, dass der GP100 - der "große Pascal" - für Next-Gen HBM2-Speicher designt wurde. Aber was ist mit den Verbraucherkarten? Titan X und die 980 Ti haben so ziemlich alles aus dem GDDR5 rausgeholt, mit ihrem 384-bit Bus und den 7gbps-Modulen. Hält sich Nvidia an bewährter Technologie oder nimmt es sich Microns neuem GDDR5X mit der höheren Bandbreite an? Die jüngsten Leaks über den GP104 zeigen ihn mit aktuell nicht näher definierbaren Micron-Chips, was nahelegt, dass mindestens eine der Verbraucherkarten mit dem verbesserten RAM erscheint. [UPDATE, 28.04.15, 11:33 Uhr: Sieht so aus, als handele es sich bei den Micron-Chips tatsächlich um GDDR5X].

Die Zeit wird es zeigen. Aber angenommen, die Gerüchte und Leaks über eine Enthüllung auf der Computex und einer Veröffentlichung im Juli stimmen, müssen wir wohl nicht mehr so lange warten. Und wir werden natürlich mit Tests aller Pascal-Produkte bei der Hand sein, die wir bekommen können. Mit überarbeiteten Benchmarks samt neuer Titel in DirectX 11 und 12.

Schon gelesen?