Skip to main content

PlayStation 5: Der Grafikkern der PS5 und wie die SSD dabei hilft, den Next-Gen-Traum zu realisieren

Eine schnelle Angelegenheit.

Das hier ist ein Teil der aktuellen Digital-Foundry-Berichterstattung über die PlayStation 5. Den Rest findet ihr hier:


Der Grafikkern der PS5

Auf den ersten Blick liefert PlayStation 5 eine Menge Leistung, aber es scheint eine zusätzliche Aufgabe für Entwickler zu sein, diese neuen Eigenschaften zu optimieren. Die Frage ist, was passiert, wenn der Prozessor seine Leistungsgrenze erreicht und die Taktrate der Komponenten reduziert wird? In seiner Präsentation gibt Mark Cerny frei zu, dass CPU und GPU nicht immer mit 3,5 GHz bzw. 2,23 GHz laufen.

"Wenn dieses Worst-Case-Spiel eintrifft, läuft es mit einer niedrigeren Taktrate. Aber nicht zu viel niedriger. Um die Leistung um 10 Prozent zu reduzieren, ist nur eine Frequenzreduzierung von ein paar Prozent erforderlich, sodass ich ein eher ein kaum spürbares Downclocking erwarten würde", erklärt er. "Alles in allem wird die Umstellung auf einen Ansatz mit variabler Frequenz für PlayStation-Spieler erhebliche Vorteile bringen."

Auf der Feature-Ebene enthüllt Cerny Funktionen, die auf eine Parität mit anderen kommenden AMD- und AMD-abgeleiteten Produkten hinweisen, die auf der RDNA-2-Technologie basieren. Ein neuer Block, der als Geometry Engine bekannt ist, bietet Entwicklern eine beispiellose Kontrolle über Dreiecke und andere Grundelemente sowie eine einfache Optimierung für das Geometry Culling. Die Funktionalität erstreckt sich bis hin zur Erstellung von "primitiven Shadern", die den Mesh-Shadern in Nvidia Turing und den kommenden RDNA-2-GPUs sehr ähnlich klingen.

Während Cerny Technologien wie Unterstützung für maschinelles Lernen oder Shading mit variabler Rate nicht erwähnt, liefert die PS5 tatsächlich hardwarebeschleunigtes Raytracing über seine Intersection Engine, die laut Cerny "auf der gleichen Strategie wie die kommenden PC-GPUs von AMD basiert". Es gab Spekulationen über einen externen Block, aber das ist nicht der Fall - wie bei Next-Gen-Navi und der Xbox Series X ist die RT-Hardware in die Shader eingebaut und somit vollständig integriert. Ähnlich wie bei der RDNA-Implementierung kann die PS5 auf die gleichen RT-Implementierungen zugreifen, die wir im PC-Bereich gesehen haben - Reflexionen, Ambient Occlusion, Schatten und Global Illumination passen gut zusammen.

"Wie weit können wir gehen? Ich fange an, ziemlich optimistisch zu werden", sagt Cerny. "Ich habe bereits einen PS5-Titel gesehen, der Raytracing-basierte Reflexionen in komplexen animierten Szenen mit nur geringen Kosten erfolgreich einsetzt."

Seht hier die gesamte Präsentation von Mark Cerny.Auf YouTube ansehen

Wie die SSD dabei hilft, den Next-Gen-Traum zu realisieren

Die Art des SoC und seiner Funktionen ist wichtig - und so vieles davon sind neue Informationen und wichtige Informationen, basierend auf dem Feedback unserer Leser. Aus der Präsentation geht jedoch hervor, dass Mark Cerny sehr unterschiedliche Prioritäten hat - und es gibt den Traum von der nächsten Generation, der berücksichtigt werden muss. Hier spielen zwei sehr spezifische Komponenten eine Rolle: die SSD und eine bemerkenswerte 3D-Audio-Hardware, die als Tempest-Engine bezeichnet wird.

Sony legt großen Wert auf Solid-State-Speicher, um ein wirklich transformatives Erlebnis der nächsten Generation zu bieten. Alle paar Jahre reist Mark Cerny um die Welt, trifft Dutzende von Entwicklern und Publishern und die Integration einer SSD war der größte Wunsch für die nächste Generation. Die eigentliche Implementierung von Sony ist etwas anderes: Die Leistung ist zwei Größenordnungen schneller als bei der PlayStation 4. 2 GB Daten können in einer Viertelsekunde geladen werden, was bedeutet, dass theoretisch die gesamten 16 GB der PS5 in nur zwei Sekunden gefüllt werden können. "Als Entwickler von Spielen versuchen wir nicht mehr, den Spieler davon abzulenken, wie lange das Reisen dauert - wie bei diesen Spider-Man-U-Bahn-Fahrten -, sondern sind so blendend schnell, dass wir diesen Übergang möglicherweise sogar verlangsamen müssen", sagt Cerny.

Um solch einen Sprung in Sachen Performance hinzulegen, musste eine Menge spezieller Hardware her, um die SSD praktisch nahtlos mit dem Prozessor zu verbinden. Ein eigener Flash verbindet die SSD-Module mit einem 12-Kanal-Interface, das die nötigen 5,5GB/s bereitstellt, bei einer maximalen Speicherkapazität von 825GB. Das mag nach einer seltsamen Größe für die SSD klingen, bedenkt man die Consumer-SSD-Größen von 512GB, 1TB oder mehr, aber Sonys proprietäre 825GB sind die optimale Größe für das 12-Kanal-Interface und bieten auch weitere Vorteile. Kurz gesagt, sichert sich Sony damit die Freiheit, das Design anzupassen: "Wir können uns die verfügbaren NAND-Flash-Bauteile angucken und etwas mit der optimalen Preis-Leistung bauen. Jemand, der ein M.2-Laufwerk nutzt, hat diese Freiheit wahrscheinlich nicht und es wäre schwierig zu vermarkten, wenn es nicht eine dieser Standardgrößen hat", sagt Mark Cerny.

Der Controller selbst ist mit dem Hauptprozessor über einen Vier Wege PCI-Express 4.0 verbunden und bringt eine Reihe der genannten Hardware-Einheiten mit, um die Flaschenhälse der SSD zu eliminieren. Das System bietet sechs Level für Priorisierungen, sodass die Entwickler die verschiedenen Datenflüsse, so wie das Spiel sie braucht, priorisieren können.

Der Controller unterstützt Hardware-Dekomprimierung für den Industrie-Standard ZLIB, aber auch das neue Kraken-Format der RAD Game Tools, das noch mal 10 Prozent mehr Effizienz bei Komprimierungen bietet. Was heißt das alles? 5,5GB/s an Bandbreite bedeuten effektiv, dass acht oder neun Gigabyte pro Sekunde dem System zugeführt werden können. "Nur am Rande, in reine Leistung umgerechnet, bedeutet es, dass die eigene Dekompression das Neun- bis Zehnfache der Zen-2-Kerne leistet, so viel bräuchte man, um den Kraken-Stream auf einer normalen CPU zu dekomprimieren", sagt Cerny.

Ein dedizierter DMA-Controller (äquivalent zu ein bis zwei Zen-2-Kernen in Sachen Leistung) leitet die Daten dorthin, wo sie gebraucht werden, während zwei dedizierte Custom-Prozessoren I/O und Speicher-Mapping handhaben. Dazu kommen noch eigene Kohärenz-Engines, die ein wenig aufräumen, wenn es nötig ist.

"Kohärenz taucht an vielen Orten auf, wobei das größte Problem abgelaufene Daten im Cache der GPU sein dürften", erklärt Cerny. "Den ganzen GPU-Cache zu löschen, wann immer die SSD liest, ist keine attraktive Option, weil es die GPU-Performance deutlich senken könnte. Also haben wir einen besseren Weg dafür gefunden, bei dem die Kohärenz-Engines die GPU über die überschriebenen Adress-Bereiche informiert und spezielle Scrubber in mehreren Dutzend GPU-Caches haben dann die Aufgabe, exakt diese Adressbereiche wieder freizugeben.

All das wird den Entwicklern an die Hand gegeben, ohne dass sie etwas dafür tun müssen. Selbst um die Dekompression kümmert sich die spezielle Hardware. "Man sagt einfach nur, welche Daten vom eigenen, nicht komprimierten File gelesen werden sollen und wo diese Daten hin sollen. Der eigentliche Prozess des Ladens passiert dann für einen selbst unsichtbar und sehr schnell", erläutert Cerny.

Schon gelesen?