NVIDIA GeForce RTX 2080 Ti: Die GPU-Architektur im Überblick

Caseking17. Sept, 2018 - 2 min Lesezeit

Die Recheneinheiten der GeForce RTX 2080 Ti

Auf Benchmarks für die neuen NVIDIA GeForce RTX 2080 Ti und NVIDIA GeForce RTX 2080 Gaming-Grafikkarten muss noch gewartet werden. Allerdings sind inzwischen Informationen zur Turing-GPU-Architektur für NVIDIAs neue Grafikkarten veröffentlicht worden.

Bevor wir auf den Aufbau des TU102-300-Grafikchips der NVIDIA GeForce RTX 2080 Ti eingehen, vergleichen wir die RTX-2080-Ti-GPU mit dem Vollausbau: dem TU102-Grafikchip. In der folgenden Tabelle stellen wir die Anzahl der verschiedenen Recheneinheiten gegenüber.

Neben den Rechenkernen ist der Grafikchip der RTX 2080 Ti auch bei den Speicher-Controllern “beschnitten” und kann auf elf 32-bit-GDDR6-Steuereinheiten zurückgreifen. Der TU102-Vollausbau kann mit 12 RAM-Controllern aufwarten.

  TU102 Grafikchip RTX 2080 Ti
CUDAs 4.608 4.352
SMs 72 68
RT-Kerne 72 68
Tensor-Cores 576 544
TMUs 288 272
ROPs 96 88

TU102-300: der Grafikchip der GeForce RTX 2080 Ti

Turing-GPU: Block-Diagramm
Der Aufbau des Grafikchips der GeForce RTX 2080 Ti sieht wie folgt aus: Die TU102-GPU besteht aus sechs Graphics Processing Clusters (GPCs). Jeder GPC besteht wiederum aus sechs TPCs (Texture / Processor Cluster), die jeweils zwei SMs (Streaming Multiprocessors) beinhalten. Jeder der sechs GPCs hat demnach jeweils 12 SMs.

Der TU102-Grafikchip verfügt demnach über 72 SM. Von diesen 72 Streaming Multiprocessors sind auf der GeForce RTX 2080 Ti jedoch vier deaktiviert.

SM-Block-Diagramm
Jeder der aktivierten 68 SMs ist in vier Blöcke unterteilt, die jeweils 16 FP32-FPUs (Floating Point Units / CUDA, die Rechenkerne), 16 INT32-Einheiten und zwei Tensor-Rechenkerne beinhalten. Jeder der 68 SMs ist zudem per L1-Cache an einen Raytracing-Rechenkern angebunden und verfügt über zwei FP64-FPUs.

Bei Pascal kamen größere SMs zum Einsatz, dafür aber weniger. Durch den Umstieg auf mehrere kleinere SMs können Ressourcen besser genutzt werden und je nach Auslastung können Multiprozessoren ausgeschaltet werden. Sollte einer der SM zeitweise deaktiviert werden, kann der aktive SM teilweise auf den L1-Cache des Deaktivierten zugreifen.

Die zusätzlichen Tensor- und RT-Kerne übernehmen spezialisierte Aufgaben, die bei der Vorgänger-Generation von den CUDA-Kernen berechnet werden. Dank der neuen Recheneinheiten werden somit die CUDA-Einheiten weiter entlastet.

Gamers Nexus hat ein sehr detailliertes Video zur NVIDIA GeForce RTX 2080 Ti und der dazugehörigen GPU-Architektur veröffentlicht:


Raytracing- und Tensor-Kerne

Die Raytracing-Kerne sind für das Ray-Tracing, also eine realistische Beleuchtung durch die Berechnung der physikalischen Eigenschaften und das Simulieren des Verhaltens des Lichts, zuständig. Dank Raytracing sind besonders spektakuläre Licht- und Schatteneffekte möglich und die Berechnung dieser Effekte erfolgt in Echtzeit.

Bei den Tensor-Kernen handelt es sich um Rechenkerne, die auf Deep Learning spezialisiert sind. Diese besonderen Rechenkerne sollen eine besondere Form der Kantenglättung ermöglichen: DLSS. Der Clou von DLSS ist der geringe Rechenaufwand durch die Tensor-Kerne, wodurch die CUDA-Kerne entlastet werden. Sowohl bei DLSS als auch Raytracing muss das entsprechende Spiel diese Technologien unterstützen.

Weitere Informationen zur NVIDIA GeForce RTX 2080 Ti können auf der Kategorieseite gefunden werden.

0 0 vote
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments

Related Posts