GeForce RTX 3070

NVIDIA GeForce RTX 3070
LHR: Low Hash Rate als Anti-Mining-Maßnahme
Als Reaktion auf den Boom der Krypto-Währungen und den Einfluss auf die Verfügbarkeit für Gamer, hat NVIDIA seine Gaming-Grafikkarten mit einer Drosselung versehen, die das Mining von Krypto-Währungen begrenzt. Die Leistung im Normalbetrieb und besonders beim Gaming wird dadurch nicht beeinträchtigt. Für den Betrieb wird eine aktuelle Version des NVIDIA-Treibers benötigt.Entsprechende Grafikkarten-Modelle, die im Nachhinein mit einer Mining-Sperre versehen wurden, sind je nach Serie und Modell mit einem Zusatz im Namen wie "V2" oder "LHR" versehen. Einige Grafikkarten-Serien sind bereits seit der Einführung mit einer Mining-Sperre versehen und verzichten entsprechend auf den Namenszusatz.
Die NVIDIA GeForce RTX 3070 Gaming-Grafikkarte basiert auf dem GA104-Chip. Der am 29.10.2020 vorgestellten Grafikkarte verleihen die Ampere-Architektur und ein 8-nm-Herstellungsverfahren zu einer FP32-Performance von über 20 TFLOPS. Mit 17,4 Milliarden Transistoren auf einer Fläche 393 mm² liefert die RTX 3070 einer Leistung, welche die der RTX 2080 Ti - dem Flaggschiff der Turing-Generation - in einigen Anwendungen und Spielen übertrifft. Neben den überarbeiteten SMs (Streaming Multiprocessors) mit doppeltem FP32-Durchsatz beinhaltet Ampere Raytracing-Kerne der 2. Generation mit doppeltem Datendurchsatz sowie Tensor-Kerne der 3. Generation mit bis zu doppeltem Datendurchsatz. Zu diesen Optimierungen an der Architektur kommen zahlreiche weitere Features wie unter anderem DLSS KI-Beschleunigung, NVIDIA Reflex, NVIDIA Broadcast und NVIDIA Omniverse Machinima.
Leistungsdaten der NVIDIA GeForce RTX 3070 Grafikkarte (Referenzmodell):

- Rechenleistung (FP32): ca. 20,3 TFLOPS
- CUDA-Cores (Shader): 5.888
- RT-Kerne: 46
- Tensor-Cores: 184
- Basistakt der GPU: 1.500 MHz
- Boost-Takt der GPU: 1.725 MHz
- Grafikspeicher: 8 GB GDDR6X
- Speichertakt: 7.000 MHz (effektiv 14.000 MHz)
- Speicherinterface: 256 Bit
- Speicherbandbreite: 448 GB/s
- TDP: 220 Watt
- Stromanschluss: 1x 12-Pin-Micro-PCIe
- Videoausgänge: DP 1.4a, HDMI 2.1

GeForce RTX 3070: Die Ampere-GPU-Architektur
Die Ampere-GPU-Architektur bietet einige Optimierungen gegenüber Turing. Die Anzahl der CUDA-Kerne pro SM (Streaming Multiprocessors) hat sich quasi verdoppelt. Ein Ampere-SM kann je nach Workload entweder 128 FP32- oder 64 FP32- und 64 INT32-Berechnungen durchführen. Bei Turing waren es 64 FP32- und 64 INT32-Berechnungen. Jeder SM besteht somit aus vier Blöcken mit je 16 FP32-ALUs sowie FP32/INT32-ALUs. Wie bei Turing besitzt jeder SM einen Raytracing-Rechenkern.Bei 46 SMs ergeben sich für die RTX 3070 dadurch 5.888 CUDS-Cores (je 2.944 FP32- und FP32/INT32-ALUs) sowie 46 Raytracing-Kerne. Die 46 SMs sind bei der RTX 3070 in 6 GPCs (Graphics Processing Clusters) aufgeteilt, wobei 2 SMs auf dem Chip deaktiviert sind. Jeder der aktivierten SMs stellt 4 Tensorkerne bereit - halb so viele wie bei Turing. Allerdings sind die Tensor-Kerne auf den Ampere-GPUs wesentlich Leistungsstärker als noch auf Turing.
Raytracing
Ray Tracing kombiniert all diese Effekte, um die finale Farbe eines Pixels auf dem Monitor darzustellen. Bisher wurde Ray Tracing vor allem bei Filmen genutzt, um Spezialeffekte zu erzeugen. Für diese Szenen werden häufig Renderfarmen genutzt und das berechnen komplexer 3D-Animationen und Spezialeffekte für Kinofilme kann mehrere Wochen in Anspruch nehmen. Aufgrund der Komplexität von Ray Tracing wurden PC-Anwendungen wie Computerspiele in der Regel mit 3D-Objekten gefüllt, die auf einem Raster-Modell aufbauen. Bei der Rasterung (engl.: Rasterization) werden 3D-Objekte aus einem Netzwerk von Dreiecken oder Polygonen modelliert. In der Rendering-Pipeline werden diese Dreiecke des 3D-Modell einzeln in Pixel auf einer 2D-Bildfläche umgewandelt. Anschließend können die Pixel weiterverarbeitet ("shaded") werden.
Tensor & DLSS
Diese auf einer Matrix basierenden Rechenkerne sind mit besonderen Datenpfaden für einen optimierten Gleitkomma-Berechnungsdurchsatz ausgestattet und bieten zudem eine gesteigerte Energieeffizienz. Vor allem das "Training" und die "Inferenz" als Bestandteile des Deep Learnings profitieren von den Tensor-Kernen. Das Training, also das Lernen neuer Fähigkeiten anhand vorhandener Daten, soll mit Hilfe der Tensor-Rechenkernen mit einer bis zu 12 Mal höheren TFLOP-Leistung erfolgen als noch mit Pascal, dem Vorgänger der Volta-GPU-Architektur. Die Inferenz beim Deep Learning ist das Anwenden der beim Training gelernten Fähigkeiten und soll bei Volta gegenüber Pascal mit einer bis zu 6 Mal höheren TFLOP-Spitzenleistung erfolgen.
Die aktuellen NVIDIA GeForce RTX 30 Grafikkarten in der Übersicht:
Du willst wissen, welche NVIDIA-Grafikkarte die richtige für dich ist? Die folgende Liste enthält alle aktuellen Modelle der Ampere-Generation, sortiert nach Leistung und beginnend mit der stärksten Grafikkarte.