GeForce RTX 3060 Ti

NVIDIA GeForce RTX 3060 Ti
LHR: Low Hash Rate als Anti-Mining-Maßnahme
Als Reaktion auf den Boom der Krypto-Währungen und den Einfluss auf die Verfügbarkeit für Gamer, hat NVIDIA seine Gaming-Grafikkarten mit einer Drosselung versehen, die das Mining von Krypto-Währungen begrenzt. Die Leistung im Normalbetrieb und besonders beim Gaming wird dadurch nicht beeinträchtigt. Für den Betrieb wird eine aktuelle Version des NVIDIA-Treibers benötigt.Entsprechende Grafikkarten-Modelle, die im Nachhinein mit einer Mining-Sperre versehen wurden, sind je nach Serie und Modell mit einem Zusatz im Namen wie "V2" oder "LHR" versehen. Einige Grafikkarten-Serien sind bereits seit der Einführung mit einer Mining-Sperre versehen und verzichten entsprechend auf den Namenszusatz.
Die GeForce RTX 3060 Ti wurde am 2.12.2020 released und basiert auf dem GA104-Grafickchip. Auf einer Fläche von nur 395,2 mm² bringt NVIDIA 17,4 Milliarden Transistoren unter. Neben der Ampere-GPU-Architektur zeichnet sich hierfür der 8-nm-Prozess, in dem die Chips hergestellt werden. Ampere beinhaltet Raytracing-Kerne der 2. Generation, Tensor-Kerne der 3. Generation und überarbeitete SMs (Streaming Multiprocessors). Bei allen drei Recheneinheiten konnte der Datendurchsatz im Vergleich zur Turing-Architektur nahezu verdoppelt werden. Zu diesen Optimierungen an der Architektur kommen zahlreiche weitere Features wie unter anderem DLSS KI-Beschleunigung, NVIDIA Reflex, NVIDIA Broadcast und NVIDIA Omniverse Machinima.
Leistungsdaten der NVIDIA GeForce RTX 3060 Ti Grafikkarte (Referenzmodell):

- Rechenleistung (FP32): ca. 16,2 TFLOPS
- CUDA-Cores (Shader): 4.864
- RT-Kerne: 38
- Tensor-Cores: 152
- Basistakt der GPU: 1.410 MHz
- Boost-Takt der GPU: 1.665 MHz
- Grafikspeicher: 8 GB GDDR6X
- Speichertakt: 7.000 MHz (effektiv 14.000 MHz)
- Speicherinterface: 256 Bit
- Speicherbandbreite: 448 GB/s
- TDP: 180 Watt
- Stromanschluss: 1x 12-Pin-Micro-PCIe
- Videoausgänge: DP 1.4a, HDMI 2.1

GeForce RTX 3060 Ti: Die Ampere-GPU-Architektur
Die Ampere-GPU-Architektur bietet einige Optimierungen gegenüber Turing. Die Anzahl der CUDA-Kerne pro SM (Streaming Multiprocessors) hat sich quasi verdoppelt. Ein Ampere-SM kann je nach Workload entweder 128 FP32- oder 64 FP32- und 64 INT32-Berechnungen durchführen. Bei Turing waren es 64 FP32- und 64 INT32-Berechnungen. Jeder SM besteht somit aus vier Blöcken mit je 16 FP32-ALUs sowie FP32/INT32-ALUs. Wie bei Turing besitzt jeder SM einen Raytracing-Rechenkern.Bei 38 SMs ergeben sich für die RTX 3060 Ti dadurch 4.684 CUDS-Cores (je 2.432 FP32- und FP32/INT32-ALUs) sowie 38 Raytracing-Kerne. Die 38 SMs sind bei der RTX 3060 Ti in 5 GPCs (Graphics Processing Clusters) aufgeteilt und jeder SM verfügt über 4 Tensorkerne - halb so viele wie bei Turing. Allerdings sind die Tensor-Kerne auf den Ampere-GPUs wesentlich Leistungsstärker als noch auf Turing.
Raytracing
Ray Tracing kombiniert all diese Effekte, um die finale Farbe eines Pixels auf dem Monitor darzustellen. Bisher wurde Ray Tracing vor allem bei Filmen genutzt, um Spezialeffekte zu erzeugen. Für diese Szenen werden häufig Renderfarmen genutzt und das berechnen komplexer 3D-Animationen und Spezialeffekte für Kinofilme kann mehrere Wochen in Anspruch nehmen. Aufgrund der Komplexität von Ray Tracing wurden PC-Anwendungen wie Computerspiele in der Regel mit 3D-Objekten gefüllt, die auf einem Raster-Modell aufbauen. Bei der Rasterung (engl.: Rasterization) werden 3D-Objekte aus einem Netzwerk von Dreiecken oder Polygonen modelliert. In der Rendering-Pipeline werden diese Dreiecke des 3D-Modell einzeln in Pixel auf einer 2D-Bildfläche umgewandelt. Anschließend können die Pixel weiterverarbeitet ("shaded") werden.
Tensor & DLSS
Diese auf einer Matrix basierenden Rechenkerne sind mit besonderen Datenpfaden für einen optimierten Gleitkomma-Berechnungsdurchsatz ausgestattet und bieten zudem eine gesteigerte Energieeffizienz. Vor allem das "Training" und die "Inferenz" als Bestandteile des Deep Learnings profitieren von den Tensor-Kernen. Das Training, also das Lernen neuer Fähigkeiten anhand vorhandener Daten, soll mit Hilfe der Tensor-Rechenkernen mit einer bis zu 12 Mal höheren TFLOP-Leistung erfolgen als noch mit Pascal, dem Vorgänger der Volta-GPU-Architektur. Die Inferenz beim Deep Learning ist das Anwenden der beim Training gelernten Fähigkeiten und soll bei Volta gegenüber Pascal mit einer bis zu 6 Mal höheren TFLOP-Spitzenleistung erfolgen.
Die aktuellen NVIDIA GeForce RTX 30 Grafikkarten in der Übersicht:
Du willst wissen, welche NVIDIA-Grafikkarte die richtige für dich ist? Die folgende Liste enthält alle aktuellen Modelle der Ampere-Generation, sortiert nach Leistung und beginnend mit der stärksten Grafikkarte.