Filter

GeForce RTX 3090

0 Ergebnisse
404 image

Ist das denn möglich?

Leider haben wir dazu nichts gefunden.

NVIDIA GeForce RTX 3090

Die NVIDIA GeForce RTX 3090 Enthusiast-Grafikkarte für Content-Creation wurde am 01.09.2020 zum ersten Mal präsentiert. Dank der neuen Ampere-Architektur und dem 8-nm-Herstellungsverfahren können auf dem 623 mm² kleinen GA102-Chip stolze 28 Milliarden Transistoren untergebracht werden. Neben den überarbeiteten SMs (Streaming Multiprocessors) mit doppeltem FP32-Durchsatz beinhaltet Ampere Raytracing-Kerne der 2. Generation mit doppeltem Datendurchsatz sowie Tensor-Kerne der 3. Generation mit bis zu doppeltem Datendurchsatz. Zu diesen Optimierungen an der Architektur kommen zahlreiche weitere Features wie unter anderem DLSS KI-Beschleunigung, NVIDIA Reflex, NVIDIA Broadcast und NVIDIA Omniverse Machinima.


Leistungsdaten der NVIDIA GeForce RTX 3090 Grafikkarte (Referenzmodell):



Ampere-GPU
  • Rechenleistung (FP32): ca. 36 TFLOPS
  • CUDA-Cores (Shader): 10.496
  • RT-Kerne: 82
  • Tensor-Cores: 328
  • Basistakt der GPU: 1.400 MHz
  • Boost-Takt der GPU: 1.700 MHz
  • Grafikspeicher: 24 GB GDDR6X
  • Speichertakt: 9.750 MHz (effektiv 19.500 MHz)
  • Speicherinterface: 384 Bit
  • Speicherbandbreite: 936 GB/s
  • TDP: 350 Watt
  • Stromanschluss: 1x 12-Pin-Micro-PCIe
  • Videoausgänge: DP 1.4a, HDMI 2.1

Ampere SM

GeForce RTX 3090: Die Ampere-GPU-Architektur

Die Ampere-GPU-Architektur bietet einige Optimierungen gegenüber Turing. Die Anzahl der CUDA-Kerne pro SM (Streaming Multiprocessors) hat sich quasi verdoppelt. Ein Ampere-SM kann je nach Workload entweder 128 FP32- oder 64 FP32- und 64 INT32-Berechnungen durchführen. Bei Turing waren es 64 FP32- und 64 INT32-Berechnungen. Jeder SM besteht somit aus vier Blöcken mit je 16 FP32-ALUs sowie FP32/INT32-ALUs. Wie bei Turing besitzt jeder SM einen Raytracing-Rechenkern.

Bei 82 SMs ergeben sich für die RTX 3090 dadurch 10.496 CUDS-Cores (je 5.248 FP32- und FP32/INT32-ALUs) sowie 82 Raytracing-Kerne. Die 82 SMs sind bei der RTX 3090 in 7 GPCs (Graphics Processing Clusters) aufgeteilt und jeder SM verfügt über 4 Tensorkerne - halb so viele wie bei Turing. Allerdings sind die Tensor-Kerne auf den Ampere-GPUs wesentlich Leistungsstärker als noch auf Turing.

Raytracing

Raytracing ermöglicht realistische Beleuchtung durch die Simulation von physikalischen Eigenschaften und das Verhalten des Lichts. RT ist die Berechnung der Farbe einzelner Pixel während des Weges, den das Licht vom Auge des Benutzers durch eine 3D-Landschaft nimmt. Das Licht durchquert die 3D-Szenerie und wird von Objekten reflektiert oder erzeugt Reflektionen. Gleichzeitig werden Schatten, transparente oder halb-transparente Objekte erzeugt. Dadurch entstehen Lichtbrechungen oder Verzerrungen.

Ray Tracing kombiniert all diese Effekte, um die finale Farbe eines Pixels auf dem Monitor darzustellen. Bisher wurde Ray Tracing vor allem bei Filmen genutzt, um Spezialeffekte zu erzeugen. Für diese Szenen werden häufig Renderfarmen genutzt und das berechnen komplexer 3D-Animationen und Spezialeffekte für Kinofilme kann mehrere Wochen in Anspruch nehmen. Aufgrund der Komplexität von Ray Tracing wurden PC-Anwendungen wie Computerspiele in der Regel mit 3D-Objekten gefüllt, die auf einem Raster-Modell aufbauen. Bei der Rasterung (engl.: Rasterization) werden 3D-Objekte aus einem Netzwerk von Dreiecken oder Polygonen modelliert. In der Rendering-Pipeline werden diese Dreiecke des 3D-Modell einzeln in Pixel auf einer 2D-Bildfläche umgewandelt. Anschließend können die Pixel weiterverarbeitet ("shaded") werden.


Tensor & DLSS

In den Ampere-GPUs kommen insgesamt weniger Tensorkerne zum Einsatz, als noch bei Turing. Da die Tensor-Kerne der 3. Generation jedoch eine viermal so hohe Leistung gegenüber der 2. Generation aufweisen, kann Ampere mit der Hälfte an Tensorkernen eine fast doppelt so hohe Leistung erreichen wie noch die Turing-Grafikkarten. Tensor-Kerne sind speziell für das Deep Learning entwickelte Rechenkerne, die für KI-basiertes DLSS verwendet werden.

Diese auf einer Matrix basierenden Rechenkerne sind mit besonderen Datenpfaden für einen optimierten Gleitkomma-Berechnungsdurchsatz ausgestattet und bieten zudem eine gesteigerte Energieeffizienz. Vor allem das "Training" und die "Inferenz" als Bestandteile des Deep Learnings profitieren von den Tensor-Kernen. Das Training, also das Lernen neuer Fähigkeiten anhand vorhandener Daten, soll mit Hilfe der Tensor-Rechenkernen mit einer bis zu 12 Mal höheren TFLOP-Leistung erfolgen als noch mit Pascal, dem Vorgänger der Volta-GPU-Architektur. Die Inferenz beim Deep Learning ist das Anwenden der beim Training gelernten Fähigkeiten und soll bei Volta gegenüber Pascal mit einer bis zu 6 Mal höheren TFLOP-Spitzenleistung erfolgen.


Die aktuellen NVIDIA GeForce RTX 30 Grafikkarten in der Übersicht:

Du willst wissen, welche NVIDIA-Grafikkarte die richtige für dich ist? Die folgende Liste enthält alle aktuellen Modelle der Ampere-Generation, sortiert nach Leistung und beginnend mit der stärksten Grafikkarte.