Vera Rubin: NVIDIAs Chip-Revolution senkt KI-Kosten um Zehnerpotenz

NVIDIA bringt die Vera-Rubin-Architektur in Serie. Die neue Plattform verspricht zehnfach günstigere KI-Berechnungen und treibt den Speichermarkt an.

Der Chip-Gigant startet die Produktion seiner neuen KI-Plattform – und verspricht eine Zehnerpotenz mehr Effizienz.

NVIDIA hat seine mit Spannung erwartete Vera-Rubin-Architektur in die Massenproduktion überführt. Seit dem 1. Juni 2026 laufen die Bänder, erste Auslieferungen an Kunden sind für den Herbst geplant. Die Plattform löst die aktuelle Blackwell-Generation ab und zielt darauf ab, die Kosten für Künstliche Intelligenz drastisch zu senken.

Technische Daten: Ein Sprung nach vorn

Die neue Architektur setzt auf TSMCs 3-Nanometer-Fertigung und bringt es auf 336 Milliarden Transistoren. Der wohl wichtigste Wert: Die Kosten für sogenannte Inference-Token – also die Berechnung von KI-Antworten – sollen sich im Vergleich zum Vorgänger verzehnfachen. Jeder Rubin-GPU liefert 50 Petaflops Rechenleistung und 22 Terabyte pro Sekunde Bandbreite, etwa das Dreifache der aktuellen Blackwell-Systeme.

Erstmals kommt mit der Plattform auch der HBM4-Speicherstandard in Rechenzentren zum Einsatz. Das ist ein entscheidender Faktor: Die Speicherbausteine machen mehr als ein Viertel der Materialkosten eines voll bestückten Racks aus – das rund 7,8 Millionen Euro kostet.

Rack-Maßstab und Stromversorgung

Das Herzstück der neuen Generation ist die NVL72-Konfiguration. Sie vereint 72 Rubin-GPUs mit 36 Vera-CPUs in einem Rack und erreicht über NVLink 6 eine interne Bandbreite von 260 Terabyte pro Sekunde. Hinzu kommen BlueField-4-Datenprozessoren und Spectrum-X-Ethernet-Netzwerktechnik.

Die enorme Leistung bringt gewaltige Anforderungen an die Stromversorgung mit sich. NVIDIA bietet daher ein 800-Volt-Hochspannungs-Gleichstrom-Rack an. Erste Auslieferungen dieser Option sind für das dritte Quartal 2026 geplant. Analysten rechnen jedoch damit, dass die breite Einführung erst mit dem Nachfolger Rubin Ultra in der zweiten Jahreshälfte 2027 richtig Fahrt aufnimmt – und 2028 dann zum Standard wird.

Anzeige

Während Hardware-Innovationen wie die Vera-Rubin-Architektur die KI-Leistung massiv steigern, stellen neue Gesetze wie der EU AI Act Unternehmen vor komplexe regulatorische Aufgaben. Dieser kostenlose Report klärt auf, welche KI-Systeme als Hochrisiko gelten und was Verantwortliche jetzt konkret tun müssen. Kostenlosen Umsetzungsleitfaden zum EU AI Act sichern

Wer setzt auf Vera Rubin?

Acht große Cloud-Anbieter stehen für den Start bereit: Amazon Web Services, Google Cloud, Microsoft Azure, Oracle sowie die Spezialisten CoreWeave, Lambda, Nebius und Nscale. Auch die Forschung setzt auf die neue Technologie: Das Leibniz-Rechenzentrum in Garching, das Los-Alamos-Nationallabor und das NERSC in den USA planen Supercomputer auf Rubin-Basis.

Die Hardware-Partner haben ihre Roadmaps entsprechend angepasst:

  • Supermicro präsentierte auf der ISC 2026 (22. Juni) Pläne für flüssigkeitsgekühlte Racks mit bis zu 1.152 Rubin-GPUs.
  • HPE kündigte auf einer Veranstaltung in Las Vegas (18. Juni) den ProLiant DL394 Gen12-Server mit Vera-CPU für 2027 an.
  • Dell bringt den PowerEdge XE8812, der die Vera-Rubin-NVL4-Architektur mit bis zu 144 GPUs pro Rack beherbergt.

Speichermarkt im Umbruch

Der Wechsel zu Rubin treibt den Speichermarkt massiv voran. Samsung startet die HBM4-Produktion im Juli 2026, nachdem die Qualifikationstests bestanden wurden. Micron meldet bereits die erste Milliarde Dollar Umsatz mit HBM4 – und betont, dass der Hochlauf deutlich schneller läuft als bei früheren Generationen. Branchenprognosen zufolge werden 2027 mehr als die Hälfte aller DRAM-Bits für KI und Rechenzentren produziert.

Anzeige

Der rasante technologische Fortschritt durch neue KI-Plattformen erfordert von Unternehmen auch eine Anpassung ihrer Compliance-Strategien an die aktuelle EU-KI-Verordnung. Erhalten Sie mit diesem Gratis-Download einen kompakten Überblick über alle relevanten Fristen, Pflichten und Risikoklassen für Ihre IT-Abteilung. EU AI Act in 5 Schritten verstehen – Gratis-E-Book

Finanzielle Dimension

Die Vera-CPU dürfte sich als echter Umsatzbringer erweisen. Analysten erwarten für 2026 Erlöse von knapp 20 Milliarden Euro allein mit diesem chip. Das Gesamtbild ist noch imposanter: Nach 215,9 Milliarden Euro Umsatz im Geschäftsjahr 2026 prognostizieren Experten für 2027 bereits 391 Milliarden Euro – das erste volle Jahr mit Vera Rubin an Bord.