Vera-Rubin-Plattform: Nvidia senkt KI-Kosten auf ein Siebtel

Nvidia bereitet die Fertigung der neuen KI-Plattform Vera-Rubin vor und treibt die Kosten für Endverbraucher in die Höhe.

Der Nvidia-Chef sichert in Taiwan die Produktion der nächsten KI-Generation – und treibt die Kosten für Endverbraucher in die Höhe.

Jensen Huang ist am 23. Mai in Taiwan eingetroffen, um mit den wichtigsten Partnern die Fertigung der neuen Vera-Rubin-Plattform vorzubereiten. Der Besuch fällt mit der Veröffentlichung der Quartalszahlen zusammen: Nvidia erzielte im ersten Fiskalquartal 2027 einen Umsatz von umgerechnet rund 75 Milliarden Euro – ein Plus von 85 Prozent im Vergleich zum Vorjahr. Allein das Rechenzentrumsgeschäft trug mit knapp 70 Milliarden Euro dazu bei.

Anzeige

Während Nvidia die Hardware für die nächste KI-Generation liefert, stellt die EU bereits die rechtlichen Weichen. Dieser kostenlose Umsetzungsleitfaden zeigt Unternehmen, welche neuen Pflichten und Fristen der EU AI Act für den Einsatz von KI-Systemen vorschreibt. EU AI Act in 5 Schritten verstehen: Jetzt kostenloses E-Book sichern

Huang spricht von einer „parabolischen“ Nachfrage. Der Treiber: Agentische KI – autonome Systeme, die eigenständig komplexe Aufgaben erledigen.

Die Vera-Rubin-Revolution und der Druck auf die Lieferkette

Der Wechsel zur Vera-Rubin-Architektur ist ein gewaltiger Sprung. Das System aus sechs Chips – darunter die Vera-CPU und der Rubin-GPU – bietet die 3,5-fache Trainingsleistung und die fünffache Inferenzleistung des Vorgängers Blackwell. Für Unternehmen bedeutet das vor allem eines: Die Kosten für KI-Berechnungen sinken auf ein Siebtel des bisherigen Niveaus. Der Versand soll im dritten Quartal 2026 beginnen.

Um diesen Hochlauf zu stemmen, setzt Huang seine taiwanesischen Partner massiv unter Druck. Er traf sich bereits mit TSMC-Gründer Morris Chang und Quanta-Chef Barry Lam. Für heute ist ein Treffen mit TSMC-Vorsitzendem C.C. Wei geplant, um die Kapazitäten für die anspruchsvolle CoWoS-Chipverpackung zu sichern.

TSMC baut seine CoWoS-Produktion von derzeit 35.000 auf bis zu 140.000 Wafer pro Monat aus – doch die Kapazität ist bereits bis Jahresende ausverkauft. Nvidia hat sich mehr als die Hälfte der Produktion bis 2027 gesichert.

Die Komplexität des Vera-Rubin-NVL72-Systems ist enorm: Rund zwei Millionen Einzelteile müssen mit über 150 taiwanesischen Partnern koordiniert werden. Ein einzelner Rack kostet zwischen 4,6 und 6,5 Millionen Euro – fast doppelt so viel wie die Vorgängergeneration. Der Anteil des Hochleistungsspeichers HBM4 an den Gesamtkosten ist auf 26 Prozent gestiegen.

Der große Umbau: Nvidia setzt auf KI-Agenten

Parallel zur Hardware-Offensive positioniert sich Nvidia als Fundament für autonome Unternehmensagenten. Auf der GTC 2026 stellte das Unternehmen das quelloffene Agent Toolkit vor. Es ermöglicht Firmen, KI-Agenten zu bauen, die dauerhaft Rechenaufgaben erledigen – statt nur isolierte Trainingsläufe durchzuführen. Zu den ersten Nutzern zählen Adobe, Salesforce, SAP, Siemens und CrowdStrike.

Der strategische Schwenk hin zur agentischen KI eröffnet einen neuen Markt. Huang zufolge laufen KI-Agenten hauptsächlich auf CPUs – ein 200 Milliarden Euro schweres Marktpotenzial, das Nvidia mit seiner eigenständigen Vera-CPU erschließen will. Bereits im laufenden Jahr erzielte das Unternehmen rund 18,5 Milliarden Euro mit Standalone-Vera-CPUs.

Anzeige

Mit der zunehmenden Integration von KI in den Unternehmensalltag steigen auch die Anforderungen an die Compliance und Dokumentation. Erfahren Sie in diesem Experten-Report, welche KI-Systeme als Hochrisiko eingestuft werden und wie Sie die gesetzlichen Risikoklassen richtig handhaben. Kostenlosen Umsetzungsleitfaden zum EU AI Act herunterladen

Die Nachfrage nach dauerhafter Inferenz hat auch neue Industriepartnerschaften hervorgebracht. Nvidia und SK Group planen den Bau einer KI-Fabrik in Korea mit über 50.000 Nvidia-GPUs. Die erste Phase soll Ende 2027 fertiggestellt sein und GPU-as-a-Service für SK-Tochterfirmen und externe Organisationen bereitstellen.

Infrastruktur-Kosten explodieren – Energie wird zum Engpass

Der massive KI-Ausbau schafft gewaltige logistische und ökologische Herausforderungen. Cloud-Anbieter werden 2026 voraussichtlich zwischen 600 und 650 Milliarden Euro in Infrastruktur investieren – 2027 soll die Milliardengrenze überschritten werden. Eine einzige Anfrage an fortschrittliche KI-Modelle wie ChatGPT verbraucht inzwischen zehnmal so viel Strom wie eine herkömmliche Google-Suche.

Dieser Energiehunger zwingt Betreiber zu unkonventionellen Lösungen. Ein xAI-Rechenzentrum in Mississippi betreibt derzeit 46 mobile Gasturbinen, um 120 Megawatt Strom zu erzeugen. Die Anlage kostete zwischen 185 und 280 Millionen Euro und ist Gegenstand einer Klage wegen fehlender Luftgenehmigungen.

Die Energiepreise steigen rasant: Die Erdgaspreise legten zwischen 2024 und 2026 um 40 Prozent zu, die Großhandelsstrompreise im US-Markt PJM schnellten innerhalb eines Jahres um 76 Prozent nach oben.

Auch die Lieferketten-Logistik steht unter Druck. Taiwanische Behörden untersuchen Berichte über geschmuggelte Super-Micro-Server mit Nvidia-Chips in gesperrte Märkte. Nvidias Marktanteil für KI-Beschleuniger in China ist durch verschärfte Exportkontrollen auf nahezu Null gefallen. Huawei füllt die Lücke: Sein Ascend-950PR-Chip befindet sich seit März 2026 in Massenproduktion und soll in diesem Jahr umgerechnet rund 11 Milliarden Euro Umsatz generieren.

Marktposition und Auswirkungen auf Verbraucher

Trotz der geopolitischen Hürden in China bleibt Nvidia dominant – gestützt auf einen Milliarden-Auftragsbestand bis 2027. Die Aktie wird derzeit mit dem 25-fachen des erwarteten Gewinns bewertet, ein Rückgang vom 40-fachen Multiplikator zu Jahresbeginn. Die Märkte beginnen sich zu normalisieren.

Doch die steigenden Produktionskosten werden an die Verbraucher weitergegeben. Huang warnte Ende Mai, dass die steigenden Speicherpreise eine erhebliche Inflation darstellten, die letztlich die Preise für Unterhaltungselektronik treiben werde.

Dieser Trend zeigt sich bereits bei den durchgesickerten Spezifikationen des neuen N1X-Prozessors für Laptops. Der ARM-basierte Chip verfügt über eine 20-Kern-CPU und eine Blackwell-Klasse-GPU. Während die Leistung mit Mittelklasse-Desktop-Grafikkarten vergleichbar ist, bleibt die Software-Kompatibilität eine Hürde im Wettbewerb mit Apples M5 Pro und Qualcomms Snapdragon X2 Elite.

Ausblick auf die Computex 2026

Der Fokus der Branche verlagert sich nun auf das Taipei Music Center. Dort wird Jensen Huang am 1. Juni die GTC-Taipei-Keynote halten. Erwartet werden weitere Details zum Vera-Rubin-Rollout und zur Integration von DLSS 4.5, das mit einem Transformer-Modell der zweiten Generation höhere Bildraten in Spielen und Visualisierungen ermöglicht.

Im Anschluss findet vom 2. bis 5. Juni die Computex 2026 statt. Die Konkurrenz schläft nicht: AMD-Chefin Dr. Lisa Su traf bereits am 22. Mai in Taipei ein, um die ersten in Massenproduktion gefertigten 2-nm-Hochleistungs-CPUs zu bewerben. AMD hat zudem Investitionen von über neun Milliarden Euro in Taiwans KI-Sektor angekündigt.

Während Nvidia am 27. Mai den Grundstein für seinen neuen Taipei-Hauptsitz legt und am 28. Mai zum „Trillion-Dollar-Banquet“ mit Branchengrößen lädt, bleibt das Ziel klar: den Übergang der Weltwirtschaft zu einem agentenbasierten KI-Modell zu vollenden. Google Cloud wird voraussichtlich als erster Anbieter Vera-Rubin-NVL72-Instanzen in der zweiten Jahreshälfte 2026 anbieten. Ob dieser Übergang gelingt, hängt von der Fähigkeit der Lieferkette ab, die beispiellosen Fertigungs- und Energieanforderungen der nächsten Computergeneration zu bewältigen.