NVIDIA: GPU-Leistung wird zur handelbaren Ware an der Börse

ICE und Ornn führen GPU Compute Futures ein. OpenAI sichert sich Kapazitäten, während NVIDIA die Vera-Rubin-Architektur vorstellt.

Ab sofort lassen sich Rechenleistungen von NVIDIA-Chips wie Rohstoffe handeln – ein Novum für die Industrie.

Die Börsenwelt entdeckt die Künstliche Intelligenz: Die Intercontinental Exchange (ICE) und das Unternehmen Ornn bringen am 19. Mai 2026 sogenannte GPU Compute Futures auf den Markt. Diese Finanzkontrakte basieren auf dem Ornn Compute Price Index (OCPI) und erlauben es Unternehmen, den Wert von Rechenleistung für NVIDIA-Chips wie den H100, H200 und den neuen Blackwell-B200 zu handeln und abzusichern. Was bislang als Spezialhardware galt, wird damit zum standardisierten Finanzprodukt.

Anzeige

Während die Industrie massiv in KI-Hardware investiert, stellt die EU-KI-Verordnung Unternehmen vor neue regulatorische Herausforderungen. Dieser kostenlose Leitfaden hilft Ihnen, die komplexen Anforderungen an Risikoklassen und Dokumentationspflichten rechtssicher umzusetzen. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt

OpenAI sichert sich Rechenkapazität für Jahre

Die Kommodifizierung von GPU-Rechenleistung schreitet rasant voran. Zeitgleich zur Einführung der Futures kündigte OpenAI ein neues Modell an: Kunden können sich ab sofort garantierte Rechenkapazitäten für ein, zwei oder drei Jahre sichern. „Dieses Modell gibt uns die Planungssicherheit, die wir für langfristige Infrastrukturinvestitionen brauchen“, so die OpenAI-Führung.

Der Schritt ist Teil eines gigantischen Investitionsbooms. Die großen Technologiekonzerne werden Schätzungen zufolge im Jahr 2025 über 700 Milliarden Euro in KI-Infrastruktur stecken – fast doppelt so viel wie im Vorjahr. Für NVIDIA bedeutet dies massive Gewinne: Analysten erwarten für das erste Quartal ein Umsatzwachstum von 79 Prozent, die bereinigten Gewinne könnten bei rund 42,97 Milliarden Euro liegen.

Derzeit hält NVIDIA eine Bruttomarge von 74,5 Prozent. Doch Branchenbeobachter warnen: Mit dem Produktionsstart der nächsten Generation – der Vera-Rubin-Plattform – könnten die Margen unter Druck geraten. Die neuen Systeme sind fertigungstechnisch anspruchsvoller und erfordern neue Speicherstandards.

Vera Rubin: Prozessor und Speicher wachsen zusammen

Am 18. Mai 2026 wurden Details zur Architektur von Vera Rubin bekannt. Das Herzstück: GPU-Initiated Direct Storage Access (GIDS). Diese Technologie umgeht die CPU komplett – die Grafikkarte greift direkt auf den Speicher zu. Das soll die KI-Speicherkapazität im Vergleich zu bisherigen Standards um das 16-Fache steigern.

Entscheidend ist der Wechsel zu High Bandwidth Flash (HBF). Forscher in Seoul zeigten, dass die Kombination von HBF mit High Bandwidth Memory (HBM) bis zu 3.120 Gigabyte Speicher pro GPU-Paket ermöglicht. Während HBM weiterhin für rechenintensive Aufgaben zuständig ist, übernimmt HBF das Zwischenspeichern von KI-Modellparametern. Sandisk will erste HBF-Muster in der zweiten Jahreshälfte 2026 liefern, Ziel sind einsatzbereite Systeme für KI-Inferenz bis Anfang 2027.

Auch die CPU wird grundlegend überarbeitet. Seit dem 19. Mai liefert NVIDIA die ersten Vera-CPUs an Großkunden wie OpenAI, Anthropic, SpaceXAI und Oracle Cloud Infrastructure (OCI). Mit 88 Olympus-Kernen und einer Speicherbandbreite von 1,2 Terabyte pro Sekunde bietet der Chip eine um 50 Prozent höhere Single-Core-Leistung als Vorgängermodelle. OCI plant bereits, Hunderttausende dieser Prozessoren als Host-Einheiten für seine NVL72-Systeme einzusetzen.

Konkurrenz und politische Hürden

NVIDIAs Dominanz hat auch Schattenseiten. Die hohen Preise und die Spezialisierung auf KI öffnen Wettbewerbern Türen. Die Sandia National Laboratories testen derzeit Hardware von NextSilicon, einem israelischen Startup, für Höchstleistungsrechnen. „Weil NVIDIA und AMD sich so stark auf KI optimiert haben, brauchen wir Chips, die in der allgemeinen Supercomputing- und Nuklearsimulation glänzen“, so die Forscher. Erste Tests deuten darauf hin, dass NVIDIAs Rubin-Chips bei doppelter Rechengenauigkeit schwächer abschneiden als spezialisierte Konkurrenzprodukte.

Politisch wird es ebenfalls brisant. Am 19. Mai blockierten chinesische Zollbehörden offenbar die Einfuhr von NVIDIAs RTX 5090 D v2. Diese Karte war speziell für den chinesischen Markt entwickelt worden – mit reduzierter Leistung und nur 24 statt 32 Gigabyte VRAM. Peking lehnt „abgespeckte“ Produkte zunehmend ab. Chinesische Kunden müssen nun entweder auf die RTX 5080 ausweichen oder Hardware über Graumärkte beziehen.

Ein weiteres Problem: die thermische Grenze. Selbst moderne Dampfkammern in High-End-Smartphones kommen mit den 20 bis 30 Watt Spitzenleistung moderner 2-Nanometer-Chips kaum zurecht. Die Folge: massives Drosseln der Leistung. Die Kosten für Kühlung und Strommanagement schmälern zunehmend den Wert der Siliziumchips.

Sicherheitslücken im Grafiktreiber

Auch die Software-Seite bereitet Kopfzerbrechen. Am 19. Mai veröffentlichte NVIDIA ein Sicherheitsupdate für insgesamt zwölf Schwachstellen in seinen GPU-Treibern für Linux und Windows. Die schwerwiegendste Lücke erhielt einen CVSS-Score von 8,8 – sie gilt als kritisch. Angreifer könnten damit Denial-of-Service-Angriffe durchführen, ihre Rechte ausweiten oder Schadcode ausführen.

Anzeige

Angesichts kritischer Sicherheitslücken in KI-Infrastrukturen müssen Unternehmen ihre IT-Abwehr heute proaktiv verstärken. Erfahren Sie in diesem Experten-Bericht, wie Sie Sicherheitslücken schließen und gleichzeitig neue gesetzliche Anforderungen zum Schutz Ihres Unternehmens erfüllen. Gratis-E-Book: IT-Sicherheit stärken ohne teure Investitionen

Die neuen Treiberversionen (590.48.01 für GeForce, 595.71.05 für RTX/Quadro) schließen die Lücken. Der Aufwand für die Wartung dieser Software-Infrastruktur ist enorm – besonders, da NVIDIAs Hardware heute in kritischen Bereichen von nationalen Laboren bis zu globalen Finanzplattformen läuft.

Ausblick: Das Rubin-Zeitalter beginnt

Der Rest des Jahres 2026 wird vom Übergang von Blackwell zu Vera Rubin geprägt sein. Während der B200 weiterhin den Standard für KI-Training und Inferenz setzt, markieren die ersten Vera-CPUs bei den großen Cloud-Anbietern den Start eines neuen Zyklus. Unternehmen wie Oracle und OpenAI sichern sich ihre Rechenzukunft gleich doppelt ab: durch physische Hardware-Lieferungen und durch neue Finanzinstrumente wie Compute Futures.

NVIDIAs strategische Schritte – darunter die Übernahme des Inferenz-Startups Groq im März 2026 – deuten auf eine klare Richtung hin: Der Chip-Gigant will die gesamte KI-Wertschöpfungskette dominieren, vom Training bis zur Hochgeschwindigkeits-Inferenz. Und solange OpenAI mit einer Bewertung von über 850 Milliarden Euro auf einen möglichen Börsengang zusteuert, dürfte die Nachfrage nach NVIDIAs wertvollen Chips kaum nachlassen – auch wenn Wettbewerber und geopolitische Faktoren das Umfeld zunehmend komplexer machen.