Nvidia Blackwell: 71 Prozent Marktanteil bei High-End-GPUs

Die Blackwell-Architektur von Nvidia hat sich trotz anfänglicher Hitzeprobleme und Lieferverzögerungen als dominierende Plattform für KI-Workloads etabliert. Einem aktuellen Bericht zufolge entfallen 2026 rund 71 Prozent aller High-End-GPU-Lieferungen auf die Blackwell-Serie – ein deutlicher Anstieg gegenüber früheren Prognosen. Grund dafür sind unter anderem Verzögerungen bei der nächsten Generation Rubin.

Lieferengpässe und der Aufstieg von Blackwell Ultra

Die Verfügbarkeit der Blackwell-Server-GPUs bleibt angespannt. Bereits Ende Dezember 2025 bestätigte das Unternehmen, dass die Architektur bis Mitte 2026 offiziell ausverkauft sei. Damals belief sich der Auftragsstau auf rund 3,6 Millionen Einheiten, angetrieben vor allem von den großen Cloud-Anbietern. Die Folge: Unternehmen und Staaten müssen entweder über 18 Monate auf neue Hardware warten oder auf die Vorgängergeneration Hopper zurückgreifen.

Während Großkonzerne massiv in KI-Hardware investieren, wachsen mit der neuen Technik auch die digitalen Angriffsflächen für Unternehmen. Dieser kostenlose Report klärt auf, welche rechtlichen Pflichten und Bedrohungen Unternehmer jetzt kennen müssen. Neue KI-Gesetze und Cyberrisiken: Was auf Ihr Unternehmen zukommt

Bis April 2026 hat sich das Produktportfolio in Richtung der ausgereifteren Blackwell-Ultra-Plattform verschoben – konkret die Serien GB300 und B300. Während die früheren Modelle GB200 und B200 mit Startschwierigkeiten kämpften, werden sie weiterhin für preissensible Kunden ausgeliefert. Der Wechsel zur Ultra-Serie wird durch den Bedarf an mehr Speicher und besseren Verbindungen befeuert. Analysten korrigierten Mitte April die jährliche Wachstumsrate für High-End-GPU-Lieferungen leicht auf 26 Prozent nach unten – von knapp 27 Prozent. Grund: Verzögerungen bei der Rubin-Architektur, deren Marktanteil für 2026 von 29 auf 22 Prozent fiel.

Die Nachfrage war derart extrem, dass sie die Investitionspläne großer Tech-Konzerne massiv beeinflusste. Meta etwa hatte seine Kapitalausgaben für 2026 auf über 100 Milliarden Euro veranschlagt – vor allem für Blackwell-Cluster. Doch selbst mit diesen Summen mussten einige Firmen die Veröffentlichung ihrer fortschrittlichsten KI-Modelle bis Ende 2025 oder Anfang 2026 verschieben.

Hitzeprobleme und der Umstieg auf Flüssigkühlung

Der Weg zur Marktdominanz war steinig. Ende 2024 berichteten Medien von Überhitzungsproblemen in den hochverdichteten NVL72-Racks mit 72 Prozessoren. Diese Racks benötigen zwischen 120 und 140 Kilowatt Leistung – und erreichten Temperaturen, die Hardware beschädigten und den Betrieb beeinträchtigten.

Nvidia-Sprecher sprachen damals von „technischen Iterationen“, um die beispiellosen Anforderungen an die Wärmeableitung der Dual-Die-Architektur zu bewältigen. Jeder Blackwell-GPU enthält 208 Milliarden Transistoren – 2,6-mal mehr als der H100. In hochverdichteten Umgebungen reicht herkömmliche Luftkühlung nicht mehr aus.

Bis zum Frühjahr 2026 hat sich die Branche weitgehend auf Flüssigkühlung umgestellt. Die Liquid-to-Air-Technologie (L2A) ist zum Standard für GB200-NVL72-Racks geworden. Schon frühere Studien sagten voraus, dass der Anteil der Flüssigkühlung in Rechenzentren von zehn Prozent 2024 auf über 20 Prozent 2025 steigen würde – ein Trend, der sich 2026 fortsetzt. Während Luftkühlung 30 bis 40 Kilowatt pro Rack bewältigt, erzwingt der 132-Kilowatt-Bedarf von Blackwell einen kompletten Neubau der Infrastruktur. Zulieferer wie Vertiv und Schneider Electric bieten Referenzarchitekturen für bis zu 132 Kilowatt pro Rack. Für die nächste Generation mit 240 Kilowatt werden bereits Tauchkühlungen getestet.

Fertigungsoptimierung und Lieferketten-Anpassungen

Auch die Produktion von Blackwell hatte Startschwierigkeiten. Im Sommer 2024 entdeckten Ingenieure ungewöhnlich spät einen Designfehler am Prozessor-Die, der die beiden Blackwell-GPUs verbindet. Eine Neugestaltung des Siliziums und der Masken war nötig. Zwar half der Fertigungspartner TSMC, die Probleme bis Ende 2024 zu beheben, doch die Massenauslieferungen begannen erst Anfang 2025.

Um die Produktion anzukurbeln, setzte Nvidia auf die CoWoS-L-Verpackungstechnologie, für die TSMC ältere Kapazitäten umrüsten und neue Fabriken bauen musste. Trotz aller Anstrengungen blieb der Hochlauf in der ersten Jahreshälfte 2025 „holprig“. Auftragsfertiger wie Hon Hai (Foxconn) und Quanta arbeiteten Anfang 2025 am Limit, um die komplexen GB200-Racks zu montieren.

Bis Anfang 2026 sind viele dieser Schwierigkeiten behoben – auch wenn die Lieferkette anfällig für geopolitische Spannungen und die Verfügbarkeit von High-Bandwidth Memory (HBM4) bleibt. Während der Anteil der älteren Hopper- und der kommenden Rubin-Serie schrumpft, hat Blackwell die Lücke gefüllt. Angetrieben wird die Nachfrage auch durch neue KI-Inferenzlösungen, von denen in diesem Jahr mehrere Hunderttausend Einheiten ausgeliefert werden sollen.

Mit der zunehmenden Vernetzung und Komplexität der IT-Infrastruktur steigen auch die Risiken durch Cyberkriminalität für den Mittelstand. Erfahren Sie im kostenlosen E-Book, wie Sie Sicherheitslücken schließen und Ihre Firma proaktiv schützen. Gratis-E-Book: IT-Sicherheit ohne teure Investitionen stärken

Analyse: Wirtschaftliche und operative Auswirkungen

Die breite Einführung von Blackwell hat die Ökonomie der Rechenzentren grundlegend verändert. Die NVL72-Konfiguration, die als ein einziger Supercomputer fungiert, ermöglicht in bestimmten Großanlagen 25-fache Kosteneinsparungen gegenüber früheren Architekturen. Dem stehen jedoch deutlich höhere Infrastrukturkosten für die Flüssigkühlung gegenüber.

Der Wandel verläuft nicht einheitlich. Während Hyperscaler wie Microsoft, Amazon und Google die Mittel haben, Anlagen umzurüsten oder neue zu bauen, tun sich kleinere Anbieter schwer. Probleme mit auslaufender Flüssigkeit an Steckverbindern und die Notwendigkeit präziser Temperaturregelung wurden in der ersten Jahreshälfte 2025 häufig gemeldet. Einige Organisationen wichen auf interne ASIC-Lösungen oder alternative GPUs aus.

In den letzten Monaten haben neue KI-Akteure und veränderte Investitionsmodelle dazu geführt, dass Kunden ihre Bestellungen anpassten. Während frühe Prognosen für 2025 von bis zu 60.000 Rack-Lieferungen ausgingen, wurden diese Zahlen nach unten korrigiert, als Kunden auf die Spezifikationen von Blackwell Ultra (GB300) warteten. Dennoch bietet die ausgereifte Blackwell-Plattform im April 2026 eine stabile Basis für die aktuelle KI-Welle.

Ausblick: Rubin und die Zukunft ab 2027

Für die zweite Jahreshälfte 2026 richtet sich der Blick auf das kommende Blackwell-Update und den eventualen Start der Rubin-Architektur. Zwar hält Blackwell derzeit über 70 Prozent des High-End-Marktes, doch dieser Anteil wird voraussichtlich sinken, sobald Rubin ab 2027 in größeren Stückzahlen ausgeliefert wird. Rubin soll HBM4E-Speicher und noch höhere Leistungsdichten bieten – was die Anforderungen an die Flüssigkühlung weiter in die Höhe treiben wird.

Für den Rest des Jahres 2026 plant Nvidia, mit neuen LPU-Lösungen in den KI-Inferenzmarkt vorzustoßen und die Stückzahlen bis 2027 zu verdoppeln. Der aktuelle Auftragsstau für Blackwell wird langsam abgebaut, da sich die Produktionsausbeuten stabilisieren. Doch die unstillbare Nachfrage nach Hochleistungsrechnen lässt erwarten, dass das Angebot auf absehbare Zeit ein kritischer Engpass bleibt. Betreiber von Rechenzentren beschäftigt vor allem der langfristige Infrastrukturausbau für die 240-Kilowatt-Racks der nächsten Generation – das Ende der luftgekühlten Ära für Spitzen-KI ist besiegelt.

Lieferengpässe und der Aufstieg von Blackwell Ultra

Hitzeprobleme und der Umstieg auf Flüssigkühlung

Fertigungsoptimierung und Lieferketten-Anpassungen

Analyse: Wirtschaftliche und operative Auswirkungen

Ausblick: Rubin und die Zukunft ab 2027

Ähnliche Beiträge

Apple treibt KI-Offensive voran: Intel-Aus und M5-Chip im Fokus

Wearable-Markt 2026: Apple Watch Series 11 erhält weltweite Zulassung für Blutdruck-Funktion

ATX 3.1: Neuer Standard für PC-Netzteile setzt auf Sicherheit

KI-Hardware-Krise: PC-Markt spaltet sich in Arm und Reich

AMD öffnet FSR 4.1 für ältere Grafikkarten-Generationen

Gesundheits-Wearables: Apple Watch, Oura Ring und WHOOP im großen Vergleich