Der US-Chipkonzern Nvidia hat diese Woche eine Reihe technischer Neuerungen vorgestellt, die auf die wachsenden Anforderungen großer KI-Rechenzentren abzielen. Am 11. und 12. Juni präsentierte das Unternehmen unter anderem Speichersysteme mit 2,9 Petabyte Kapazität sowie Details zur Vera-Rubin-Architektur, der Nachfolgeplattform der Blackwell-Generation.
Die rasante Entwicklung von KI-Systemen wie der neuen Vera-Rubin-Architektur bringt weitreichende rechtliche Pflichten für Unternehmen mit sich. Dieser kostenlose Umsetzungsleitfaden hilft Ihnen, die Anforderungen der neuen EU-KI-Verordnung frühzeitig zu verstehen und Risikoklassen richtig einzustufen. EU AI Act in 5 Schritten verstehen
Hochgeschwindigkeits-Speicher und integrierte Sicherheit
Gemeinsam mit dem Hardware-Partner Wiwynn stellte Nvidia am 12. Juni neue KI-Rechenzentrumsspeicher vor. Die SCADA-basierten Systeme nutzen GPU-beschleunigten Speicher und setzen auf PCIe 6.0 für extrem hohe Datendurchsätze. Mit einer Kapazität von 2,9 Petabyte sind sie für die massiven Datenmengen agentischer KI-Workloads ausgelegt.
Für die Sicherheit dieser Umgebungen kündigte Nvidia am 11. Juni neue DOCA-Sicherheitsinnovationen für die Vera BlueField-4 STX-Plattform an. Das System ist als „Secure-by-Design“-Speicher für KI-Fabriken konzipiert und kann Netzwerk- und Dateirichtlinien inline mit Geschwindigkeiten von bis zu 800 Gbit/s durchsetzen. Die Laufzeit-Bedrohungserkennung soll dabei bis zu 1000-mal schneller sein als bei früheren Generationen. Systeme auf Basis der STX-Plattform werden voraussichtlich ab der zweiten Jahreshälfte 2026 von Partnern wie Dell, HPE, IBM und NetApp verfügbar sein.
Die Vera-Rubin-Architektur und die eigenständige Vera-CPU
Die nun im Detail vorgestellte Vera-Rubin-Architektur markiert einen bedeutenden Wandel in Nvidias Hardware-Strategie. Der Rubin R100 GPU, gefertigt im 3-Nanometer-Verfahren, enthält 336 Milliarden Transistoren und bietet eine Leistung von bis zu 50 PFLOPS. Er nutzt HBM4-Speicher mit 288 GB Kapazität und einer Bandbreite von 22 TB/s.
Ebenfalls am 12. Juni wurden Details zur Vera CPU bekannt – Nvidias erstem eigenständigen Prozessor, der speziell für agentische KI entwickelt wurde. Berichten zufolge hat Nvidia damit begonnen, den Vera-Chip Kunden in China anzubieten, die Auslieferungen sollen im August 2026 starten. Der Prozessor ist eigenen Angaben zufolge 1,8-mal schneller als konkurrierende Modelle und hat einen Listenpreis von über 20.000 US-Dollar (rund 18.500 Euro). Für große Installationen bietet die NVL72-Rack-Konfiguration 72 Rubin-GPUs und 36 Vera-CPUs, die zusammen 3,6 ExaFLOPS an Inferenzleistung liefern. Die Auslieferungen der Rubin-Plattform sollen im dritten Quartal 2026 beginnen.
Mit der zunehmenden Vernetzung und der Nutzung von KI in Rechenzentren wachsen auch die Cyberrisiken und regulatorischen Anforderungen für Firmen. Erfahren Sie in diesem kostenlosen Report, welche neuen gesetzlichen Pflichten und Bedrohungsszenarien Unternehmer jetzt kennen müssen, um ihre IT-Infrastruktur proaktiv zu schützen. Kostenlosen Cyber-Security-Report jetzt herunterladen
Energieeffizienz und KI-Fabrik-Referenzdesigns
Angesichts des enormen Energiebedarfs moderner Rechenzentren lieferte Nvidia am 11. Juni den ersten Quantum-X InfiniBand-Switch mit Co-Packaged Optics (CPO) an Lambda AI aus. Der Switch reduziert den Stromverbrauch um etwa 3 Kilowatt pro Rack im Vergleich zu herkömmlichen Designs. Durch den Wegfall von 655.000 diskreten Transceiver-Modulen in großen Clustern können in einem Standard-Cluster mit 41.472 GPUs über 3.000 zusätzliche GPUs betrieben werden, ohne den Stromverbrauch zu erhöhen – der flüssigkeitsgekühlte 4U-Switch macht es möglich.
Zudem stellten Siemens, Nvidia und Fluence ein Referenzdesign für KI-Fabriken vor. Es unterstützt eine Gesamtkapazität von 136 MW und integriert Fluence-Batteriespeicher für zentrales Energiemanagement. Was die operative Effizienz betrifft, so unterstützt das Nvidia GB300 NVL72 mit Blackwell-Ultra-GPUs angeblich 61.400 gleichzeitige KI-Agenten pro Megawatt – eine zwanzigfache Verbesserung gegenüber der H200-Generation.
Strategische Partnerschaften und vertrauliches Rechnen
Nvidia baut seine Zusammenarbeit mit SK Hynix aus, um die nächste Speichergeneration für KI-Fabriken zu entwickeln, darunter Komponenten für die Vera-Rubin- und Vera-CPU-Linien. Die Partnerschaft umfasst auch die Entwicklung digitaler Zwillinge für die autonome Fertigung mittels Nvidias Omniverse-Plattform.
Im Bereich Cloud-Sicherheit setzt Nvidia auf vertrauliches Rechnen (Confidential Computing): GPUs mit dieser Technologie werden nun für Apple Intelligence genutzt. Seit dem 12. Juni ist bekannt, dass Apple diese Prozessoren für private Cloud-Computing-Aufgaben einsetzt – in Kombination mit Intel-CPUs und Googles Sicherheitschips, um den Datenschutz bei KI-Inferenzen zu gewährleisten.
Während Nvidia seinen Vorsprung ausbaut, dringen auch Wettbewerber in den Markt für agentische KI vor. Huawei hat kürzlich seinen „Agentic Infra Stack“ vorgestellt, der eine eigene Compute-Plattform und Speichersysteme für den Betrieb von KI-Agenten auf proprietären NPUs umfasst.

