NVIDIA Vera CPU: Erster Auslieferung an OpenAI und Oracle gestartet

Der Chip-Gigant betritt mit dem Vera-Prozessor den Standalone-CPU-Markt und liefert erste Einheiten an führende KI-Labore aus.

NVIDIA hat am Montag den offiziellen Produktionsstart seiner ersten eigenständigen CPU für agentische KI eingeläutet. Die ersten Vera-Prozessoren gingen an ausgewählte Branchengrößen wie OpenAI, Anthropic, SpaceXAI und Oracle Cloud Infrastructure. NVIDIA-Vizepräsident Ian Buck übergab die Einheiten persönlich – nur wenige Wochen nach der Architektur-Vorstellung auf der GTC-Konferenz im Frühjahr.

Während technologische Innovationen wie die neue Vera-Architektur die Leistungsfähigkeit von KI-Systemen massiv steigern, eröffnen sie gleichzeitig neue Angriffsflächen für Cyberkriminelle. Erfahren Sie in diesem kostenlosen E-Book, wie Sie Ihr Unternehmen vor modernen Bedrohungen schützen und neue gesetzliche KI-Anforderungen rechtssicher erfüllen. Gratis-Report zu Cyber Security Trends jetzt sichern

Mit dem Vera-Chip tritt NVIDIA nun direkt gegen Intel und AMD an. Das Management spricht von einem milliardenschweren Ausbau des Kerngeschäfts. Der Schritt ist strategisch: Bislang belieferte der Konzern vor allem den Markt für Grafikprozessoren, nun will er auch bei klassischen Server-CPUs mitmischen.

Architektur für autonome KI-Systeme

Der Vera-Prozessor unterscheidet sich grundlegend von herkömmlichen CPUs. Statt auf allgemeine Rechenleistung setzt NVIDIA auf die spezifischen Anforderungen „agentischer“ Arbeitsabläufe – autonome KI-Systeme, die mehrschrittige Entscheidungen treffen, Werkzeuge einsetzen und in ihrer Umgebung agieren.

Das Herzstück: 88 maßgeschneiderte „Olympus“-Kerne auf Basis einer hauseigenen Arm v9.2-A-kompatiblen Architektur. NVIDIA hat sich damit von lizenzierten Designs früherer Generationen gelöst. Eine Schlüsseltechnologie ist das räumliche Multithreading – anders als bei herkömmlichen Verfahren werden die Ressourcen eines Kerns physisch aufgeteilt, statt zeitlich zu takten. Das Ergebnis: 176 Threads pro Chip mit garantierter, vorhersagbarer Leistung.

Besonders wichtig für KI-Anwendungen: Jede isolierte „Agenten-Umgebung“ – also der sichere Bereich, in dem KI-Modelle Code ausführen oder im Netz surfen – erhält eigene, fest zugewiesene Ressourcenblöcke.

Laut Architektur-Unterlagen erreicht der Vera-Chip unter Volllast eine 50 Prozent höhere Pro-Kern-Leistung als die Vorgänger-Generation Grace. Die Speicherbandbreite liegt bei 1,2 Terabyte pro Sekunde über LPDDR5X-Module – rund doppelt so viel wie bei herkömmlichen Server-CPUs.

Technische Spitzenwerte und Systemintegration

Erste Benchmark-Ergebnisse deuten auf deutliche Fortschritte hin. In Tests des Streaming-Datenplattform-Anbieters Redpanda zeigte der Vera-Prozessor bei Apache-Kafka-kompatiblen Workloads eine bis zu 5,5-mal geringere Latenz als vergleichbare x86-Systeme.

Die Architektur wurde in enger Abstimmung mit NVIDIAs kommendem Rubin-Grafikprozessor entwickelt. Beide Komponenten kommunizieren über eine zweite Generation des NVLink-Chip-to-Chip-Interconnects mit 1,8 Terabyte pro Sekunde kohärenter Bandbreite. Das ermöglicht einen gemeinsamen Speicher-Adressraum – Daten müssen nicht mehr aufwendig zwischen CPU und GPU hin- und herbewegt werden.

Der rasante Einzug von KI in die Unternehmens-IT fordert nicht nur neue Hardware, sondern auch ein proaktives Risikomanagement für Führungskräfte. In diesem kostenlosen Ratgeber erhalten Unternehmer praxisnahe Checklisten, um Sicherheitslücken effektiv zu schließen, bevor Angreifer sie ausnutzen können. Kostenlosen Sicherheits-Ratgeber herunterladen

Für Rechenzentren bietet NVIDIA die Vera Rubin NVL72-Plattform an: ein Rack-System mit 36 Vera-CPUs und 72 Rubin-GPUs in einer flüssigkeitsgekühlten Umgebung. Branchenbeobachter sehen darin den Versuch, den gesamten Rack als eine einzige Recheneinheit zu behandeln. NVIDIA verspricht eine zehnfache Reduzierung der Kosten für KI-Inferenz-Tokens im Vergleich zur vorherigen Blackwell-Architektur.

KI-Labore setzen auf Orchestrierung

Die ersten Auslieferungen an Anthropic und OpenAI zeigen einen grundlegenden Wandel in der Infrastruktur-Strategie der KI-Labore. Bei Anthropic betont man: Je autonomer die Modelle werden, desto mehr verlager sich die Rechenlast auf die CPU – für Orchestrierung und Zustandsverwaltung. Die Fähigkeit des Vera-Chips, großflächiges Reinforcement Learning und Agenten-Simulationen zu managen, gilt als Hauptgrund für die Entscheidung.

Oracle Cloud Infrastructure (OCI) hat sich als erster großer Cloud-Anbieter zu einer Hyperscale-Einführung verpflichtet. OCI bestätigte Pläne, noch in diesem Jahr Hunderttausende Vera-CPUs zu installieren. Ziel ist es, Unternehmenskunden eine produktionsreife Infrastruktur für hochleistungsfähige KI-Anwendungen bereit zustellen.

Auch die Hardware-Partner ziehen mit: Dell Technologies, HPE, Lenovo und Supermicro integrieren den Vera-Chip in ihre modularen Referenzarchitekturen. Flüssigkeitsgekühlte Racks mit bis zu 256 Vera-CPUs und über 22.500 gleichzeitigen unabhängigen Umgebungen sind bereits in Planung.

Marktverschiebung im Rechenzentrum

NVIDIAs Vorstoß in den CPU-Markt kommt zu einem Zeitpunkt, an dem sich die Ökonomie klassischer Rechenzentren grundlegend wandelt. Steigende Energiekosten und die sogenannte „HBM-Knappheit“ bei Hochleistungsspeichern setzen Betreiber unter Druck. Mit der Integration von CPU, GPU, DPU (BlueField-4) und Netzwerk (Spectrum-6) kontrolliert NVIDIA künftig das gesamte Rack-Design.

Für Intel und AMD wird die Lage ungemütlich. Zwar halten deren Architekturen „Diamond Rapids“ (Intel) und „Turin“ (AMD) noch bedeutende Marktanteile im allgemeinen Servergeschäft. Doch NVIDIA setzt auf die speziellen Anforderungen der „KI-Industriellen Revolution“. Der Fokus auf Energieeffizienz – NVIDIA spricht von der doppelten Effizienz traditioneller x86-Server-Racks – zielt direkt auf die Betriebskosten der Betreiber.

Ausblick: Wann kommt der Chip in den Massenmarkt?

Die breite kommerzielle Verfügbarkeit des Vera-Chips wird für die zweite Jahreshälfte 2026 erwartet. NVIDIA hat bereits die nächsten Architekturen angekündigt: die „Rubin Ultra“-Plattform und das darauf folgende „Feynman“-Design.

Der Erfolg des Vera-Prozessors wird sich daran messen lassen, ob er die nächste Generation von KI-Modellen ermöglicht – jene, die bei OpenAI und SpaceXAI derzeit in der Entwicklung sind. Halten die versprochenen Leistungssteigerungen in der Praxis, könnte NVIDIA seinen Status vom Spezialanbieter für Grafikprozessoren zum dominierenden Akteur im gesamten Rechenzentrums-Markt ausbauen. Die Auslieferungen an die globalen Hyperscaler in den kommenden Monaten werden zeigen, ob die neue Architektur hält, was sie verspricht.

Architektur für autonome KI-Systeme

Technische Spitzenwerte und Systemintegration

KI-Labore setzen auf Orchestrierung

Marktverschiebung im Rechenzentrum

Ausblick: Wann kommt der Chip in den Massenmarkt?

Ähnliche Beiträge

GPU-Markt im Umbruch: Rekordpreise bremsen PC-Nachfrage

Apple bestätigt WWDC 2026: iOS 27 setzt auf KI und Stabilität

iPhone Ultra: Apples erstes Foldable kommt mit Rekord-Dünnheit

Apple M5 und MacBook Neo: Die Grenzen zwischen Tablet und Laptop verschwimmen

Intel erweitert Panther-Lake-Familie um Industrie-Chips

MacBook Pro: Touch-Rückkehr und M6-Redesign zeichnen sich ab