RTX Spark: NVIDIAs KI-Chip mit 1 Petaflop kommt im Herbst

NVIDIA stellt Details zu RTX Spark und Vera CPU vor. Neue Chips ermöglichen lokale KI-Ausführung und fordern AMD heraus.

Die Strategie zielt sowohl auf leistungsstarke Personal Computer als auch auf Rechenzentren ab – und stellt die Konkurrenz vor neue Herausforderungen.

RTX Spark: Der KI-Prozessor für den Schreibtisch

Nach der Vorstellung des N1X-PC-Prozessors auf der Computex im Juni 2026 sind nun die technischen Details des RTX Spark-Chips bekannt. Der integrierte Prozessor kombiniert einen 20-Kern-ARM-CPU mit einer Blackwell-GPU, die über 6.144 CUDA-Kerne verfügt. Das Herzstück: eine KI-Leistung von einer Petaflop FP4-Rechenleistung – genug, um komplexe KI-Modelle lokal auszuführen.

Der RTX Spark unterstützt bis zu 128 Gigabyte einheitlichen LPDDR5X-Speicher. Damit lassen sich KI-Modelle mit bis zu 120 Milliarden Parametern direkt auf dem Gerät betreiben – ohne Cloud-Anbindung. Die thermische Verlustleistung liegt bei moderaten 80 Watt, gefertigt wird der Chip im 3-Nanometer-Verfahren bei TSMC. Ausliefern will NVIDIA den Prozessor im Herbst 2026 – zunächst in Laptops von Microsoft, Dell, HP, ASUS, Lenovo und MSI.

DGX Station: Der Supercomputer fürs Büro

Für professionelle Anwender bringt NVIDIA Anfang Juli 2026 die DGX Station for Windows auf den Markt. Das System basiert auf dem GB300 Grace Blackwell Ultra Desktop Superchip, der einen 72-Kern-Grace-CPU mit einer Blackwell-Ultra-GPU vereint.

Die technischen Daten sind beeindruckend: 748 Gigabyte kohärenter Speicher und eine KI-Leistung von 20 Petaflops FP4. Damit lassen sich KI-Modelle mit bis zu einer Billion Parametern lokal ausführen – eine Größenordnung, die bislang Rechenzentren vorbehalten war. ASUS, GIGABYTE und Supermicro werden die Desktop-Supercomputer ab dem vierten Quartal 2026 anbieten. Zur Sicherheit integriert NVIDIA OpenShell, ein Werkzeug zur Isolierung von KI-Agenten.

Vera CPU: NVIDIAs erster eigenständiger Prozessor

Anzeige

Wer die Leistung des RTX Spark für lokale KI-Workloads nutzen will, findet in diesem Report die wichtigsten Entscheidungsgrundlagen – von technischen Spezifikationen bis zu konkreten Deployments. Jetzt kostenlosen Strategie-Report anfordern

Im Rechenzentrumssegment sorgt die Vera Rubin NVL72 für Aufsehen. Das Rack-System, das erstmals auf der Cloud-Infrastruktur von CoreWeave hochgefahren wurde, kombiniert 72 Rubin-GPUs mit 36 Vera-CPUs. Die Vernetzung erfolgt über NVLink 6 mit einer Bandbreite von 260 Terabyte pro Sekunde.

Die Vera-CPU ist NVIDIAs erster eigenständiger Prozessor, der speziell für KI-Workloads entwickelt wurde. Erste Tests am Los Alamos National Laboratory zeigen eine siebenfache Leistungssteigerung bei bestimmten KI-Aufgaben im Vergleich zu traditionellen x86-Architekturen. Das Labor will die Prozessoren in seinen für 2027 geplanten Supercomputern „Mission“ und „Vision“ einsetzen.

Marktchancen in China

Besonders brisant: NVIDIA bereitet offenbar die Rückkehr in bestimmte Märkte mit der Vera-CPU vor. Branchenkreisen zufolge könnte der Standalone-Chip bereits ab August 2026 an Kunden in China ausgeliefert werden. Der Preis pro Einheit soll bei über 20.000 Euro liegen.

Technische Rückschläge und Wettbewerb

Der Rollout der Rubin-Architektur verlief nicht ohne Hindernisse. Ende Juni 2026 wurde bekannt, dass eine Vier-Die-Version des Rubin Ultra GPU aufgrund von Problemen mit TSMCs CoWoS-L-Technologie gestrichen wurde. Stattdessen kommt ein Zwei-Die-Design mit HBM4E-Speicher zum Einsatz.

Anzeige

Die Leistungsgrenzen aktueller Desktop-Hardware werden zum Wettbewerbsnachteil – während AMD und Startups aufholen. Dieser Report zeigt, wie Sie mit dem RTX Spark komplexe KI-Modelle lokal ausführen und Ihre Infrastruktur zukunftssicher machen. RTX Spark-Report jetzt sichern

Die Konkurrenz schläft nicht: Für Ende Juli 2026 kündigte AMD weitere Details zu seinem Helios-Beschleuniger (MI455X) an. Der soll pro GPU mehr HBM4-Kapazität bieten als die aktuellen Rubin-Spezifikationen – die Massenproduktion ist jedoch erst für das zweite Quartal 2027 geplant.

Gleichzeitig drängen spezialisierte Anbieter auf den Markt. Das Startup Etched präsentierte Ende Juni 2026 seinen „Sohu“-Chip, der ausschließlich auf Transformer-Modell-Inferenz ausgelegt ist. Ein anderes Unternehmen, Oxmiq, sicherte sich 32 Millionen Euro, um lizenzierte IP zu entwickeln, die CPU, GPU und Tensor-Einheiten in einem Block vereint – ein Ansatz, der die steigenden Kosten für maßgeschneiderte Chip-Entwicklung senken soll.