Der Chipkonzern Nvidia erweitert seine Blackwell-Plattform um leistungsstarke Workstation-Lösungen für Windows. Die neuen Systeme sollen KI-Modelle mit Billionen Parametern direkt im Büro ermöglichen.
Mit der Vorstellung der DGX Station für Windows und neuer professioneller Workstation-Konfigurationen zielt Nvidia auf Unternehmen, die rechenintensive KI-Anwendungen lokal betreiben wollen. Die am 1. und 2. Juli 2026 angekündigte Hardware-Reihe bringt die Rechenleistung großer Rechenzentren auf den Schreibtisch – ein Schritt, der besonders für datenschutzsensible Branchen in Europa interessant sein dürfte.
Desktop-Supercomputer mit Grace Blackwell Ultra
Am 2. Juli 2026 präsentierte Nvidia die DGX Station für Windows – ein High-End-System, das auf dem GB300 Grace Blackwell Ultra Desktop-Superchip basiert. Die Kombination aus einer 72-Kern-Grace-CPU und einer Blackwell-Ultra-GPU, verbunden über NVLink-C2C, bietet bis zu 748 GB kohärenten Arbeitsspeicher. Mit 20 Petaflops FP4-Leistung kann das System KI-Modelle mit bis zu einer Billion Parametern verarbeiten.
Die ersten Auslieferungen sind für das vierte Quartal 2026 geplant. Zu den Partnerunternehmen zählen ASUS, Dell, GIGABYTE, HP, MSI und Supermicro. ASUS hat bereits weltweite Bestellungen für sein Modell ExpertCenter Pro ET900N G3 geöffnet, das speziell für das Feintuning großer Sprachmodelle und generative KI optimiert ist. Erste Benchmarks zeigen eine Leistung von 864 Tokens pro Sekunde mit vLLM und Qwen-Modellen.
RTX PRO 6000: Preis und Verfügbarkeit
Die RTX PRO 6000 Blackwell Workstation Edition, die bereits am 18. März 2025 zu einem UVP von 8.565 US-Dollar auf den Markt kam, bleibt das Flaggschiff unter den professionellen Desktop-Beschleunigern. Der Marktpreis hat sich bis Juni 2026 zwischen 8.500 und 9.200 US-Dollar eingependelt. Internationale Händler wie PBTech in Neuseeland listen die 96-GB-GDDR7-Version aktuell für umgerechnet rund 17.500 Euro.
Sie möchten KI-Modelle mit Billionen Parametern lokal betreiben, ohne Cloud-Kosten? In diesem Leitfaden erfahren Sie, wie Sie Ihre Workstation mit Nvidias neuer DGX Station oder RTX PRO 6000 aufrüsten – inklusive MIG-Konfiguration und Firmware-Update. Jetzt kostenlosen Praxis-Leitfaden anfordern
Die technischen Spezifikationen sind beeindruckend: 24.064 CUDA-Kerne und 752 Tensor-Kerne der fünften Generation liefern eine Speicherbandbreite von 1.792 GB/s. Für Multi-GPU-Konfigurationen gibt es eine Max-Q-Edition, die die thermische Verlustleistung von 600 auf 300 Watt halbiert. Systemintegratoren wie VRLA Tech und IBFusion bieten bereits spezialisierte Workstation-Builds an – IBFusion listet eine Dual-GPU-Workstation für 31.649 Euro.
Multi-Instance GPU: Firmware-Update erforderlich
Ein technisches Update vom 1. Juli 2026 beschreibt die Vorteile der Multi-Instance-GPU-Technologie (MIG) für die Blackwell-Profi-Serie. MIG erlaubt die Aufteilung einer GPU in isolierte Hardware-Instanzen mit dedizierten Ressourcen. Die RTX PRO 6000 Blackwell unterstützt bis zu vier Instanzen, die Modelle RTX PRO 5000 und 4500 Server Edition kommen auf zwei.
Allerdings zeigen Berichte aus den Nvidia-Entwicklerforen vom 30. Juni 2026: Einige frühe Workstation-Karten benötigen ein Firmware-Update. Die vBIOS-Version 98.02.52.00.02 ist unter Linux nicht mit MIG kompatibel. Erst ab Version 98.02.55.00.00 verschwindet die Fehlermeldung „Not Supported“.
Software-Optimierungen senken Kosten drastisch
Datenschutzbedenken bei Cloud-KI? Mit der neuen DGX Station für Windows bringen Sie die Rechenleistung eines Rechenzentrums auf den Schreibtisch – und senken gleichzeitig Ihre Betriebskosten. Der Leitfaden zeigt Ihnen die optimale Hardware-Auswahl und Schritt-für-Schritt-Einrichtung. Leitfaden zur lokalen KI-Infrastruktur sichern
Nvidia bestätigte am 30. Juni 2026, dass Full-Stack-Inferenz-Optimierungen die Betriebskosten für Blackwell-Nutzer deutlich gesenkt haben. Bereits einen Monat nach Veröffentlichung des DeepSeek v4-Modells haben Software-Schichten wie Disaggregated Serving und NVFP4-Präzision die Token-Kosten um den Faktor fünf reduziert. Frühanwender wie Baseten und Together AI berichten von einer 20-fachen Durchsatzsteigerung.
Mit der GPU Query Engine (GQE) stellte Nvidia am 1. Juli 2026 zudem eine Referenzarchitektur vor, die für Grace-Blackwell-Hardware optimiert ist. In standardisierten TPC-H-Benchmarks erreicht GQE eine 7,5-fache Beschleunigung gegenüber herkömmlichen CPU-basierten Datenbank-Engines. Die Blackwell-Decompression-Engine verarbeitet Daten mit 400 GB/s und minimiert so Engpässe beim Datentransport.

