GPU-Speicher: Rowhammer-Attacken ermöglichen Root-Zugriff

Neue Rowhammer-Angriffe auf GDDR6-Speicher gefährden KI-Modelle, während der HBM-Markt auf 35 Milliarden Dollar wächst.

Während neue Sicherheitslücken in GDDR6-Speicherchips aufgedeckt werden, treiben Hersteller wie NVIDIA und Qualcomm die Entwicklung für KI-Anwendungen mit Milliardenaufwand voran. Aktuelle Untersuchungen und Marktdaten aus dem späten Juni und frühen Juli 2026 zeichnen ein Bild einer Branche im Umbruch.

Rowhammer-Attacken bedrohen GPU-Speicher

Forscher haben ausgeklügelte Angriffsmethoden auf den GDDR6-Videospeicher (VRAM) vieler NVIDIA-Grafikkarten entdeckt. Die als GeForge, GDDRHammer und GPUBreach bekannten Schwachstellen nutzen die Rowhammer-Technik, um durch Bitflips Speicherinhalte zu manipulieren.

Die Ergebnisse sind alarmierend: Tests auf einer NVIDIA RTX 3060 zeigten bis zu 1.171 Bitflips, während die professionelle RTX A6000 immerhin 202 Bitflips verzeichnete. Die Angriffe erfordern zwar lokalen Code-Zugriff, ermöglichen dann aber die Manipulation von GPU-Seitentabellen und potenziell den Zugriff auf den gesamten Systemspeicher.

Besonders brisant: Eine Studie der University of Toronto zu GPUBreach belegt, dass Rowhammer-Techniken sogar eine vollständige Root-Shell auf der CPU ermöglichen – selbst wenn der Input-Output Memory Management Unit (IOMMU)-Schutz aktiv ist. Die Forscher warnen, dass Error Correction Code (ECC) bei mehr als zwei Bitflips versagt. Die Folgen könnten der Diebstahl von Post-Quanten-Kryptografie-Schlüsseln oder die drastische Verschlechterung von KI-Modellen sein – in einem Fall sank die Genauigkeit von 80 Prozent auf null.

Schwachstellen auf Software-Ebene

Neben Hardware-Angriffen gefährden auch Softwarelücken Multi-Tenant-Umgebungen. Mehrere kritische CVEs wurden Ende Juni 2026 bekannt:

  • CVE-2026-53923 (CVSS 5.3): Ein Integer-Überlauf in den vLLM GGUF-Dequantisierungs-Kernels kann zu undichtem GPU-Speicher führen. Bei Modellen mit über 2,1 Milliarden Elementen pro Tensor drohen Datenlecks aus vorherigen Benutzeranfragen.
  • CVE-2026-55407 (CVSS 6.3): Eine Zero-Day-DoS-Schwachstelle in Anthropics Rust-basiertem Protobuf-Paket „buffa“. Laut Forschern von Endor Labs reichen 64 Megabyte Eingabe, um rund 1,4 Gigabyte Heap-Speicher zu belegen.
  • CVE-2026-43503 („DirtyClone“): Diese Linux-Kernel-Lücke erlaubt lokalen Nutzern mit bestimmten Admin-Rechten, Root-Zugriff zu erlangen. Besonders betroffen: Container- und Kubernetes-Umgebungen.

KI-Boom treibt Speichermarkt auf 35 Milliarden Dollar

Anzeige

Wer die neuen Rowhammer-Angriffe auf GDDR6-Speicher für sein Unternehmen bewerten will, findet in diesem kostenlosen Report die wichtigsten Härtungsmaßnahmen – von IOMMU-Konfiguration bis Bitflip-Erkennung. Jetzt kostenlosen Sicherheits-Report anfordern

Die enorme Nachfrage nach KI-Beschleunigern belastet die globale Halbleiter-Lieferkette massiv. Der Verbrauch von High-Bandwidth Memory (HBM) bindet Fertigungskapazitäten und führt zu Engpässen bei DDR5- und GDDR7-Komponenten. Marktdaten zufolge erreicht der HBM-Markt 2026 rund 35 Milliarden Dollar – mit Prognosen von 100 Milliarden Dollar bis 2028. Marktführer ist SK Hynix mit einem Anteil zwischen 50 und 62 Prozent, gefolgt von Samsung und Micron.

Hersteller reagieren mit Designänderungen

Um Produktionskomplexität und geopolitischen Beschränkungen zu begegnen, passen die Hersteller ihre Hardware an:

  • NVIDIA Rubin Ultra: Der Konzern wechselte von einem Vier-Die- zu einem Zwei-Die-Design. Grund sind Fertigungsprobleme bei CoWoS-L (Chip on Wafer on Substrate). Die Zahl der HBM4E-Module sinkt von 16 auf 8, die Rechenleistung auf Board-Ebene soll erhalten bleiben.
  • China-Export-Compliance: Für den chinesischen Markt entwickelt NVIDIA den B40 (RTX Pro 6000D). Er nutzt GDDR7 statt HBM und erreicht nur 1,7 bis 1,8 TB/s Bandbreite – deutlich weniger als die 8 TB/s des B200.
  • Qualcomms AI250: Der Chipkonzern plant einen eigenen KI-Beschleuniger mit High-Bandwidth Compute (HBC) und gestapeltem DRAM. Erwartet werden 768 Gigabyte Speicher und eine effektive Bandbreite von 133 TB/s.

Software optimiert vorhandene Architekturen

Neben Hardware-Updates treiben neue Software-Engines die Leistung bestehender Systeme. NVIDIAs GPU Query Engine (GQE) nutzt die Grace-Blackwell-Plattform, HBM und NVLink-C2C, um SQL-Operationen zu beschleunigen. Benchmarks vom späten Juni 2026 zeigen einen 7,5-fachen Geschwindigkeitsvorteil gegenüber CPU-basierten Datenbanken im TPC-H SF1000-Test. Die Engine reduziert durch hybride Kompression und Partition-Pruning den internen Datenverkehr um 31 Prozent.

Anzeige

Bereits 1.171 Bitflips auf einer RTX 3060 – und Root-Zugriff trotz IOMMU-Schutz. Bevor Ihre KI-Modelle unbrauchbar werden oder Post-Quanten-Schlüssel gestohlen werden, brauchen Sie einen klaren Abwehrplan. Dieser Leitfaden liefert Checkliste und Tools zur Erkennung. GPU-Abwehrplan jetzt sichern

CPUs als GPU-Alternative?

Während GPUs dominieren, melden sich kritische Stimmen aus der High-Performance-Computing-Community. Moderne CPUs mit spezialisierten Matrix-Einheiten und HBM – wie im LineShine-Supercomputer – könnten langfristig eine ernstzunehmende Alternative für komplexe Berechnungen bieten. Ob sie die GPU-Dominanz brechen, bleibt abzuwarten.