AMD Instinct MI350P: Neuer KI-Beschleuniger fordert Nvidia heraus

AMD stellt den KI-Beschleuniger Instinct MI350P vor, der Nvidia Paroli bieten soll. Branchenweite Speicherengpässe überschatten den Launch.

AMD hat am 7. Mai 2026 seinen neuesten KI-Beschleuniger für Unternehmen vorgestellt – und zielt damit direkt auf Nvidias Vormachtstellung. Die Instinct MI350P PCIe ist speziell für die wachsenden Anforderungen moderner KI-Inferenz und sogenannter RAG-Pipelines (Retrieval-Augmented Generation) optimiert. Der Launch kommt zu einem Zeitpunkt, an dem die gesamte Branche unter massiven Speicher-Engpässen leidet.

Architektur für die nächste KI-Welle

Die MI350P basiert auf AMDs CDNA4-Architektur und kombiniert TSMCs 3nm- mit 6nm-Fertigungstechnologie. Mit 128 Compute Units und einer thermischen Verlustleistung von 600 Watt ist das kein Leichtgewicht. Das Herzstück: 144 GB HBM3E-Speicher – eine Konfiguration, die den wachsenden Speicherbandbreiten-Anforderungen großer Sprachmodelle gerecht wird.

Anzeige

Während die Hardware-Leistung rasant steigt, rücken auch die rechtlichen Leitplanken für Unternehmen immer näher. Dieser kostenlose Leitfaden hilft Ihrer IT- und Rechtsabteilung, die komplexen Anforderungen der neuen EU-KI-Verordnung in nur fünf Schritten zu verstehen. EU AI Act in 5 Schritten verstehen: Jetzt kostenlosen Überblick sichern

In den Benchmarks zeigt AMD klare Kante: Bei FP16- und FP8-Operationen liefert die MI350P rund 40 Prozent mehr Leistung als Nvidias H200 NVL. Ein entscheidender Vorteil für Unternehmen, die KI-Modelle mit internen Datenbanken verknüpfen wollen – genau das ist der Kern von RAG-Pipelines.

Am selben Tag kündigte auch Micron Neues an: Die Auslieferung der 245 TB 6600 ION SSD hat begonnen. Es ist aktuell die größte kommerziell verfügbare SSD für Rechenzentren – perfekt abgestimmt auf die hohen Speicheranforderungen von KI-Beschleunigern wie der MI350P.

„RAMageddon“ – die Speicherkrise trifft die Branche

Die Einführung neuer KI-Hardware fällt in eine Zeit, die Analysten längst „RAMageddon“ getauft haben. Hersteller verlagern ihre Fertigungskapazitäten massiv von Consumer-Elektronik hin zu margenstarken KI-Komponenten. Die Folgen sind dramatisch:

  • Samsung hat seine Speicherkapazitäten bereits für das gesamte Jahr 2026 ausverkauft
  • Gartner prognostiziert einen Rückgang des PC-Marktes um 10 Prozent für 2026
  • AMDs Gaming-Sparte erwartet im zweiten Halbjahr 2026 einen Umsatzrückgang von 20 Prozent

AMD selbst spürt den Gegenwind: Zwar legte der Umsatz im ersten Quartal 2026 auf 10,25 Milliarden US-Dollar zu – ein Plus von 38 Prozent im Jahresvergleich. Doch die Versorgung mit HBM3E-Speicher bleibt der kritische Faktor für den Erfolg der MI350P.

Selbst Apple musste reagieren: Anfang der Woche stellte der Konzern bestimmte Mac-Stuido-Konfigurationen mit hohem Arbeitsspeicher ein – die Lieferengpässe sind einfach zu groß.

Strategische Neuausrichtung: Produktion vor Ort

Der Hunger nach KI-Rechenleistung zwingt die Industrie zum Umdenken. Immer mehr Unternehmen setzen auf regionale Produktion, um ihre Lieferketten zu sichern.

SoftBank verhandelt mit Nvidia und Foxconn über den Bau eigener KI-Server in Japan. Das Projekt soll bis Ende des Jahrzehnts eine lokale Produktionslinie aufbauen – ein zentraler Punkt des neuen Managementplans, den SoftBank ab dem 11. Mai vorstellen will.

SpaceX treibt derweil ein ambitioniertes Projekt in Texas voran: Die sogenannte „Terafab“ in Grimes County soll für umgerechnet rund 106 Milliarden Euro Chips für KI-Server, Satelliten und autonome Fahrzeuge produzieren. Partner könnten Intel und Tesla sein. Die erste Phase ist mit rund 49 Milliarden Euro veranschlagt, eine öffentliche Anhörung ist für den 3. Juni angesetzt.

Anzeige

Der Einsatz neuer KI-Systeme in Unternehmen bringt nicht nur technische Herausforderungen, sondern auch weitreichende Dokumentationspflichten mit sich. Erfahren Sie in diesem Experten-Report, welche KI-Anwendungen als Hochrisiko eingestuft werden und wie Sie empfindliche Strafen proaktiv vermeiden. Kostenlosen Umsetzungsleitfaden zum EU AI Act hier herunterladen

Auch Nvidia investiert massiv in die heimische Produktion: 2,9 Milliarden Euro fließen in eine Partnerschaft mit Corning. Drei neue Fertigungsstätten in North Carolina und Texas sollen die optische KI-Infrastruktur der nächsten Generation aufbauen.

Wettbewerb auf allen Ebenen

Die MI350P betritt einen Markt, der zunehmend mit spezialisierten Chips gefüllt wird. Google hat im Frühjahr seine neue TPU-Generation vorgestellt: Die TPU 8t trainiert mit bis zu 9.600 Chips pro Pod, die TPU 8i fokussiert auf Inferenz. Mit eigenen Axion-CPUs entfernt sich Google weiter von der x86-Architektur – ein klares Signal für den Trend zu maßgeschneiderter Silizium-Hardware.

Auch Europa mischt mit: Semidynamics und SiPearl haben am 8. Mai eine strategische Partnerschaft für eine europäische KI-Compute-Plattform angekündigt. Die Kombination aus Arm-basierten CPUs und RISC-V-Beschleunigern soll eine energieeffiziente Alternative für Cloud-Inferenz bieten.

Die Software-Seite kommt nicht zu kurz: Zyphra veröffentlichte am 7. Mai ZAYA1-8B, ein Mixture-of-Experts-Sprachmodell, das auf einem cluster mit 1.024 AMD MI300x-Knoten trainiert wurde. Solche Modelle beweisen, dass AMDs Ökosystem für das Training leistungsfähiger KI-Modelle taugt – eine gute Basis für die MI350P.

Ausblick: Inferenz als neues Schlachtfeld

Mit der MI350P setzt AMD auf hocheffiziente Inferenz als neues Hauptschlachtfeld. Unternehmen bewegen sich weg von der reinen Trainingsphase hin zum Betrieb von RAG-basierten Diensten. Der Bedarf an speicherstarken, bandbreitenintensiven Beschleunigern wird weiter steigen.

Doch der Schatten von „RAMageddon“ bleibt. Solange Speicherlieferanten ausgelastet sind und selbst Apple und AMD ihre Erwartungen für Consumer-Produkte nach unten korrigieren müssen, bleibt die Frage: Kann die Industrie den Hunger nach KI-Chips überhaupt stillen? Die kommenden Wochen werden zeigen, ob Softbanks Managementplan am 11. Mai neue Wege aufzeigt – und ob SpaceX seine Mammut-Pläne in Texas realisieren kann. Eines steht fest: AMDs MI350P ist eine ernsthafte Kampfansage an den Status quo.