Der Cloud-Riese Microsoft vollzieht einen radikalen Strategiewechsel: Statt auf Standard-Hardware von Zulieferern zu setzen, baut der Konzern seine eigenen KI-Chips. Die Maia 200 und der Cobalt 200 Prozessor sollen das Azure-Ökosystem revolutionieren – und die Kosten für generative Künstliche Intelligenz drastisch senken.
Fokus auf die Kostenfalle: Inference statt Training
Die Einführung der Maia 200 im Januar 2026 markiert eine strategische Wende. Während frühere Beschleuniger vor allem das Training großer KI-Modelle im Blick hatten, ist der neue chip für den Dauerbetrieb optimiert: die sogenannte Inference – also das Ausliefern von KI-Ergebnissen an Millionen von Nutzern. Und genau hier liegt das Geld: Inference macht inzwischen den Löwenanteil der laufenden KI-Kosten aus.
Während Microsoft die Hardware-Basis für die nächste KI-Generation schafft, müssen Unternehmen bereits heute die neuen rechtlichen Rahmenbedingungen meistern. Dieser kostenlose Leitfaden bietet Ihnen einen kompakten Überblick über alle Anforderungen, Pflichten und Fristen des EU AI Acts. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt
Microsoft verspricht einen 30 Prozent besseren Performance-pro-Euro-Wert im Vergleich zur bisherigen Infrastruktur. Die Zahlen sind beeindruckend: Mit 10.145 FP4-Teraflops Spitzenleistung soll der Chip dreimal so schnell sein wie Amazons dritte Trainium-Generation. Auch beim acht-Bit-Format (FP8) übertrifft die Maia 200 mit 5.072 Teraflops Googles siebte TPU-Generation.
140 Milliarden Transistoren auf 3 Nanometern
Herzstück der Maia 200 ist die Fertigung bei TSMC auf dem 3-Nanometer-N3P-Prozess. Das Ergebnis: über 140 Milliarden Transistoren – ein gewaltiger Sprung gegenüber den 105 Milliarden des Vorgängers Maia 100. Die zusätzliche Rechenleistung steckt vor allem in verbesserten Speichercontrollern und spezialisierten Recheneinheiten.
Das Speicher-Subsystem wurde komplett neu entwickelt, um den gefürchteten „Memory Wall“-Engpass zu umgehen. 216 Gigabyte HBM3e-Speicher mit einer Bandbreite von 7 Terabit pro Sekunde sowie 272 Megabyte On-Chip-SRAM sorgen dafür, dass selbst die größten Modelle ohne Verzögerung laufen.
Bemerkenswert ist auch die Vernetzung: Statt proprietärer Technik setzt Microsoft auf Standard-Ethernet mit einem eigenen Protokoll namens AI Transport Layer (ATL). Damit lassen sich Cluster mit bis zu 6.144 Beschleunigern steuern – genug für die gigantischen Kontextfenster von Modellen wie OpenAIs GPT-5.2.
Cobalt 200: Der stille Arbeiter im Hintergrund
Während die Maia 200 für KI zuständig ist, übernimmt der Cobalt 200 die allgemeinen Rechenaufgaben in Azure. Der Arm-basierte Prozessor mit 132 Neoverse V3-Kernen wird ebenfalls im 3-Nanometer-Verfahren gefertigt und ist für hochdichte Cloud-Umgebungen optimiert.
Jeder Server-Blade kann zwei unabhängige Systeme beherbergen – das spart Strom und Platz. Besonders clever: Jeder der 132 Kerne kann individuell in seiner Leistung geregelt werden, was eine präzise Temperatursteuerung ermöglicht. Integrierte Flüssigkühlung leitet die Abwärme direkt vom Chip ab, ohne zusätzlichen Wasserverbrauch.
Milliardendeal mit Anthropic?
Die eigentliche Sensation könnte sich jedoch hinter den Kulissen abspielen. Im Mai 2026 verdichten sich Berichte über Verhandlungen zwischen Microsoft und dem KI-Startup Anthropic. Demnach plant Anthropic, Server mit Maia-200-Chips zu mieten, um seine Claude-Modellfamilie zu betreiben.
Die technologische rasanten Entwicklung von KI-Systemen wie Claude oder ChatGPT stellt viele Firmen vor neue Compliance-Fragen. Erfahren Sie in diesem praxisnahen E-Book, welche Risikoklassen und Dokumentationspflichten die EU-KI-Verordnung seit August 2024 für Ihr Unternehmen vorschreibt. Kostenlosen Umsetzungsleitfaden zum EU AI Act sichern
Ein solcher Deal wäre der erste große externe Einsatz der Maia 200 außerhalb von Microsofts eigenen Diensten wie Copilot. Für Anthropic wäre es eine strategische Diversifizierung weg von den überlasteten GPU-Lieferanten. Und für Microsoft der ultimative Härtetest für die eigene Hardware.
CEO Satya Nadella betont jedoch, dass die Eigenentwicklungen keine Abkehr von bestehenden Partnerschaften bedeuten. Microsoft kauft weiterhin große Mengen an Nvidia- und AMD-Chips. Die hauseigenen Chips sind als optimierte Lösung für Massen-Inference gedacht, während GPUs weiterhin das Training übernehmen.
Ausblick: Vom Mittleren Westen in die Welt
Der Rollout der Maia 200 begann im US Central Rechenzentrum nahe Des Moines, Iowa. Als nächstes ist die US West 3 Region in Arizona dran, bevor die Chips weltweit verfügbar sein sollen.
Microsoft hat zudem ein Software Development Kit veröffentlicht, das einen Triton-Compiler, PyTorch-Integration und Zugriff auf die hardwarenahe Programmiersprache umfasst. Entwickler sollen so ihre Modelle optimal an die Architektur der Maia 200 anpassen können.
Die Design-Teams arbeiten bereits an der nächsten Generation. Das Ziel bleibt ein einheitlicher Ansatz aus Silizium, Netzwerk und Software – mit einem klaren Fokus: niedrigere Kosten für KI bei gleichzeitig steigender Leistung. Der Erfolg der aktuellen Generation wird sich daran messen lassen müssen, ob sie ihre Performance-Vorteile unter den immer strengeren Energie-Grenzen moderner Rechenzentren halten kann.

