Trotz massiv gesunkener Preise pro Recheneinheit haben mehrere Großkunden ihre kompletten KI-Budgets für 2026 bereits im ersten Quartal aufgebraucht, wie OpenAI-CEO Sam Altman auf einer Branchenkonferenz am Donnerstag einräumte.
Teurer Fortschritt: Warum günstigere KI trotzdem mehr kostet
Der Preisverfall ist atemberaubend: Seit Ende 2022 sind die Kosten pro Million sogenannter Tokens – der grundlegenden Recheneinheit für KI-Modelle – um 98 Prozent gesunken, von 20 Dollar auf rund 0,40 Dollar. Doch der Haken liegt im Verbrauch. Die neuen „agentischen“ KI-Systeme wie GPT-5.1 oder Gemini 3 Pro verschlingen im Schnitt 18,6 Mal mehr Tokens als ihre Vorgänger.
Anzeige: Wer sein KI-Budget bereits im ersten Quartal aufgebraucht hat, braucht jetzt eine klare Strategie. Dieser Report zeigt, wie Sie mit AI-FinOps die Kostenexplosion stoppen und Ihre Planung für 2026 absichern. Jetzt kostenlosen Budget-Report anfordern
Die Folge: Die durchschnittlichen KI-Budgets in Unternehmen explodierten von 1,2 Millionen Dollar (rund 1,1 Millionen Euro) im Jahr 2024 auf etwa 7 Millionen Dollar (rund 6,4 Millionen Euro) im laufenden Jahr. Ein Anstieg, der selbst erfahrene IT-Planer überrascht hat.
Budget-Notstand: Unternehmen reagieren mit drastischen Maßnahmen
Der Finanzdruck zwingt selbst die Tech-Giganten zum Umdenken. Der Fahrdienstleister Uber hatte sein KI-Budget bereits im April aufgebraucht. Microsoft hat intern Entwickler-Lizenzen für das Tool Claude Code wieder entzogen, um Kosten zu kontrollieren. Bei der Reiseplattform Priceline haben sich die Vertragskosten für KI-Dienste vervier- bis verfünffacht.
Die Zahlen der FinOps Foundation bestätigen den Trend: 73 Prozent aller Unternehmen melden, dass ihre KI-Ausgaben die ursprünglichen Prognosen für dieses Jahr überschreiten. Besonders brisant: Während die Durchschnittskosten pro Million Tokens im Jahresvergleich um 67 Prozent fielen, stiegen die Ausgaben derjenigen, die Spitzenmodelle nutzen, um 87 Prozent.
Die Reaktion der Branche ist deutlich. Amazon-Vizepräsident Dave Treadwell riet seinen Mitarbeitern kürzlich, KI nicht mehr wahllos für jede Aufgabe einzusetzen. Der Konzern hat sogar interne Bestenlisten abgeschafft, die den Token-Verbrauch verfolgten. Stattdessen führen Unternehmen sogenannte „AI-FinOps“-Teams ein, die den Verbrauch überwachen, Budgets pro Abteilung festlegen und bei Überschreitung automatisch drosseln.
Rekordinvestitionen: Der Hunger nach Rechenleistung treibt die Kosten
Die Nachfrage nach Rechenpower treibt die Investitionen in schwindelerregende Höhen. Alphabet, der Mutterkonzern von Google, hat kürzlich einen Aktienverkauf über 80 Milliarden Dollar gestartet, um KI-Infrastruktur zu finanzieren. Die erste Tranche von 40 Milliarden Dollar war Berichten zufolge überzeichnet. Insgesamt erwartet der Konzern für 2026 KI-bedingte Investitionsausgaben zwischen 180 und 190 Milliarden Dollar.
Ein besonders spektakulärer Deal zeigt die Knappheit moderner Chips: Google zahlt dem Raumfahrtunternehmen SpaceX monatlich 920 Millionen Dollar – umgerechnet rund 845 Millionen Euro – für den Zugriff auf etwa 110.000 Nvidia-Grafikprozessoren. Der Vertrag läuft bis Mitte 2029.
TSMC-Chef C.C. Wei warnte am Donnerstag, dass die Chip-Knappheit noch Jahre andauern werde. Der taiwanesische Halbleiterhersteller plant für die zweite Jahreshälfte Preiserhöhungen von bis zu 15 Prozent für seine fortschrittlichsten 3-Nanometer-Chips.
Energie als neuer Engpass: Umweltkonflikte verzögern Projekte
Auch die Energieversorgung wird zum kritischen Faktor. SpaceX und das KI-Unternehmen xAI haben über 2,8 Milliarden Dollar in Gasturbinen investiert, um eigene Rechenzentren zu betreiben – ein Schritt, der bereits zu Klagen von Umweltgruppen geführt hat. Rund 64 Milliarden Dollar an Rechenzentrumsprojekten liegen derzeit aufgrund von Protesten und Engpässen in den lokalen Stromnetzen auf Eis.
Anzeige: 73 Prozent aller Unternehmen überschreiten ihre KI-Budget-Prognosen – Tendenz steigend. Bevor agentische Systeme Ihre Ausgaben vervielfachen, sichern Sie sich die 5 entscheidenden Hebel zur Budget-Planung. KI-Budget-Hebel jetzt sichern
Neue Regeln für die Token-Wirtschaft
Die fehlende Transparenz bei Preisen und Managementstandards hat nun die Linux Foundation auf den Plan gerufen. Sie will im Juli 2026 die „Tokenomics Foundation“ gründen, die Branchenstandards für Kosten etablieren soll.
Die Analysten von Goldman Sachs erwarten, dass die globale Token-Nachfrage bis 2030 um das 24-fache steigen wird – auf monatlich 120 Trillionen Tokens. Viele IT-Verantwortliche setzen angesichts dieser Entwicklung inzwischen auf gezielte Anwendungen mit klarem Return on Investment, etwa bei Testautomatisierung oder im Helpdesk, statt KI flächendeckend in allen Bereichen einzusetzen.

