OpenAI senkt Inferenzkosten um über 50%: Weg aus der Verlustfalle

ChatGPT knackt eine Milliarde monatliche Nutzer, während OpenAI mit hohen Verlusten kämpft und die Kosten durch Effizienzsteigerungen drastisch senkt.

Der KI-Pionier OpenAI hat einen Meilenstein erreicht: ChatGPT verzeichnete im Juni 2026 eine Milliarde monatliche App-Nutzer. Doch hinter dem Wachstum stehen massive Verluste und ein Wettlauf um Effizienz.

Rund 900 Millionen wöchentliche Nutzer zählt die Plattform inzwischen. Die Zahlen sind beeindruckend – doch sie kaschieren nicht die finanziellen Herausforderungen. Bei einem Umsatz von 13,07 Milliarden Dollar im Jahr 2025 fuhr das Unternehmen einen Nettoverlust von 21 Milliarden Dollar ein. Eine Finanzierungsrunde über 122 Milliarden Dollar brachte zuletzt eine Bewertung von 852 Milliarden Dollar.

Effizienzrevolution senkt Kosten drastisch

Die hohen Infrastrukturkosten zwingen OpenAI zum Handeln. Im Juni 2026 führte das Unternehmen interne Software-Optimierungen durch, die die sogenannten Inferenzkosten um mehr als die Hälfte senkten. Techniken wie Quantisierung, In-Flight-Batching und Query-Routing machten es möglich.

Das Ergebnis ist beachtlich: Für die kostenlose Nutzerstufe sank der Hardwarebedarf von Zehntausenden GPUs auf rund 200 Einheiten. Bis Ende 2026 peilt OpenAI eine API-Bruttomarge von 52 Prozent an – ein deutlicher Sprung von 39 Prozent im ersten Quartal des Jahres.

Ein eigener Prozessor mit dem Codenamen „Jalapeño“ wurde am 24. Juni 2026 fertiggestellt. Entwickelt mit Broadcom, soll der Chip noch in diesem Jahr erstmals zum Einsatz kommen.

Neue Funktionen für Profis und Schwellenländer

Anzeige

Während OpenAI die Effizienz seiner Modelle massiv steigert, nutzen immer mehr Menschen ChatGPT für ihre tägliche Organisation. Wie Sie die KI ohne Vorkenntnisse für Aufgaben wie Reiseplanung oder Sprachenlernen einsetzen, zeigt dieser kostenlose Ratgeber. ChatGPT als Alltagshelfer: Gratis-Report mit fertigen Prompts sichern

Mit „Dreaming V3″ erhielten Plus- und Pro-Abonnenten Anfang Juni eine bemerkenswerte Neuerung: Die KI kann in Leerlaufphasen Informationen bündeln und Gedächtnisstrukturen aufbauen, die sie später proaktiv in Gespräche einbringt.

Gleichzeitig drängt OpenAI nach Südasien. Am 3. Juli startete das Unternehmen einen 30-tägigen KI-Lernplan für indische Fachkräfte. Der Fokus liegt auf Grundlagen, Aufgabenautomatisierung mit dem Codex-Tool und der Erstellung visueller Fallstudien. Seit Januar 2026 hat sich die Nutzung von Codex in Indien ver27facht.

Unternehmenskunden und regulatorische Hürden

Die Partnerschaft mit HP zeigt, wohin die Reise geht. Die „Frontier“-Initiative soll KI in HPs interne Abläufe und Partnerdienste integrieren. Erste Ergebnisse sind vielversprechend: Ein Ingenieur bearbeitete innerhalb weniger Wochen 122 Pull-Requests in Dutzenden Projekten. Ein Sicherheitsteam löste Bugs an einem Tag, die zuvor auf einen Monat geschätzt wurden.

Anzeige

Die rasante Integration von KI in Unternehmensprozesse erfordert nicht nur technisches Know-how, sondern auch die Einhaltung neuer gesetzlicher Vorgaben. Dieser Praxisleitfaden hilft Verantwortlichen, die Anforderungen der EU-KI-Verordnung sicher umzusetzen. Kostenloses E-Book zum EU AI Act jetzt herunterladen

Doch das Wachstum ruft die Behörden auf den Plan. Ein Bündnis US-amerikanischer Generalstaatsanwälte forderte OpenAI am 12. Juni mit einer umfassenden Vorladung. Hintergrund sind Ermittlungen, die auch durch eine Klage des Bundesstaats Florida vom 1. Juni 2026 angefacht wurden. Florida wirft dem Unternehmen vor, Kindern geschadet zu haben.

Börsengang verschoben

OpenAI reichte zwar am 8. Juni 2026 vertraulich die Unterlagen für einen Börsengang ein. Doch Branchenbeobachter rechnen frühestens 2027 mit dem Listing. Schuld sind die laufenden Untersuchungen – und eine Aufforderung der US-Regierung, die öffentliche Einführung des Modells GPT-5.6 zu verlangsamen, um Sicherheitsprüfungen zu ermöglichen.