OpenAI senkt KI-Kosten um 50%: ChatGPT läuft auf 200 GPUs

OpenAI reduziert Hardwarebedarf drastisch und präsentiert drei neue Modelle. Die US-Regierung prüft die Veröffentlichung von GPT-5.6.

Borncity Redaktion • 30.06.2026, 23:26 Uhr

Das Unternehmen kann damit den öffentlichen ChatGPT-Verkehr mit nur noch rund 200 Grafikprozessoren (GPUs) bewältigen – ein massiver Rückgang der Hardware-Anforderungen.

Software-Optimierung statt neuer Hardware

Die Effizienzsteigerung gelang den Ingenieuren durch systemseitige Software-Verbesserungen, nicht durch neue Hardware. Durch die bessere Auslastung bestehender Server sinkt der Rechenaufwand für die Verarbeitung von Informationen drastisch. Diese internen Optimierungen sind Teil einer umfassenderen Strategie: OpenAI peilt bis Jahresende eine Bruttomarge von 52 Prozent an.

Der sinkende GPU-Bedarf für den öffentlichen Verkehr zeigt: Das Unternehmen findet Wege, seine Dienste nachhaltiger zu skalieren. Und das zu einer Zeit, in der die Betriebskosten in der gesamten Branche weiter steigen.

GPT-5.6-Familie: Drei Modelle für verschiedene Ansprüche

Parallel zu den Effizienz-Durchbrüchen hat OpenAI die Modellfamilie GPT-5.6 vorgestellt. Sie umfasst drei Versionen: Sol, Terra und Luna. Die Modelle wurden Ende Juni 2026 angekündigt, die vollständige öffentliche Veröffentlichung verzögert sich jedoch. Grund ist eine Prüfungsanfrage der US-Regierung, die auf eine Executive Order vom 2. Juni zurückgeht.

Während Profi-Modelle wie Sol immer komplexer werden, wissen viele Nutzer noch gar nicht, wie sie die bereits verfügbaren KI-Tools richtig einsetzen. Dieser kostenlose Ratgeber zeigt Ihnen, wie Sie ChatGPT sofort effektiv für Ihren Alltag nutzen können – ganz ohne Vorkenntnisse. Kostenlosen PDF-Report mit fertigen Anleitungen und Prompts sichern

Die neuen Modelle decken unterschiedliche Leistungs- und Budgetanforderungen ab:

Sol: Das Flaggschiff für komplexe Aufgaben und Cybersicherheit. Es erreichte 88,8 Prozent auf TerminalBench 2.1 – im Ultra-Modus sogar 91,9 Prozent. Preis: rund 5 Euro pro Million Input-Token und 30 Euro pro Million Output-Token.
Terra: Die Mittelklasse, die Leistung und Kosten ausbalanciert. Sie soll die Leistung des Vorgängers GPT-5.5 zum halben Preis bieten: 2,50 Euro für Input, 15 Euro für Output pro Million Token.
Luna: Die günstigste und schnellste Variante für latenzarme Anwendungen. Preise: 1 Euro für Input, 6 Euro für Output pro Million Token.

Der Zugang ist derzeit auf eine begrenzte Vorschau mit rund 20 Organisationen und staatlich geprüften Partnern beschränkt. Die 30-tägige Prüfungsphase der Regierung konzentriert sich auf Cybersicherheitsrisiken und potenzielle Gefahren durch hoch entwickelte Reasoning-Fähigkeiten.

Unternehmen unter Kostendruck

Der Vorstoß zu effizienteren Modellen kommt nicht von ungefähr. Viele Unternehmen geraten durch die Einführung von KI zunehmend unter finanziellen Druck. Einige Großkonzerne wie Uber haben Berichten zufolge ihr gesamtes KI-Budget für 2026 bereits in den ersten vier Monaten des Jahres aufgebraucht. Die Folge: ein breiter Markttrend hin zu günstigeren Optionen.

Ob Urlaubsplanung oder Zeitersparnis bei Routineaufgaben – die praktischen Möglichkeiten von KI-Modellen wie ChatGPT sind bereits heute enorm. Entdecken Sie in diesem neuen Gratis-Report die einfachsten ChatGPT-Befehle, die Ihren Alltag sofort spürbar erleichtern. Jetzt Gratis-Report mit den besten KI-Tricks herunterladen

Marktdaten vom Juni zeigen: Open-Source-Modelle auf der Plattform OpenRouter steigerten ihren Anteil am Token-Verkehr auf 65 Prozent – im Januar waren es noch 34 Prozent. Um Kosten weiter zu senken, setzen einige Entwickler bei OpenAI, Nvidia und GitHub auf ein Plugin namens Caveman. Es zwingt große Sprachmodelle zu kürzeren, präziseren Antworten und reduziert so den Token-Verbrauch.

Die steigenden Kosten wirken sich auch auf Unternehmenspartnerschaften aus. Amazon prüft offenbar den Einsatz von OpenAIs Modellen sowie der eigenen Nova-Modelle für interne Aufgaben – während die Preise für Anthropics Claude-Modelle steigen. Dies geschieht, obwohl Amazon über acht Milliarden Euro in Anthropic investiert hat. Der internationale Wettbewerb verschärft sich zusätzlich: Chinesische Modelle wie DeepSeek bieten ihre Dienste zu deutlich niedrigeren Preisen als hochpreisige westliche Alternativen an.

Software-Optimierung statt neuer Hardware

GPT-5.6-Familie: Drei Modelle für verschiedene Ansprüche

Unternehmen unter Kostendruck

Ähnliche Beiträge

ChatGPT Work: OpenAI startet Unternehmensplattform in Australien

EU-KI-Verordnung: Kennzeichnungspflicht ab 2. August 2026

Rechtsberatung in Minuten: KI verkürzt Vertragsprüfung von 8 auf 0,08 Tage

Claude Code 2.1.216: Anthropic schließt zwei Sicherheitslücken

KI-Infrastruktur: Deutschland braucht viermal mehr Rechenleistung bis 2030

KI-Integration: 95 Prozent aller Pilotprojekte scheitern ohne Personal