GPT-5.4: OpenAI setzt mit autonomer KI neue Maßstäbe

OpenAI stellt mit GPT-5.4 ein KI-Modell vor, das eigenständig Computeranwendungen bedienen kann und in Benchmarks menschliche Leistungen übertrifft. Es kombiniert Text- und Codegenerierung für den professionellen Einsatz.

OpenAI hat mit GPT-5.4 ein neues KI-Flaggschiff für den professionellen Einsatz vorgestellt. Das Modell vereint erstmals Text- und Code-Generierung und bringt bahnbrechende Fähigkeiten zur direkten Steuerung von Computern mit. Damit will das Unternehmen seine Führungsposition im hart umkämpften Markt für Unternehmens-KI zurückerobern.

Anzeige

Während neue KI-Modelle die Computersteuerung revolutionieren, ist eine solide Basis am eigenen PC wichtiger denn je. Dieser kostenlose Gratis-Report zeigt Ihnen, wie Sie ohne Risiko auf das aktuelle Betriebssystem wechseln und Ihre Daten sicher übernehmen. Windows 11 Komplettpaket jetzt kostenlos sichern

Autonome Agenten steuern den Desktop

Die größte Neuerung ist die native Computer-Use-Fähigkeit. GPT-5.4 kann eigenständig Desktop-Anwendungen bedienen – es schreibt ausführenden Code, gibt Tastaturbefehle und steuert einen virtuellen Mauszeiger. In Tests zur Navigation in Betriebssystemen erreichte das Modell eine Erfolgsquote von 75 Prozent. Das übertrifft nicht nur den Vorgänger (47,3 %), sondern auch den menschlichen Durchschnitt von 72,4 Prozent.

„Diese agentischen Workflows sind ein Quantensprung“, kommentiert ein Branchenbeobachter. Entwickler könnten nun Systeme bauen, die mit minimalem menschlichem Eingriff andere Software steuern. Auf führenden Benchmark-Ranglisten für professionelle Dienste belegt GPT-5.4 bereits die Spitzenposition.

KI als Assistent für Büro und Analyse

OpenAI hat das Modell gezielt für klassische Büroaufgaben optimiert. Bei der Erstellung von Finanzmodellen in Tabellenkalkulationen erreicht GPT-5.4 eine Erfolgsquote von 87,3 Prozent – ein deutlicher Sprung gegenüber 68 Prozent beim Vorgänger. Eine spezielle Sidebar-Erweiterung integriert die KI direkt in Tabellenprogramme.

Anzeige

Moderne KI-Tools steigern die Effizienz, doch die grundlegende Struktur am Arbeitsplatz bleibt entscheidend für den Erfolg. Erfahren Sie in diesem kostenlosen Leitfaden, wie Sie Ihr Dokumentenmanagement digitalisieren und Papierstapel endgültig besiegen. 5 Profi-Tricks für Ihre Büroorganisation herunterladen

Der erweiterte Kontextfenster von einer Million Tokens ermöglicht es, extrem lange Dokumente und komplexe Datensätze in einer einzigen Anfrage zu verarbeiten. Die multimodale Architektur verknüpft Text- und Bildeingaben für tiefgehende Analysen. Bei der Erstellung von Präsentationen lobten Tester die visuelle Vielfalt und ästhetische Qualität der Ergebnisse.

Mehr Fakten, mehr Sicherheit?

Das Unternehmen betont, GPT-5.4 sei sein „faktischstes Modell“ bisher. Die Rate falscher Einzelaussagen sei im Vergleich zu GPT-5.2 um 33 Prozent gesenkt, vollständige Antworten enthielten 18 Prozent weniger Fehler.

Parallel zur Leistungssteigerung rollte OpenAI erweiterte Sicherheitsprotokolle aus. Dazu gehören neue Monitoring-Tools, die prüfen, ob das Modell seine Denkprozesse zu verschleiern versucht. Erste Untersuchungen deuten auf eine geringe Fähigkeit dazu hin – ein positives Signal für die Kontrolle autonomer Agenten, so Experten. Für Hochrisiko-Aktivitäten auf bestimmten Oberflächen blockiert das System Anfragen komplett.

Kampfansage an die Konkurrenz

Das Update kommt zu einem kritischen Zeitpunkt für OpenAI. Nach umstrittenen Verträgen mit dem US-Verteidigungsministerium verlor die Plattform etwa 1,5 Millionen Nutzer. Konkurrent Anthropic, der militärische Anwendungen öffentlich ablehnt, gewann hingegen an Boden.

Mit GPT-5.4 kontert OpenAI direkt. Die aggressive Preisgestaltung von 2,50 Euro pro Million Eingabe-Tokens und 15 Euro für die Ausgabe setzt den Wettbewerb unter Druck. Der neue „Thinking Mode“, der Anpassungen des Aktionsplans während der Antwort erlaubt, zielt genau auf die komplexen Anforderungen von Forschung und Software-Entwicklung ab.

Die Einführung markiert eine Beschleunigung hin zu vollautonomen KI-Agenten. Ob OpenAIs Leistungsstärke und Kampfpreise die Reputationsschäden ausgleichen können, wird sich in den kommenden Monaten zeigen. Sicherheitsforscher kritisieren indes, dass vor dem Start keine umfassenden öffentlichen Sicherheitstests stattfanden.