Claude Opus 4.8: Anthropic überholt Konkurrenz mit 69,2%

Die jüngste Welle an KI-Veröffentlichungen sprengt bisherige Leistungsgrenzen – und stellt Unternehmen vor neue Sicherheitsfragen.

Anthropic und Alibaba liefern sich Wettrennen an der Spitze

Anthropic hat Ende Mai 2026 sein neues Flaggschiff-Modell Claude Opus 4.8 vorgestellt. Die Software glänzt besonders bei komplexen Denkaufgaben, Finanzanalysen und der Interaktion mit Computern. Im wichtigen Programmier-Benchmark SWE-Bench Pro erreichte das Modell beeindruckende 69,2 Prozent – eine deutliche Steigerung gegenüber dem Vorgänger mit 64,3 Prozent. Damit lässt Claude Opus 4.8 die Konkurrenz von GPT-5.5 (58,6 Prozent) und Gemini 3.1 Pro (54,2 Prozent) hinter sich.

Angesichts der rasanten Entwicklung neuer KI-Modelle wird der proaktive Schutz vor digitalen Bedrohungen für Firmen immer wichtiger. Dieser kostenlose Report klärt auf, welche neuen Cyberrisiken und gesetzlichen Pflichten Unternehmer jetzt kennen müssen. Gratis-E-Book: Cyberrisiken durch KI abwenden

Zu den technischen Neuerungen gehören Dynamic Workflows, Effort Control und ein Fast Mode, der 2,5-mal schneller arbeitet als frühere Versionen. Besonders bemerkenswert: Interne Tests zeigen, dass das Modell viermal seltener Fehler im Code übersieht. Die Preise bleiben stabil bei fünf Euro pro Million Input-Tokens und 25 Euro pro Million Output-Tokens.

Nur drei Tage später zog Alibaba Cloud nach. Am 28. Mai 2026 veröffentlichte der chinesische Konzern Qwen3.7-Max. Das Modell belegt aktuell Platz vier der globalen Code-Arena-Rangliste mit 1.541 Punkten. Entwickler berichten, dass die Software bis zu 35 Stunden autonom arbeiten und über 1.000 Werkzeug-Interaktionen bewältigen kann.

KI-Agenten täuschen Menschen immer häufiger

Forscher der UC San Diego haben im Frühjahr 2026 eine Studie veröffentlicht, die zeigt: KI-Modelle werden immer besser darin, bei digitalen Gesprächen als Menschen durchzugehen. Die im Fachjournal PNAS veröffentlichte Untersuchung ergab, dass GPT-4.5 in 73 Prozent der Fälle als menschlich eingestuft wurde – vorausgesetzt, die KI nutzte eine bestimmte Persönlichkeitsvorlage bei Gesprächen von fünf bis 15 Minuten Dauer.

Andere Modelle schnitten schwächer ab: LLaMa-3.1-405B wurde in 56 Prozent der Fälle für menschlich gehalten. Ohne Persönlichkeitsvorlage sank die Erfolgsquote auf 36 Prozent. Die Forscher warnen vor den Risiken für digitalen Betrug und automatisierte Täuschung.

Während KI-Systeme immer menschenähnlicher agieren, verschärft die EU die Regeln für deren Einsatz in Unternehmen massiv. Sichern Sie sich diesen kompakten Leitfaden, um alle Anforderungen und Fristen des EU AI Acts rechtssicher umzusetzen. Kostenlosen Umsetzungsleitfaden zur KI-Verordnung herunterladen

Im Konsumentenmarkt sorgt derweil das Startup Sesame für Aufsehen. Gegründet von ehemaligen Oculus-Führungskräften, brachte das Unternehmen am 28. Mai 2026 eine iOS-App auf den Markt. Sie bietet vier KI-Agenten mit eigenen Stimmen und Persönlichkeiten: Maya, Miles, Simone und Charlie. Nach einer Series-B-Finanzierung von 250 Millionen Euro durch Sequoia plant Sesame den Android-Start und will 2027 KI-integrierte Datenbrillen auf den Markt bringen.

Sicherheitslücken: Mehrere Angriffe, größere Gefahr

Trotz aller Fortschritte bleiben die Modelle anfällig. Eine Studie von Cisco vom 28. Mai 2026 zeigt, dass sogenannte Multi-Turn-Angriffe – bei denen Angreifer mehrere aufeinanderfolgende Eingaben nutzen statt einer einzelnen – hochwirksam sind. Getestet wurden 15 Modelle von OpenAI, Anthropic, Google und xAI.

Die Ergebnisse sind alarmierend: Bei GPT-5.4 stieg die Erfolgsrate von 2,74 Prozent bei Einzelangriffen auf 24,68 Prozent bei Mehrfachangriffen. Gemini 3 Pro verzeichnete einen Anstieg von 18,10 auf 73,35 Prozent. Grok 4.1 Fast erreichte sogar 88,30 Prozent Erfolgsquote.

Die Sicherheitsbranche reagiert. Orchid Security erweiterte seine Plattform zur Verwaltung von „nicht-menschlichen“ Konten – rund 67 Prozent dieser Konten sind derzeit ungeschützt. Das französische Startup Edamame brachte am 28. Mai 2026 ein Echtzeit-Sicherheitssystem auf den Markt, das „Code-Drift“ erkennt und verhindern soll, dass KI-Programmieragenten durch Lieferkettenangriffe oder Token-Diebstahl kompromittiert werden.

Milliarden fließen in KI-Startups

Die rasante Entwicklung treibt auch die Finanzierungsrunden an. Cognition AI, Entwickler des autonomen Programmieragenten Devin, sammelte am 28. Mai 2026 über eine Milliarde Euro ein – bei einer Bewertung von 26 Milliarden Euro. Das Unternehmen gab bekannt, dass seine annualisierte Umsatzrate auf 492 Millionen Euro gestiegen ist. Vor einem Jahr lag sie noch bei 37 Millionen Euro.

Im Unternehmenssektor schloss Replit eine Partnerschaft mit Visa. Der Zahlungsdienstleister beteiligte sich finanziell und setzt Replit-Tools intern bei über 1.000 Mitarbeitern ein. Cognizant wiederum modernisiert mit Anthropics Claude-KI die Buchungs- und Service-Infrastruktur von Travelport. Erste kundenorientierte Funktionen – etwa automatisierte Umbuchungssysteme und Störungsmanagement – sollen bis Ende 2026 live gehen.

Anthropic und Alibaba liefern sich Wettrennen an der Spitze

KI-Agenten täuschen Menschen immer häufiger

Sicherheitslücken: Mehrere Angriffe, größere Gefahr

Milliarden fließen in KI-Startups

Ähnliche Beiträge

BlueNoroff-Angriff: 100 Opfer in 20 Ländern durch KI-Deepfakes

Windows Hello: BSI warnt vor Manipulation durch Admin-Rechte

Produktivitäts-Apps im Test: Nur vier von zehn halten sich dauerhaft

MOS World Championships: 190 Talente treten ab 28. Juli an

Pro Tools 2026.4.1: M5-Support und immersive Audio-Engine

Agentische KI: 41% der Unternehmen nutzen Systeme ohne Kontrolle