KI-Benchmark Juli: Claude überholte GPT-5.5, China rückt auf

Chinesische Open-Source-Modelle holen auf, während Anthropic und OpenAI um die Spitzenposition kämpfen. Die UN warnt vor rasanter Entwicklung.

Während der chinesische Entwickler Zhipu AI mit einem multimodalen Werkzeug für Programmierer aufwartet, zeigen aktuelle Benchmarks ein immer enger werdendes Rennen zwischen den führenden Anbietern aus den USA. Beobachter warnen: Das Tempo der Innovation überholt die internationalen Regulierungsbemühungen.

Zhipu AI setzt auf offene Modelle und Coding-Fokus

Am 4. und 5. Juli 2026 präsentierte Zhipu AI GLM-5V-Turbo – ein natives multimodales Programmiermodell mit einem Kontextfenster von 200.000 Tokens. Es kann Bilder, Videos und Skizzen interpretieren und daraus Frontend-Code generieren. Integriert in die Plattform AutoClaw soll das System Daten aus mehreren Quellen parallel sammeln und innerhalb von 60 Sekunden umfassende Berichte erstellen.

Erst Ende Juni 2026 hatte das Unternehmen GLM-5.2 veröffentlicht – ein Mixture-of-Experts-Modell mit 744 Milliarden Parametern, das unter der offenen MIT-Lizenz steht. Am 2. Juli folgte ZCode, eine kostenlose KI-Entwicklungsumgebung auf Basis von GLM-5.2. In technischen Tests erreichte das Modell 62,1 Punkte auf dem SWE-bench Pro und liegt damit auf Augenhöhe mit westlichen Modellen wie GPT-5.5 und Claude Opus 4.8.

Die Geschäftszahlen untermauern den Aufstieg: Zhipu AI erzielte 2025 einen Umsatz von umgerechnet rund 90 Millionen Euro – ein Plus von 131,9 Prozent gegenüber dem Vorjahr. Trotz einer Preiserhöhung von rund 83 Prozent für die API-Nutzung im ersten Quartal 2026 wuchs die Nutzerbasis weiter. Nach den jüngsten Ankündigungen wird das Unternehmen mit über drei Milliarden Euro bewertet, der Aktienkurs stieg um 25 Prozent.

Neue Benchmark-Daten: Das Spitzenfeld rückt zusammen

Aktuelle Daten des Epoch AI Benchmarking Hub vom Juni 2026 zeigen eine veränderte Rangordnung. Im ECI-Benchmark erreichte Anthropics Claude Fable 5 161 Punkte und überholte damit knapp OpenAIs GPT-5.5 Pro mit 160 Punkten.

Anzeige

Der KI-Benchmark Juli 2026 zeigt: Claude überholt GPT-5.5, China rückt auf. Mit unserem kostenlosen Benchmark-Check behalten Sie den Überblick über die wichtigsten Modelle, ihre Leistung und die regulatorischen Fallstricke. Kostenlosen Benchmark-Check anfordern

OpenAI konterte mit einem Preview von GPT-5.6 Sol am 26. Juni. Erste Ergebnisse aus dem TerminalBench 2.1 zeigen eine Erfolgsquote von 94,3 Prozent im Enterprise-Track – deutlich besser als Claude 4 mit 87,1 Prozent. Auch Meta mischt mit: Das unternehmenseigene Modell Watermelon soll nach internen, nicht verifizierten Tests mit GPT-5.5 gleichgezogen sein – trainiert mit der zehnfachen Rechenleistung seines Vorgängers Muse Spark.

Die Verfügbarkeit leistungsstarker Open-Source-Modelle aus China könnte das Geschäftsmodell westlicher KI-Startups unter Druck setzen, warnte der CEO von Polsia AI am 30. Juni. Die sinkenden Einstiegshürden für hochmoderne KI-Modelle könnten die Bewertungen vieler junger Unternehmen infrage stellen.

Spezialisierung: KI für Wissenschaft und Chipdesign

Die jüngsten Entwicklungen zeigen einen Trend zu spezialisierten KI-Workflows. Anthropic brachte im Juli die Claude Science Beta auf den Markt – eine Multi-Agenten-Plattform für Genomik, Proteomik und Chemieinformatik. Ein koordinierender Agent mit über 60 Fähigkeiten steuert die Analyse wissenschaftlicher Daten.

Parallel dazu stellte NVIDIA Research das Framework HORIZON vor. Es basiert auf GPT-5.3 und erzielte bei Hardware-Design-Tests wie ChipBench und Verilog-Eval eine Erfolgsquote von 100 Prozent. Die Technologie könnte die Entwicklung komplexer Chips revolutionieren.

Anzeige

Betrifft Ihr Unternehmen die neue KI-Dynamik? Die kostenlose Checkliste zeigt Ihnen, wo Ihre Strategie im Vergleich zu Claude, GPT-5.5 und chinesischen Open-Source-Modellen steht. Benchmark-Check per E-Mail sichern

UN besorgt: Regulierung hinkt hinterher

Der rasante technische Fortschritt hat die Vereinten Nationen auf den Plan gerufen. Ein vorläufiger Bericht des UN Independent International Scientific Panel on AI vom Juli 2026 stellt fest: Die Fähigkeiten der Modelle entwickeln sich schneller als die Regeln zu ihrer Kontrolle. Besonders problematisch sei die Konzentration des Trainings von Spitzenmodellen auf wenige Akteure. Zudem wachse die Gefahr, dass KI ein gemeinsames Verständnis von Realität untergrabe.