KI-Halluzinationen: 4.046 erfundene Zitate in biomedizinischen Papieren

Anthropic veröffentlicht Claude Opus 4.8 mit Ehrlichkeitsmodus, während Studien eine drastische Zunahme von KI-Halluzinationen belegen.

Der neue Sprachassistent erkennt eigene Wissenslücken – während KI-Halluzinationen in Forschung und Wirtschaft massiv zunehmen.

Am heutigen Sonntag hat das US-Unternehmen Anthropic sein neues KI-Modell Claude Opus 4.8 veröffentlicht. Der Nachfolger von Version 4.7 soll gezielt Unsicherheiten kennzeichnen und unbegründete Behauptungen vermeiden. Der Launch kommt zu einem Zeitpunkt, an dem aktuelle Prüfberichte eine besorgniserregende Zunahme von sogenannten Halluzinationen belegen – Fehler, die von KI-Systemen mit hoher Überzeugungskraft präsentiert werden.

Anzeige

Warum so viele Deutsche ChatGPT nutzen – aber kaum einer weiß, wie man es richtig anwendet: Ein kostenloser Ratgeber zeigt, wie Sie die KI im Alltag sicher und effektiv einsetzen, um Fehler und Halluzinationen zu vermeiden. Kostenlosen KI-Alltagshelfer-Report jetzt sichern

Neue Einstellung für mehr Tiefe

Claude Opus 4.8 führt einen neuen „Effort“-Modus ein, der es Nutzern erlaubt, tiefere Verarbeitung gegen schnellere Antworten einzutauschen. Im Schnellmodus arbeitet das Modell laut Unternehmensangaben 2,5-mal schneller als sein Vorgänger. Die Entwicklung folgt auf interne Sicherheitstests unter dem Codenamen „Project Glasswing“, bei denen mehr als 10.000 Schwachstellen mit hohem oder kritischem Schweregrad identifiziert wurden.

Die Branche bewegt sich damit hin zu „ehrlichkeitsfokussierten“ Modellen. Forscher beobachten dabei ein Paradox: Moderne KI-Systeme machen zwar weniger offensichtliche Fehler, liefern falsche Informationen aber in zunehmend polierter und überzeugender Sprache. Dan Klein, Professor an der UC Berkeley, bezeichnet diese Systeme als „Plausibilitätsmaschinen“ statt Wahrheitsmaschinen. Aktuelle Benchmarks zeigen: Selbst führende Modelle halluzinieren bei Zusammenfassungen einzelner Dokumente zwischen 11 und 15 Prozent der Fälle.

Tausende erfundene Quellen in der Forschung

Die Beweise für KI-generierte Fehlinformationen in sensiblen Bereichen häufen sich. Eine im Mai 2026 im Fachjournal The Lancet veröffentlichte Studie identifizierte 4.046 erfundene Literaturverweise in 2.810 biomedizinischen Papieren. Die Rate der erfundenen Zitate stieg demnach um das Zwölffache – von etwa einem Fall pro 2.828 Arbeiten im Jahr 2023 auf einen pro 277 Anfang 2026. Besonders betroffen: Übersichtsartikel mit einer um 57 Prozent höheren Rate.

Auch die Wirtschaft ist betroffen. Eine Untersuchung des KI-Detektors GPTZero vom 30. Mai 2026 kam zu dem Schluss, dass ein Bericht von Ernst & Young Canada aus dem Jahr 2025 zahlreiche Halluzinationen enthielt. Das 44-seitige Dokument mit dem Titel „Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems“ soll erfundene Statistiken, defekte Links und einen Verweis auf einen nicht existierenden McKinsey-Bericht enthalten haben.

Anzeige

Ob Urlaubsplanung oder Organisation – die richtige Anwendung von KI-Tools spart Zeit und verhindert peinliche Fehler durch falsche Befehle. Dieser neue Gratis-Report enthüllt die praktischsten Tricks und fertige Prompts für Einsteiger. Gratis-Report mit ChatGPT-Tricks herunterladen

Regulierungsdruck in Justiz und Medizin

Die anhaltenden KI-Fehler fordern formelle Kontrollmechanismen. Am 30. Mai 2026 forderten Rechtsexperten die US-Judicial Conference auf, Regeln gegen KI-generierte Fake-Zitate in Gerichtsdokumenten zu erlassen. Auch der Oberste Gerichtshof Indiens hat bereits vor KI-erzeugten Zitaten gewarnt.

Im Gesundheitswesen zeigt sich ein ähnliches Bild. Eine Studie der Yale School of Medicine ergab, dass KI-Notiztools gelegentlich kritische Details wie die Dauer von Symptomen ausließen. Das öffentliche Vertrauen ist gering: Nur 11 Prozent der US-Amerikaner sind laut einer YouGov-Umfrage vom Mai 2026 offen für den Einsatz von KI in der psychischen Gesundheitsversorgung. 40 Prozent lehnen die Technologie ab.

Glaubwürdigkeit als größte Krise der KI

Ein aktueller Vorfall verdeutlicht die Risiken: Am 31. Mai 2026 berichteten Nutzer, dass ChatGPTs Sprachfunktion fälschlicherweise behauptete, der Politiker Charlie Kirk lebe noch – obwohl dieser am 10. September 2025 ermordet wurde.

Der indische Minister Jyotiraditya Scindia erklärte am selben Tag, die größte Krise des KI-Zeitalters sei eine der Glaubwürdigkeit. Die Kombination aus erfundenen Narrativen, Deepfakes und Fehlinformationen stelle eine grundlegende Herausforderung für die Integrität von Daten und das menschliche Gewissen in Journalismus und öffentlicher Debatte dar.