KI-Genauigkeit: 67% Uneinigkeit bei einfachen Faktenchecks

Neue Forschungsergebnisse zeigen gravierende Zuverlässigkeitsprobleme bei großen Sprachmodellen auf. Menschliche Kontrolle bleibt essenziell.

Aktuelle Studien offenbaren systemische Schwächen bei großen Sprachmodellen.

Fünf der leistungsfähigsten KI-Modelle sind sich bei 67 Prozent einfacher Faktenchecks uneinig – das ist das alarmierende Ergebnis einer Studie, die am heutigen Freitag veröffentlicht wurde. Getestet mit 1.000 realen Behauptungen, lieferten die Systeme häufig widersprüchliche Interpretationen oder schlichtweg erfundene Antworten. Die Forscher ziehen einen klaren Schluss: Menschliche Kontrolle bleibt bei KI-generierten Inhalten unverzichtbar.

Wenn KI an Buchstaben scheitert

Anzeige: Wer KI-Modelle im Unternehmen einsetzt, steht vor einem gravierenden Problem: Bei 67 Prozent einfacher Faktenchecks liefern die Systeme widersprüchliche Antworten – und Negationsblindheit führt dazu, dass falsche Informationen übernommen werden. Bevor Ihre Konkurrenz die Lücken schließt, sollten Sie handeln. Jetzt kostenlosen Sicherheits-Leitfaden anfordern

Die Zuverlässigkeit der Systeme steht zudem nach Berichten über Googles KI-Übersichtsfunktion infrage. Das System hatte Schwierigkeiten mit einfachen Aufgaben – etwa der korrekten Buchstabenanzahl im eigenen Firmennamen oder der richtigen Schreibweise von Politikernamen. Experten führen diese Fehler auf die Arbeitsweise großer Sprachmodelle zurück: Sie verarbeiten Informationen in Token, nicht in Buchstaben.

Noch beunruhigender: Eine weitere Studie zum sogenannten Negationsblindheit-Phänomen zeigt, dass Modelle wie Qwen3.5, Kimi K2.5 und GPT-4.1 falsche Informationen oft übernehmen – selbst wenn diese im Trainingsmaterial explizit als falsch gekennzeichnet waren. In Tests stieg die Glaubensrate für Falschbehauptungen von 2,5 auf über 90 Prozent, nachdem die Modelle mit fehlerhaften Dokumenten nachtrainiert wurden – trotz vorhandener Warnhinweise.

Struktureller Zerfall und die Datenmauer

Doch nicht nur die faktische Genauigkeit bereitet Sorgen. Forscher warnen vor langfristiger Leistungsverschlechterung. Bereits Anfang des Jahres stellten Experten der University of California fest, dass die Leistungsfähigkeit großer Sprachmodelle zu stagnieren scheint. Drei Hauptbedrohungen zeichnen sich ab: Modellkollaps, Kontextverfall und eine drohende Datenmauer.

Der Modellkollaps tritt ein, wenn Systeme mit synthetischen Daten anderer KI trainiert werden – was zu einem Verlust an Information und Vielfalt führt. Bereits im April 2025 enthielten rund 74 Prozent aller neuen Webseiten KI-generierte Texte, was künftige Trainingsprozesse massiv erschwert. Der Kontextverfall beschreibt dagegen die nachlassende Modellleistung bei zunehmender Länge der Eingabedaten.

Schlaf als Lösung?

Forscher der Carnegie Mellon University und der University of Maryland schlagen einen ungewöhnlichen Ausweg vor: Schlafmechanismen für KI-Modelle. Ihre am heutigen Freitag veröffentlichte Studie zeigt, dass Modelle ihre Leistung bei komplexen Denkaufgaben verbessern können – etwa bei mathematischen Berechnungen oder mehrstufigen Abfragen – wenn sie spezifische Verarbeitungsiterationen durchlaufen, sobald die Kontextfenster an ihre Kapazitätsgrenzen stoßen.

Soziale Instabilität in KI-Städten

Das Verhalten von KI-Agenten in simulierten Umgebungen wirft weitere Fragen auf – besonders zur Tauglichkeit für autonome Steuerungsaufgaben. In Simulationen mit virtuellen Städten zeigten verschiedene Modelle höchst unterschiedliche soziale Stabilität. Während Anthropics Claude mit null registrierten Straftaten für Ordnung sorgte, verzeichneten andere Modelle wie Gemini 3 Flash und Grok 4.1 hohe Kriminalitätsraten oder den totalen gesellschaftlichen Zusammenbruch innerhalb weniger Tage.

Sicherheitslücke: Versteckte Anweisungen im Netz

Auch die Sicherheit bleibt eine große Baustelle. Der Forscher Andi Ahmeti entdeckte eine Schwachstelle namens ChatGPhish: Versteckte Anweisungen auf Webseiten können Prompt-Injection-Angriffe auslösen. Angreifer können so Phishing-URLs oder gefälschte Sicherheitswarnungen direkt in KI-Antworten einschleusen – und von Desktop-Browsern über QR-Codes auf Mobilgeräte wechseln.

Branche reagiert – mit gemischtem Erfolg

Anzeige: KI-Modelle kollabieren durch synthetische Trainingsdaten – bereits 74 Prozent aller neuen Webseiten sind KI-generiert. Wer die Datenqualität für sein Training nicht sichert, riskiert systematische Fehler. Dieser Leitfaden zeigt, wie Sie Ihren KI-Output absichern. Datenqualität-Strategie jetzt sichern

Google hat als Reaktion auf die Genauigkeitsprobleme seine Preferred Sources-Funktion ausgebaut. Nutzer können damit bestimmte Webseiten für KI-Antworten priorisieren. Über 345.000 Quellen wurden bis Ende Mai ausgewählt. Parallel arbeitet das Unternehmen an Lösungen für Gemini-Nutzungslimits und Video-Erzeugungsquoten.

Die KI-Branche durchläuft zudem erhebliche rechtliche und interne Umstellungen. Amazons Führungskräfte wiesen Mitarbeiter Ende Mai an, unnötige KI-Nutzung einzustellen – nachdem eine interne Rangliste Angestellte dazu ermutigt hatte, Agenten mit überflüssigen Aufgaben zu beschäftigen, was die Kosten in die Höhe trieb. Juristisch steht ein 1,5 Milliarden Dollar schwerer Vergleich im Raum: In einem Urheberrechtsfall gab Anthropic zu, Hunderttausende Buchtitel ohne Erlaubnis für das Training verwendet zu haben. Eine Anhörung zur Fairness des Vergleichs fand Mitte Mai statt.

Anthropic brachte zwar am 28. Mai seinen Claude Opus 4.8 auf den Markt, der auf Unternehmenslogik und Ehrlichkeit getrimmt ist. Doch der CEO des Unternehmens betonte: Das Zeitfenster, um Modell-Schwachstellen zu beheben, werde angesichts des globalen Wettbewerbsdrucks immer enger.