Claude Fable 5: Anthropic zieht heimliche Filter zurück

Nach massiver Kritik kündigt Anthropic mehr Transparenz bei Claude Fable 5 an. Neue Regeln für Umleitungen und Filter treten in Kraft.

Der KI-Konzern reagiert auf massive Kritik: Heimliche Leistungsdrosselung und überzogene Filter werden zurückgenommen.

Die Kontroverse um Claude Fable 5 eskalierte nur Tage nach dem Launch am 9. Juni 2026. Entwickler und Forscher warfen Anthropic vor, das Modell heimlich zu bremsen – und damit Transparenz und Nutzbarkeit zu opfern. Nun lenkt der Konzern ein.

Anzeige

Die rasante Entwicklung leistungsstarker KI-Modelle wie Claude Fable 5 bringt komplexe rechtliche Anforderungen mit sich, die im EU AI Act verbindlich geregelt sind. Dieser kostenlose Umsetzungsleitfaden bietet Unternehmen einen kompakten Überblick über alle neuen Pflichten, Risikoklassen und Fristen. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt

Heimliche Drosselung entdeckt

Das Problem traf vor allem jene, die das Modell für Forschung und Entwicklung nutzen wollten. Anthropic hatte eine Richtlinie implementiert, die Anfragen zur sogenannten „AI-Distillation“ – also dem Training eigener Modelle mit den Ausgaben von Claude – unbemerkt auf das ältere und schwächere Modell Claude Opus 4.8 umleitete. Betroffen waren rund 0,03 Prozent des gesamten Datenverkehrs.

Die Information darüber fand sich nur in einem 319-seitigen System-Dokument versteckt. Forscher sprachen von einem eklatanten Mangel an Transparenz, der professionelle Arbeitsabläufe empfindlich störte.

Hinzu kamen übermäßig strenge Sicherheitsfilter. Routineanfragen aus der Biologie oder Chemie wurden häufig fälschlich blockiert. Selbst harmlose Fragen zu Mitochondrien, mRNA-Impfstoffen oder Krebsforschung landeten auf der Sperrliste. Auch Begriffe wie „Elon Musk“ oder Standard-Code-Reviews aus der Cybersicherheit lösten Fehlalarme aus.

Anthropic rudert zurück

Am 11. Juni 2026 entschuldigte sich das Unternehmen öffentlich. Man habe den falschen Kompromiss zwischen Sicherheit und Nutzbarkeit gewählt, hieß es aus der Führungsetage. Die Balance sei bei der Einführung des leistungsstarken Mythos-Modells nicht gelungen.

Seit dieser Woche gelten neue Regeln:

  • Sichtbare Umleitung: Nutzer werden künftig explizit informiert, wenn ihre Anfrage auf das schwächere Modell umgeleitet wird.
  • Klare Fehlercodes: Entwickler erhalten über die API spezifische Begründungen, wenn eine Anfrage abgelehnt oder herabgestuft wird.
  • Verifizierungsprogramm für Cybersicherheit: Forscher aus diesem Bereich können einen speziellen Status beantragen, der weniger restriktiven Zugang für Sicherheitsaudits und Code-Reviews ermöglicht.
Anzeige

Während KI-Anbieter ihre Filter für Sicherheitsaudits und Code-Reviews anpassen, müssen Unternehmen ihre IT-Infrastruktur proaktiv gegen neue Bedrohungsszenarien absichern. Erfahren Sie in diesem kostenlosen Report, welche KI-Gesetze und Cyberrisiken jetzt für Ihre Organisation entscheidend sind. Neue KI-Gesetze, neue Cyberrisiken: Was kommt wirklich auf Ihr Unternehmen zu?

Sicherheit als Balanceakt

Anthropic verteidigte die grundsätzliche Existenz der Schutzmechanismen mit nationalen Sicherheitsinteressen. Die Beschränkungen sollten verhindern, dass ausländische Akteure sich Wettbewerbsvorteile verschaffen oder das Modell zur Umgehung von Technologie-Exportkontrollen nutzen.

Trotz der Kontroversen bleibt Claude Fable 5 eines der leistungsstärksten öffentlich zugänglichen KI-Modelle. In Benchmarks erreichte eine uneingeschränkte Version der Mythos-5-Architektur 46,1 Prozent im BioMysteryBench – das Vorgängermodell Opus 4.8 schaffte nur 40 Prozent.

Für Endnutzer kostet Claude Fable 5 zehn Dollar pro Million Input-Tokens und 50 Dollar pro Million Output-Tokens. Während Anthropic weiter an der Feinjustierung seiner Filter arbeitet, um Fehlalarme in Biologie und Chemie zu reduzieren, betont das Unternehmen: Die Mythos-Architektur erfordere aufgrund ihrer gesteigerten Fähigkeiten strengere Kontrollen als frühere Generationen.