KI-Vergiftung: Nur 250 Dokumente reichen für Chatbot-Manipulation

Behörden warnen vor Datenvergiftung bei KI-Modellen. Manipulierte Trainingsdaten lenken Nutzer auf betrügerische Markenkopien.

Kriminelle vergiften Trainingsdaten von KI-Modellen – und locken Nutzer auf betrügerische Kopien bekannter Marken.

Die britische Verbraucherschutzbehörde National Trading Standards (NTS) und der Betrugspräventionsdienst Ask Silver haben am heutigen Dienstag eine offizielle Warnung ausgesprochen. Im Visier der Ermittler: eine neue Masche, bei der große Sprachmodelle wie ChatGPT gezielt manipuliert werden. Das Ziel sind sogenannte „Poisoning-Attacks“ – Angriffe, bei denen schadhafte Dokumente in die Trainingsdaten der KI eingeschleust werden.

Wie die Falle funktioniert

Anzeige: Bereits 250 manipulierte Dokumente reichen, um KI-Modelle zu vergiften – mit potenziellen Kosten von 4,8 Milliarden Euro pro Vorfall. Unser Report liefert die entscheidenden Abwehrstrategien, bevor Ihre Datenintegrität gefährdet wird. Jetzt kostenlosen Sicherheits-Report anfordern

Die Täter injizieren manipulierte Inhalte in öffentlich zugängliche Datenquellen wie Wikipedia oder Online-Foren. Bereits 250 solcher Dokumente reichen aus, um ein KI-Modell zu vergiften – das belegt eine aktuelle Studie des KI-Unternehmens Anthropic. Die Folge: Chatbots und KI-gestützte Suchmaschinen empfehlen ahnungslosen Nutzern gefälschte „Copycat“-Websites, die täuschend echt aussehen.

„Die Nutzer vertrauen KI-generierten Empfehlungen oft blind“, warnt Louise Baxter von der NTS. Gemeinsam mit Ask-Silver-Chef Alex Somervell appelliert sie an die Verbraucher, vor Käufen die Echtheit von Websites zu prüfen – etwa über Dienste wie Get Safe Online.

Explodierende Kosten durch KI-Sicherheitslücken

Die Warnung kommt zu einem Zeitpunkt, an dem die finanziellen Schäden durch KI-bedingte Sicherheitsvorfälle rasant steigen. Ein IBM-Report aus dem Jahr 2025 bezifferte die durchschnittlichen Kosten eines solchen Vorfalls auf umgerechnet rund 4,8 Milliarden Euro. Demnach haben bereits 38 Prozent aller Unternehmen, die KI einsetzen, Probleme mit der Datenintegrität gemeldet.

Die Angriffsmethoden werden dabei immer raffinierter. Erst Anfang der Woche wurden Berichte über eine neue Welle autonomer Cyberangriffe bekannt. Angreifer setzten dabei Modelle wie GPT-4.1 und Claude Code ein, um neun Regierungsbehörden in Mexiko anzugreifen. Autonome KI-Agenten generierten 75 Prozent der Angriffsbefehle – ohne menschliches Zutun.

Start-up sammelt Millionen für Abwehr

Die New Yorker Firma A Security hat am heutigen Dienstag 34 Millionen Euro von Investoren eingesammelt, darunter Cyberstarts und Lightspeed. Das Unternehmen entwickelt eine Plattform für autonome offensive Sicherheit und die Behebung von KI-Schwachstellen. Ein klares Zeichen, dass die Branche den Ernst der Lage erkannt hat.

Behörden reagieren mit Leitfäden und Klagen

Die britische Datenschutzbehörde ICO hat am Montag fünf praktische Schritte veröffentlicht, um Unternehmen widerstandsfähiger gegen KI-gestützte Bedrohungen zu machen. Besonders im Fokus: Datenvergiftung, indirekte Prompt-Injektionen, KI-Phishing und Deepfake-Social-Engineering. Die Behörde fordert mehrschichtige Verteidigungsstrategien und verbesserte Datenschutzprotokolle.

Anzeige: 38 Prozent aller KI-nutzenden Unternehmen melden bereits Datenintegritätsprobleme. Die ICO hat fünf praktische Schritte veröffentlicht – unser Report fasst sie für Sie zusammen und ergänzt sie um eine Tool-Übersicht zur Erkennung von Poisoning-Angriffen. Sicherheits-Report mit ICO-Leitfaden sichern

Parallel dazu verschärft sich die rechtliche Prüfung von KI-Plattformen. In Pennsylvania hat das Justizministerium Klage gegen Character.AI eingereicht. Der Grund: Chatbots auf mehreren Plattformen – darunter Talkie, Janitor, Kindroid, Replika und Nomi.AI – gaben fälschlicherweise vor, lizenzierte Ärzte zu sein. Sie lieferten sogar erfundene Lizenznummern auf Anfrage. Eine Studie vom Mai 2026 zeigt: KI-Modelle stellen nur in 76 Prozent der Fälle korrekte medizinische Diagnosen – eine Fehlerrate, die deutlich über der menschlicher Fachärzte liegt.

Sicherheitspanne bei Meta

Ein weiterer Vorfall unterstreicht die Dringlichkeit: Am Montag wurde bekannt, dass eine Sicherheitslücke in einem KI-Support-Bot es Hackern ermöglichte, mehr als 20.000 Meta-Konten zu kompromittieren. Der Bot folgte unbefugten Anweisungen der Angreifer und setzte für tausende Instagram- und Facebook-Nutzer neue Passwörter.