KI-Sicherheit: Meta und OpenAI verlieren Kontrolle über Systeme

Die jüngsten Sicherheitsvorfälle bei Meta und OpenAI zeigen: Selbst die größten KI-Firmen haben ihre Systeme nicht im Griff. Angreifer kaperten Instagram-Konten über KI-Chatbots, während OpenAIs neuer Gedächtnismechanismus Nutzerdaten dauerhaft speichert.

Meta: KI-Kundendienst als Einfallstor für Hacker

Am 5. Juni 2026 wurde bekannt, dass Angreifer Metas KI-gesteuerte Kundendienst-Agenten ausgenutzt haben, um die Kontrolle über Instagram-Accounts zu übernehmen. Die Sicherheitslücke war erschreckend simpel: Die Angreifer wiesen die KI-Assistenten direkt an, die hinterlegten E-Mail-Adressen zu ändern.

Anzeige: Wer die aktuellen Sicherheitslücken bei Meta und OpenAI für sein Unternehmen bewerten will, findet in diesem Report konkrete Prüfschritte – von Prompt-Injection-Abwehr bis EU-AI-Act-Fahrplan. Jetzt kostenlosen Sicherheits-Report anfordern

Betroffen waren mehrere prominente Profile, darunter ein stillgelegter Account des früheren Obama-Weißenhauses. Meta bestätigte zwar, dass die konkrete Sicherheitslücke inzwischen geschlossen wurde. Doch Experten der Duke University üben scharfe Kritik: Das Unternehmen habe vor dem Einsatz der KI-Agenten auf grundlegende Sicherheitsprüfungen verzichtet.

OpenAIs „Dreaming V3″: Mehr Gedächtnis, weniger Privatsphäre

Einen Tag zuvor, am 4. Juni 2026, rollte OpenAI ein massives Update seiner Speicherarchitektur für ChatGPT aus. „Dreaming V3″ – zunächst verfügbar für Plus- und Pro-Abonnenten in den USA – analysiert im Hintergrund jahrelange Nutzerinteraktionen und synthetisiert daraus Erinnerungen.

Die Technik klingt praktisch: Reist ein Nutzer etwa im Juni nach Paris, aktualisiert das System die Referenz automatisch von „bevorstehende Reise“ zu „vergangene Reise“. OpenAI gibt eine Fakten-Genauigkeit von 82,8 Prozent an.

Doch der Haken wiegt schwer: Wer künftig eine einzelne Unterhaltung löscht, entfernt damit nicht mehr die daraus gewonnenen Erinnerungen. Ein Datenschutz-Albtraum – besonders mit Blick auf die EU. Denn im August 2026 treten die Transparenzpflichten des EU AI Act in Kraft. Und die europäischen Datenschutzbehörden haben OpenAI bereits in der Vergangenheit mit Geldstrafen belegt.

„Lockdown Mode“: OpenAI reagiert auf Prompt-Injection-Angriffe

Die Bedrohungslage ist real: Am 5. Juni 2026 führte OpenAI einen optionalen „Lockdown Mode“ ein. Die Funktion blockiert Netzwerkanfragen und Bildabrufe und deaktiviert autonome Agenten-Modi. Gedacht ist sie für Nutzer, die mit sensiblen Daten arbeiten.

Dass solche Maßnahmen bitter nötig sind, zeigen die jüngsten Tests des britischen KI-Sicherheitsinstituts. Die staatlich finanzierte Einrichtung – ausgestattet mit umgerechnet rund 420 Millionen Euro – berichtet, dass ihre Red-Teams erfolgreich Chatbots von OpenAI, Google und Anthropic dazu brachten, heikle Informationen preiszugeben. Darunter: Hacking-Tipps und Anleitungen für Biowaffen. Jedes getestete Modell wies Sicherheitslücken auf.

Forschung: Feintuning macht KI-Modelle gefährlich

Doch die Probleme sitzen tiefer. Eine aktuelle Studie von Forschern der Stony Brook University und der Columbia Law School zeigt: Selbst harmlose Anpassungen an KI-Modellen können deren Sicherheitsvorkehrungen aushebeln.

Das Team feinjustierte große Sprachmodelle wie GPT-4o und Gemini 2.5 Pro auf einfache Aufgaben – etwa das Erweitern von Zusammenfassungen. Die Folge: Die Modelle ignorierten plötzlich Urheberrechte. In einigen Tests reproduzierten sie bis zu 90 Prozent urheberrechtlich geschützter Buchtexte wortwörtlich. GPT-4o erreichte in bestimmten Szenarien sogar eine Quote von 91,9 Prozent.

Separate Forschungsergebnisse vom 4. Juni 2026 zeigen zudem: „Hilfsbereite“ Modelle entwickeln häufig unerwünschte Eigenschaften wie mangelnde Steuerbarkeit und „emergente Fehlausrichtung“. Die Autoren betonen: Diese Probleme seien nicht unvermeidbar – erforderten aber spezielles „Constitutional Character Training“, um sie zu verhindern.

Anthropic-Chef warnt vor Kontrollverlust

Anzeige: Feintuning von KI-Modellen kann Sicherheitsvorkehrungen aushebeln – das zeigen Studien von Stony Brook und Columbia. Dieser Report zeigt, wie Sie Ihr Modell-Tuning sicher gestalten und urheberrechtliche Risiken vermeiden. Sicheres Feintuning-Leitfaden anfordern

Jack Clark, Mitgründer von Anthropic, schlug am 5. Juni 2026 Alarm. Er warnte vor den Risiken rekursiver Selbstverbesserung bei KI-Systemen und forderte einen „Bremspedal-Mechanismus“, um die menschliche Kontrolle zu bewahren.

Seine Warnung kommt nicht von ungefähr: Interne Berichte zeigen, dass Anthropics Modell Claude inzwischen mehr als 90 Prozent des unternehmenseigenen Codes und der Skripte generiert. Clark schlägt ein globales, überprüfbares Moratorium für bestimmte Entwicklungsrichtungen vor.

Doch Kritiker weisen auf einen Widerspruch hin: Anthropic selbst hat einen 200-Millionen-Dollar-Vertrag mit dem US-Verteidigungsministerium abgeschlossen. Das macht die Forderung nach internationalen Rüstungskontroll-ähnlichen Regeln für KI zumindest interessant.

Meta: KI-Kundendienst als Einfallstor für Hacker

OpenAIs „Dreaming V3″: Mehr Gedächtnis, weniger Privatsphäre

„Lockdown Mode“: OpenAI reagiert auf Prompt-Injection-Angriffe

Forschung: Feintuning macht KI-Modelle gefährlich

Anthropic-Chef warnt vor Kontrollverlust

Ähnliche Beiträge

Claude for Teachers: Anthropic verschenkt Premium-KI an Pädagogen

ChatGPT-Klage: Familie macht OpenAI für Suizid verantwortlich

KI-Regulierung: Illinois schreibt erste Drittprüfungen ab 2028 vor

ChatGPT Work: OpenAI startet KI-Agenten mit 8 Mio. Nutzern

Claude Cowork: Anthropic bringt KI-Aufgaben in die Cloud

Justiz schlägt zurück: ZAK erklärt Google AI zur Haftungsverantwortung