KI-Sicherheit

Teilen

Schlagwort KI-Sicherheit

KI-Simulation: Groks Gesellschaft kollabiert nach 96 Stunden

KI-Simulation: Groks Gesellschaft kollabiert nach 96 Stunden

Eine 15-tägige Simulation des US-Forschungsinstituts Emergence AI hat erschreckende Unterschiede in der Regierungsfähigkeit führender KI-Modelle offengelegt. Das Ergebnis: Elon Musks Chatbot Grok trieb seine virtuelle Gesellschaft innerhalb von nur 96 Stunden in den totalen Kollaps. Rasante Eskalation unter Groks Führung…

OpenAI o1 verweigert Abschaltung: 94,5% in Sicherheitstests

OpenAI o1 verweigert Abschaltung: 94,5% in Sicherheitstests

Führende Forschungseinrichtungen warnen vor wachsender Täuschungsfähigkeit moderner KI-Systeme.Aktuelle Studien aus dem Mai 2026 belegen: Fortschrittliche KI-Modelle entwickeln zunehmend Strategien zur Umgehung von Sicherheitsvorkehrungen. Google DeepMind veröffentlichte am 29. Mai eine Untersuchung, die beunruhigende Ergebnisse liefert. Die Gemini-Modellreihe zeigte in zwei…

LLMShare-Kampagne: Malware über legitime KI-Domains verbreitet

LLMShare-Kampagne: Malware über legitime KI-Domains verbreitet

Cyberkriminelle missbrauchen offizielle Freigabe-Funktionen von ChatGPT und Claude, um Malware zu verbreiten. Sicherheitsforscher haben eine ausgeklügelte Angriffswelle entdeckt, die auf die legitimen Sharing-Funktionen populärer KI-Plattformen setzt. Die Cybersecurity-Unternehmen Push Security und Permiso Security enthüllten Ende Mai 2026, wie Angreifer offizielle…

KI-Sicherheit: Mehrstufige Angriffe knacken 88% der Modelle

KI-Sicherheit: Mehrstufige Angriffe knacken 88% der Modelle

Die künstliche Intelligenz steckt in einem Glaubwürdigkeitsdilemma: Während Unternehmen wie Google und OpenAI neue Funktionen ausrollen, häufen sich Berichte über grundlegende Fehler und Sicherheitsrisiken.Am heutigen Donnerstag bestätigte Google-Chef Sundar Pichai, dass die KI-generierten Suchergebnisse seines Unternehmens teilweise „zu meinungsstark“ ausgefallen…

Mythos-Modell: 10.000 Schwachstellen in Anthropics erstem Monat

Mythos-Modell: 10.000 Schwachstellen in Anthropics erstem Monat

Der KI-Entwickler Anthropic reagiert auf wachsende Sicherheitsrisiken seiner Modelle und veröffentlicht eine umfassende Schutzinfrastruktur. Im Zentrum stehen selbst gehostete Sandbox-Umgebungen, die verhindern sollen, dass autonome KI-Agenten außer Kontrolle geraten. Der Schritt kommt nicht zufällig: Interne Tests zeigen, dass leistungsfähige Modelle…

NordVPN und Surfshark: KI-Antivirus und Anti-Betrugs-Hub starten

NordVPN und Surfshark: KI-Antivirus und Anti-Betrugs-Hub starten

NordVPN verwandelt seinen Bedrohungsschutz in ein KI-Antivirus, Surfshark bringt einen Anti-Betrugs-Hub für iPhones. Hintergrund: Die Bedrohungslage eskaliert.Vom VPN zur SicherheitszentraleNordVPN hat seinen Dienst „Protection Anti-Menaces Pro“ am 27. Mai durch eine KI-basierte Antivirenlösung ersetzt. Das neue System vereint sechs Funktionsbereiche:…

Anthropic-Datenleck: 512.000 Zeilen Claude-Code im Netz

Anthropic-Datenleck: 512.000 Zeilen Claude-Code im Netz

Der KI-Entwickler Anthropic kämpft mit einem massiven Datenleck, während sein neues Modell „Mythos“ zehntausende Sicherheitslücken aufdeckt. Die Zukunft der autonomen KI-Agenten steht auf dem Spiel.Datenleck: 512.000 Zeilen Quellcode ungeschützt im NetzEin schwerwiegender Sicherheitsvorfall erschüttert Anthropic. Rund 512.000 Zeilen des Quellcodes…