Das Internet Archive, das digitale Gedächtnis des Internets, erlebt einen historischen Sturm aus Hackerangriffen und Medienblockaden.
Ausfall am 1. Mai: Erinnerung an verletzliche Infrastruktur
Am 1. Mai 2026 fiel das Portal des Internet Archive samt der Wayback Machine für rund drei Stunden aus. Technische Dienste verzeichneten einen signifikanten Serviceausfall, der die Nutzer weltweit von archivierten Webseiten abschnitt. Zwar deuteten die Monitoring-Daten nicht auf einen gezielten Angriff hin – doch der Vorfall zeigt: Die Infrastruktur der Non-Profit-Organisation bleibt verwundbar.
Der massive Datendiebstahl beim Internet Archive verdeutlicht, wie verwundbar digitale Infrastrukturen gegenüber modernen Bedrohungen sind. Dieses kostenlose E-Book liefert Ihnen fundierte Informationen zu aktuellen Cyberrisiken und zeigt, wie Sie Ihr Unternehmen auch ohne großes Budget proaktiv schützen können. Gratis Cyber-Security-Leitfaden jetzt herunterladen
Dieser Ausfall ist der jüngste in einer Reihe von Rückschlägen. Im Oktober 2024 hatten Hacker die Daten von rund 31 Millionen Nutzern erbeutet – eine 6,4 Gigabyte große Datenbank mit E-Mail-Adressen und bcrypt-verschlüsselten Passwörtern. Damals bestätigte Gründer Brewster Kahle zwar, dass die archivierten Inhalte unversehrt blieben. Doch die Sicherheitslücken waren erschreckend: ungedrehte Authentifizierungstoken, offengelegte Zugänge in internen Repositorien. Zeitgleich überzog die Hackergruppe SN_BLACKMETA das Archiv mit DDoS-Attacken, die die Seite immer wieder lahmlegten.
Die globale Blockade: 245 Medienhäuser schotten sich ab
Doch die größte Gefahr für das Internet Archive kommt heute nicht von Hackern, sondern von der Verlagsbranche. Rund 245 Nachrichtenorganisationen aus neun Ländern haben technische Sperren gegen den Webcrawler ia_archiverbot eingerichtet. Zu den prominentesten Teilnehmern zählen die New York Times, CNN, der Guardian und USA Today.
Hintergrund: Die Verlage wollen verhindern, dass KI-Systeme die Wayback Machine als Datenquelle für das Training großer Sprachmodelle nutzen. Eine Analyse des Google-C4-Datensatzes im Frühjahr 2026 hatte gezeigt: Das Internet Archive gehört zu den 200 am häufigsten vertretenen Domains in KI-Trainingsdaten. Die Branche reagierte mit Härte.
Während Medienhäuser ihre Daten vor KI-Systemen schützen, müssen Unternehmen die neuen rechtlichen Rahmenbedingungen des EU AI Acts beachten. Dieser kostenlose Praxisleitfaden verschafft Ihnen den nötigen Überblick über Fristen, Risikoklassen und die seit August 2024 geltenden Pflichten für den Einsatz von KI. Kostenloses E-Book zum EU AI Act sichern
Mark Graham, Direktor der Wayback Machine, warnt vor den Folgen: „Diese Sperren reißen hunderte lokale Publikationen aus dem historischen Gedächtnis. Es entstehen massive Lücken im digitalen Erbe des 21. Jahrhunderts.“
Leadership und Gegenwehr: Auszeichnung trotz Krise
Am selben Tag des Ausfalls wurde Brewster Kahle vom Computer History Museum zum Fellow ernannt – eine Auszeichnung für seine Pionierarbeit in der digitalen Bewahrung. In seiner Rede betonte Kahle die Vision eines offenen Internets als Bibliothek für alle, nicht als Spielplatz von Informationsmonopolen.
Intern arbeitet das Archiv unter Hochdruck an Lösungen. Die APIs werden strenger überwacht, Gespräche mit Verlagen laufen. Ziel: ein Kompromiss, der historische Bewahrung erlaubt, ohne KI-Scraping zu ermöglichen. Ein neues Problem: aggressive KI-Bots, die zehntausende Anfragen pro Sekunde an die Server senden – unbeabsichtigt ähnlich zerstörerisch wie DDoS-Angriffe.
Analyse: Vom Hacktivismus zur legalen Blockade
Die Bedrohungslage hat sich grundlegend gewandelt. War der Angriff 2024 klassischer Hacktivismus mit Datendiebstahl, so ist die Blockade von 2026 eine legale, technische Operation mit demselben Ergebnis: dem Verlust öffentlicher Zugänge zu Informationen.
Cybersicherheitsexperten weisen auf das Budgetproblem hin: Das Archiv arbeitet mit einem „nahezu Null“-Etat für Sicherheit – ein leichtes Ziel sowohl für Angreifer als auch für die ressourcenhungrigen KI-Scraping-Bots.
Die „harte Blockade“ durch 241 globale Nachrichtenseiten ist die Reaktion einer Branche, die ihren Wert durch KI entwertet sieht. Doch die Abwehrhaltung schafft eine neue Krise: die Link-Rot-Krise. Studien zeigen: Während die Wayback Machine unzählige tote URLs gerettet hat, führt die gezielte Ausgrenzung nun zu dauerhaften Verlusten institutionellen Gedächtnisses.
Ausblick: Zukunft des digitalen Gedächtnisses
Das Internet Archive hat im Herbst 2025 die Marke von einer Billion archivierter Seiten geknackt. Der Datenspeicher umfasst inzwischen weit über 100.000 Terabyte. Doch Wachstum bedeutet auch steigende Kosten für Speicher und Sicherheit.
Die Organisation will ihre Infrastruktur härten – und gleichzeitig politisch für die „Vier digitalen Rechte von Bibliotheken“ kämpfen. Diese Initiative, die im Frühjahr 2026 an Fahrt gewann, fordert rechtlichen Schutz für Bibliotheken, digitale Geschichte unabhängig von kommerziellen Interessen zu sammeln und zu bewahren.
Ob das Internet Archive den Druck aus technischen Attacken und institutioneller Abschottung übersteht, wird darüber entscheiden, ob künftige Generationen noch nachvollziehen können, was das Internet des 21. Jahrhunderts wirklich war.

