Eine Fehlkonfiguration der Router bei Cloudflare hat in der Nacht zum Samstag dazu geführt, dass zahlreiche Internetseiten und –Dienste weltweit ausgefallen sind.
Anzeige
Cloudflare hat inzwischen eine Mitteilung zum Vorfall vom 17. Juli 2020 veröffentlicht, der einige Hintergründe erläutert.
Cloudflare outage on July 17, 2020
Today a configuration error in our backbone network caused an outage for Internet properties and Cloudflare services that lasted 27 minutes. We saw traffic drop by about 50% across our network. Because of the architecture of our backbone this outage didn't affect the entire Cloudflare network and was localized to certain geographies.
The outage occurred because, while working on an unrelated issue with a segment of the backbone from Newark to Chicago, our network engineering team updated the configuration on a router in Atlanta to alleviate congestion. This configuration contained an error that caused all traffic across our backbone to be sent to Atlanta. This quickly overwhelmed the Atlanta router and caused Cloudflare network locations connected to the backbone to fail.
The affected locations were San Jose, Dallas, Seattle, Los Angeles, Chicago, Washington, DC, Richmond, Newark, Atlanta, London, Amsterdam, Frankfurt, Paris, Stockholm, Moscow, St. Petersburg, São Paulo, Curitiba, and Porto Alegre. Other locations continued to operate normally.
For the avoidance of doubt: this was not caused by an attack or breach of any kind.
We are sorry for this outage and have already made a global change to the backbone configuration that will prevent it from being able to occur again.
Das Ganze hielt zwar nur 27 Minuten an, aber in der Zeit sank der Netzwerkverkehr um 50 %.
(Cloudflare Backbone, Quelle Cloudflare)
Obige Grafik gibt die Backbone-Infrastruktur an. Zunächst trat ein Problem bei der Backbone-Verbindung zwischen Newark und Chicago auf, das zu einer Überlastung des Backbones zwischen Atlanta und Washington, DC führte.
Anzeige
Als Reaktion auf dieses Problem wurde in Atlanta eine Konfigurationsänderung vorgenommen. Mit dieser Änderung begann der Ausfall um 21:12 Uhr. Sobald der Ausfall verstanden wurde, wurde der Atlanta-Router deaktiviert, und der Verkehr begann um 21:39 Uhr wieder normal zu fließen.
Der Teufel liegt also wieder einmal im Detail. Bleeping Computer war betroffen und berichtete bereits gestern in diesem Artikel. Heise hat diesen deutschsprachigen Beitrag zum Thema veröffentlicht. Ein weiterer Beitrag findet sich bei Golem.
Anzeige