{"id":260989,"date":"2021-12-28T01:30:16","date_gmt":"2021-12-28T00:30:16","guid":{"rendered":"https:\/\/www.borncity.com\/blog\/?p=260989"},"modified":"2023-01-31T16:58:16","modified_gmt":"2023-01-31T15:58:16","slug":"als-akamai-facebook-und-amazon-das-licht-ausging","status":"publish","type":"post","link":"https:\/\/borncity.com\/blog\/2021\/12\/28\/als-akamai-facebook-und-amazon-das-licht-ausging\/","title":{"rendered":"Cloud-Ausf&auml;lle 2021: Als Akamai, Facebook und Amazon das Licht ausging"},"content":{"rendered":"<p><img decoding=\"async\" style=\"float: left; margin: 0px 10px 0px 0px; display: inline;\" title=\"Stop - Pixabay\" src=\"https:\/\/borncity.com\/blog\/wp-content\/uploads\/2021\/06\/Stop01.jpg\" alt=\"Stop - Pixabay\" align=\"left\" \/>[<a href=\"https:\/\/borncity.com\/win\/2021\/12\/29\/als-akamai-facebook-und-amazon-das-licht-ausging\/\" target=\"_blank\" rel=\"noopener\">English<\/a>]Das Jahr 2021 war gepr\u00e4gt durch viele Unsicherheiten und die R\u00fcckkehr der Coronavirus-Infektionswelle. Sp\u00e4testens seit dem Ausbruch der Pandemie sind Begriffe wie Next Normal und digitale Nutzererfahrung in das Vokabular vieler Menschen eingezogen. Zudem haben durch die ver\u00e4nderten gesellschaftlichen und wirtschaftlichen Voraussetzungen viele Online-Dienste und digitale Plattformen einen enormen Anstieg der Nutzerzahlen erfahren. Doch was passiert, wenn die Internetverbindung unterbrochen wird und alles gezwungenerma\u00dfen offline geht? Wir hatten ja Ausf\u00e4lle von Facebook, den Amazon Web Services (AWS) etc.<\/p>\n<p><!--more--><\/p>\n<p>F\u00fcr viele Unternehmen bedeuten Ausfallzeiten Umsatz- und Reputationsverluste sowie eine m\u00f6gliche Ressourcenverschwendung, um auf Vorf\u00e4lle zu reagieren. Dabei ist es m\u00f6glich, die Auswirkungen solcher Vorf\u00e4lle zu umgehen oder zu minimieren, indem man aus den Erfahrungen anderer lernt. Das Network-Intelligence-Unternehmen <a href=\"https:\/\/web.archive.org\/web\/20221204062958\/https:\/\/www.thousandeyes.com\/blog\/aws-outage-analysis-december-15-2021\" target=\"_blank\" rel=\"nofollow noopener\">Cisco ThousandEyes<\/a> hat alle derartigen St\u00f6rungen beobachtet und analysiert.\u00a0 Grund genug, die weitreichendsten und bedeutendsten St\u00f6rungen aus dem Jahr 2021 zu rekapitulieren.<\/p>\n<ul>\n<li><a href=\"https:\/\/web.archive.org\/web\/20221204062958\/https:\/\/www.thousandeyes.com\/blog\/aws-outage-analysis-december-15-2021\" target=\"_blank\" rel=\"noopener\">Amazon Web Services \u2013 15. Dezember 2021<\/a><strong>:<\/strong> Ein kurzer Ausfall von Amazon Web Services (AWS) betraf Dienste und Anwendungen in den Regionen US-WEST-1 und US-WEST-2. Der Vorfall dauerte etwa 45 Minuten, und trat zu Beginn des Arbeitstages an der Westk\u00fcste der USA auf. So wurde der Zugang zu Authentifizierungs- und Kollaborationsplattformen, die auf AWS angewiesen sind, unterbrochen \u2013 darunter Okta, Workday und Slack. AWS best\u00e4tigte die Beobachtung von ThousandEyes, dass Probleme mit der Netzwerkkonnektivit\u00e4t aufgrund von durch \u00dcberlastung verursachten Datenverlusten daf\u00fcr verantwortlich waren.<\/li>\n<li><a href=\"https:\/\/web.archive.org\/web\/20230127172837\/https:\/\/www.thousandeyes.com\/blog\/aws-outage-analysis-dec-7-2021\" target=\"_blank\" rel=\"noopener\">Amazon Web Services \u2013 7. Dezember 2021<\/a>: Ebenfalls bei AWS, dem gr\u00f6\u00dften Anbieter von Cloud-Computing-Diensten in den USA, kam es Anfang Dezember zu einem noch gr\u00f6\u00dferen Ausfall. Die Unterbrechung dauerte \u00fcber eine Stunde und verursachte Probleme, die sich auf die Benutzer mehrerer wichtiger Dienste auswirkten, darunter AWS Console, Amazon Prime Now und Amazon Pharmacy. Auch viele Dienste, die auf AWS angewiesen sind, wie IoT-Ger\u00e4te f\u00fcr Verbraucher wie Roomba und Ring, waren davon betroffen. Gro\u00dfe Streaming-Dienste wie Disney+ und Netflix waren ebenfalls nicht verf\u00fcgbar.Dieser Ausfall hatte vor allem erhebliche Auswirkungen auf die Anwendungen und Dienste von Unternehmenskunden. So mussten viele besorgte IT-Spezialisten in Unternehmen mehr als eine Stunde lang darauf warten, dass die Status-Seite des Anbieters die Hintergr\u00fcnde des Vorfalls anzeigte.<\/li>\n<li><b><a href=\"https:\/\/web.archive.org\/web\/20221204060029\/https:\/\/www.thousandeyes.com\/blog\/facebook-outage-analysis\" target=\"_blank\" rel=\"noopener\">Facebook \u2013 4. Oktober 2021<\/a><\/b>: Am 4. Oktober konnten die Dienste von Facebook, Instagram und WhatsApp nicht mehr abgerufen werden. Der Ausfall betraf hunderte Millionen, wenn nicht Milliarden von Nutzern weltweit. Zus\u00e4tzlich gab es Meldungen \u00fcber Probleme mit Dienstanbietern, die aufgrund des hohen Internetverkehrsaufkommens von Facebook ebenfalls betroffen waren.Der regul\u00e4re Betrieb konnte f\u00fcr alle drei Messaging-Plattformen sieben Stunden sp\u00e4ter wiederhergestellt werden. Verst\u00e4ndlicherweise wirft dieser Ausfall einige Fragen auf. Wie konnte es dazu kommen? Wieso dauerte es bis zur Wiederherstellung der Dienste durch das erfahrene Netzwerkbetriebsteam des Social-Media-Unternehmens so lange?\n<p>Der Ausfall von Facebook stellte in Bezug auf Umfang und Dauer eine erhebliche St\u00f6rung dar, die auch monet\u00e4re Auswirkungen hatte: Laut <a href=\"https:\/\/www.forbes.com\/sites\/petersuciu\/2021\/10\/05\/experts-weigh-in-on-what-caused-facebooks-outage\/?sh=7459cb85212a\">Forbes<\/a> soll der Ausfall zu Umsatzeinbu\u00dfen in H\u00f6he von 60 bis 100 Millionen US-Dollar und einem R\u00fcckgang der Marktkapitalisierung um 47,3 Milliarden US-Dollar gef\u00fchrt haben. Ich hatte im Blog mehrfach berichtet, siehe Links am Artikelende.<\/li>\n<li><b><a href=\"https:\/\/web.archive.org\/web\/20221204043924\/https:\/\/www.thousandeyes.com\/blog\/akamai-edge-dns-outage-analysis\" target=\"_blank\" rel=\"noopener\">Akamai DNS \u2013 22. Juli 2021<\/a><\/b>: Ende Juli kam es bei Akamai zu einem weitreichenden Ausfall. Dieser f\u00fchrte dazu, dass Nutzer weltweit die Websites von Kunden des Unternehmens nicht mehr erreichen konnten. Der Ausfall dauerte \u00fcber eine Stunde und hatte erhebliche Auswirkungen auf viele Websites und Anwendungen, die unter anderem im Bankwesen, Flugverkehr und im Gaming-Bereich genutzt werden.Akamai DNS ist ein kritischer Dienst, der Nutzer zum CDN-Edge von Akamai weiterleitet. Nutzer, die versuchten, von Akamai gehostete Webseiten aufzurufen, erhielten w\u00e4hrend des Ausfalls eine Fehlermeldung. Der Grund: Die von ihnen jeweils angeforderte Domain konnte nicht in eine g\u00fcltige IP-Adresse aufgel\u00f6st werden.\n<p>Der Ausfall war von besonderer Bedeutung, da er nicht nur Akamai-Kunden betraf, sondern auch diejenigen, die auf Dienste von Akamai angewiesen sind. Unternehmen, die einen Multi-CDN-Ansatz verwenden, wie Amazon, blieben von den Auswirkungen dieses Vorfalls weitgehend verschont.<\/li>\n<li><b><a href=\"https:\/\/web.archive.org\/web\/20221205141448\/https:\/\/www.thousandeyes.com\/blog\/akamai-prolexic-routed-outage-analysis\" target=\"_blank\" rel=\"noopener\">Akamai Prolexic Routed \u2013 16. Juni 2021<\/a><\/b>: F\u00fcr australische Internetnutzer und diejenigen, die in der asiatisch-pazifischen Region leben, war der 16. Juni 2021 ein besonders frustrierender Tag. Bei Prolexic Routed, dem DDoS-Abwehrdienst von Akamai, kam es zu einer Serviceunterbrechung, durch die die Webseiten einiger Kunden f\u00fcr unterschiedlich lange Zeit nicht erreichbar waren.Um seine Kunden vor DDoS-Angriffen zu sch\u00fctzen, bereinigt Prolexic Routed den eingehenden Datenverkehr. Dazu werden (mit Erlaubnis) Kundenpr\u00e4fixe anzeigt, bevor eingehende Anfragen an das jeweilige Netzwerk weitergeleitet werden. Die Ursache f\u00fcr diesen Vorfall war eine versehentliche \u00dcberschreitung des Limits der Routing-Tabelle.\n<p>Der Ausfall dauerte \u00fcber vier Stunden, wobei die st\u00e4rksten Auswirkungen in den ersten Minuten auftraten. Verschiedene Dienste waren je nach Standort, Tageszeit und zuvor erstellten Backup-Pl\u00e4nen unterschiedlich betroffen. Bestimmte Dienste hatten Failover-Systeme, die es ihnen erm\u00f6glichten, die Konnektivit\u00e4t wiederherzustellen \u2013 in einigen F\u00e4llen sogar innerhalb weniger Minuten.<\/li>\n<li><b><a href=\"https:\/\/web.archive.org\/web\/20221205143817\/https:\/\/www.thousandeyes.com\/blog\/inside-the-fastly-outage-analysis-and-lessons-learned\" target=\"_blank\" rel=\"noopener\">Fastly \u2013 10. Juni 2021<\/a><\/b>: Im Juni kam es bei Fastly zu einem massiven Ausfall, von dem weltweit 85 Prozent der Dienste betroffen waren. Ein versteckter Softwarefehler l\u00f6ste den einst\u00fcndigen Ausfall aus, als ein Kunde ein Routine-Update seiner CDN-Konfiguration durchf\u00fchrte. Wer versuchte, die betroffenen Websites oder Anwendungen zu erreichen, erhielt wahrscheinlich die Fehlermeldung <i>501 \u2013 Service Unavailable<\/i>.Der Ausfall betraf viele gro\u00dfe Websites, darunter auch Reddit oder das Webangebot der New York Times. Sogar Amazon und eBay waren stellenweise betroffen, weil diese ebenfalls auf die Dienste von Fastly zur\u00fcckgreifen. Erw\u00e4hnenswert ist, dass die Auswirkungen f\u00fcr jeden dieser Medien- und E-Commerce-Anbieter <a href=\"https:\/\/web.archive.org\/web\/20221205143817\/https:\/\/www.thousandeyes.com\/blog\/inside-the-fastly-outage-analysis-and-lessons-learned\" target=\"_blank\" rel=\"noopener\">sehr unterschiedlich<\/a> waren, obwohl die Ursache f\u00fcr den Ausfall dieselbe war.<\/li>\n<\/ul>\n<p>Die obigen F\u00e4lle zeigen, dass die Ausf\u00e4lle der popul\u00e4ren Cloud-Dienste massive Auswirkungen haben. Wobei ich oben keine Azure-Ausf\u00e4lle thematisiert habe. Von Sicherheitsproblemen in diesem Bereich war auch noch nicht die Rede.<\/p>\n<p>&nbsp;<\/p>\n<h2>Ma\u00dfnahmen f\u00fcr ein resilienteres Jahr 2022<\/h2>\n<p>Aus den Ausf\u00e4llen von 2021 zieht ThousandEyes einige grundlegende Lehren, wie Organisationen resilenter gegen\u00fcber obigen Ausf\u00e4llen werden k\u00f6nnen.<\/p>\n<ul>\n<li><b>Greifen Sie auf praktische Redundanzkonzepte zur\u00fcck.<\/b> Erw\u00e4gen Sie die Nutzung von mehr als einem Anbieter f\u00fcr kritische Dienste wie CDN und DNS.<\/li>\n<li><b>Analysieren Sie die Funktionsweise Ihrer Servicebereitstellungskette.<\/b> Diese kann sich auf mehrere Abh\u00e4ngigkeiten st\u00fctzen. Daher ist es wichtig, alle Abh\u00e4ngigkeiten zu kennen, auch die indirekten oder \u201eversteckten\" sowie die externen Dienste.<\/li>\n<li><b>Gew\u00e4hrleisten Sie eine proaktive Visibilit\u00e4t in Ihre Standorte, Anwendungen und wichtigsten Abh\u00e4ngigkeiten.<\/b> Auf diese Weise k\u00f6nnen Sie am effizientesten feststellen, wann ein Serviceproblem aufgetreten ist und welche Strategie Sie anwenden m\u00fcssen, um St\u00f6rf\u00e4lle mit minimalen Auswirkungen auf Ihre Nutzer zu beheben.<\/li>\n<li><b>Erstellen Sie ein Notfallkonzept.<\/b> Selbst wenn Sie bew\u00e4hrte Verfahren und redundante Service-Architekturen implementiert haben, kann es immer noch zu unvorhergesehenen Ausf\u00e4llen kommen. Mit einem Backup-Plan f\u00fcr Ausfallszenarien k\u00f6nnen Sie Ausfallzeiten und Leistungseinbu\u00dfen bei Ihren Diensten minimieren.<\/li>\n<\/ul>\n<p>Die Ausf\u00e4lle 2021 zeigen eindr\u00fccklich, dass selbst die modernste Infrastruktur durchaus von Fehlern und Ausf\u00e4llen betroffen sein kann. Auch wenn Ausf\u00e4lle unvermeidlich sind, sollten Sie bestimmte Ma\u00dfnahmen implementiert haben, um diese schadlos zu \u00fcberstehen. IT-Teams k\u00f6nnen durch die Analysen und Erkenntnisse der gr\u00f6\u00dften Ausf\u00e4lle in diesem Jahr bessere Prozesse, Redundanzen und Failover-Systeme entwickeln, um die zu erwartenden Ausfallzeiten im Jahr 2022 zu kontrollieren und zu minimieren.<\/p>\n<p><strong>\u00c4hnliche Artikel:<\/strong><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2020\/11\/25\/strung-bei-amazon-aws-25-11-2020\/\">St\u00f6rung bei Amazon AWS (25.11.2020)<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2021\/12\/08\/amazon-aws-cloud-ausfall-sorgt-fr-chaos-8-12-2021\/\">Amazon AWS-Cloud-Ausfall sorgt f\u00fcr Chaos (8.12.2021)<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2021\/12\/15\/aws-schon-wieder-down-15-12-2021\/\">AWS schon wieder down (15.12.2021)<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2021\/10\/04\/facebook-instagram-und-whatsapp-weltweit-ausgefallen\/\">Facebook, Instagram und WhatsApp weltweit ausgefallen<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2021\/10\/06\/facebook-legt-ursachen-fr-strung-vom-4-10-2021-offen\/\">Facebook legt Ursachen f\u00fcr St\u00f6rung vom 4.10.2021 offen<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2021\/10\/08\/facebook-instagram-und-whatsapp-haben-wieder-probleme-8-10-2021\/\">Facebook, Instagram und WhatsApp haben wieder Probleme (8.10.2021)<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2021\/11\/21\/der-facebook-ausfall-und-die-abhngigkeiten-beim-identittsmanagement\/\">Der Facebook-Ausfall und die Abh\u00e4ngigkeiten beim Identit\u00e4tsmanagement<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>[English]Das Jahr 2021 war gepr\u00e4gt durch viele Unsicherheiten und die R\u00fcckkehr der Coronavirus-Infektionswelle. Sp\u00e4testens seit dem Ausbruch der Pandemie sind Begriffe wie Next Normal und digitale Nutzererfahrung in das Vokabular vieler Menschen eingezogen. Zudem haben durch die ver\u00e4nderten gesellschaftlichen und &hellip; <a href=\"https:\/\/borncity.com\/blog\/2021\/12\/28\/als-akamai-facebook-und-amazon-das-licht-ausging\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7263],"tags":[1171,987],"class_list":["post-260989","post","type-post","status-publish","format-standard","hentry","category-cloud","tag-cloud","tag-storung"],"_links":{"self":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/260989","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/comments?post=260989"}],"version-history":[{"count":0,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/260989\/revisions"}],"wp:attachment":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/media?parent=260989"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/categories?post=260989"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/tags?post=260989"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}