Nutzer von Microsofts Dienst Outlook.com kämpfen seit Ende September 2020 mit sporadischen Ausfällen. Ein Blog-Leser hat mich jetzt über Probleme zum 4. und 5. Oktober 2020 bei Outlook.com informiert. In den Medien taucht jetzt die Frage auf, ob Microsoft seine DevOps-Prozesse noch im Griff hat. Kunden scheinen durch die Ausfälle bei Office 365 in den letzten Tagen jedenfalls genervt und werfen diese Fragen auf.
Anzeige
Neue Störung bei Outlook.com (4.10)?
Bereits zum 1. Oktober 2020 hatte ich im Blog-Beitrag Outlook.com war gestört (1. Okt. 2020) über eine vierstündige Störung berichtet. Verursacht wurde diese, so Microsoft in einer nachgelagerten Meldung, durch eine ausgerollte Konfigurationsänderung per Update (heise berichtete hier). Zum 4. Oktober 2020 erreichte mich eine Mail von Blog-Leser Karl, dass Outlook.com erneut gestört sei. Er schriebt Mittags:
Ich habe heute mehrfach versucht mails zu über ein "'.live.de Konto ( MSN Outlook) an meinen Domainaccount zu versenden ( Mobil als auch PC).
Die Mails gehen zwar "raus", werden beim Empfänger nicht zugestellt.
Sind auch nicht im Spamfilter.
Aktuelle Recherche zeigt an, dass es wohl wieder Probleme gibt.
Die nachfolgende Grafik, die Karl mitgeschickt hat, zeigt ein Ereignis am späteren Morgen (4.10.2020).
Vor wenigen Stunden (5.10.2020) kam die Information:
Anzeige
die mails die am Mittag versandt wurden, sind erst am Abend dann gegen 22 Uhr eingetroffen.
Solange hat MS gebraucht die Mails dann weiterzusenden.
Wenigstens gingen die nicht verloren, weder die "produktiven", noch die Testmails.
Hat Microsoft ein DevOps-Problem
Kurze Ausfälle von Diensten kann es immer wieder geben. Aber inzwischen machen sich Leute aber Gedanken, ob die Häufung der Ausfälle von Microsofts Cloud-Diensten nicht auf eine grundsätzliche Schieflage hindeuten. Einen ersten Ansatz hatte ich die Tage bereits im Blog-Beitrag Microsoft Cloud: Ist Azure Active Directory ein Single Point of Failure? angerissen. Dort wurde auf das Problem hingewiesen, dass extrem viele Dienste auf Azur Active Directory angewiesen sind. Streikt diese Lösung, sind alle abhängigen Dienste auch tot.
Gestern ist mir dann obige Tweet unter die Augen gekommen, wo crn.com die Frage aufwirft, ob Microsoft ein DevOps-Problem hat. Hintergrund für die Frage sind die immer wieder auftretenden Ausfälle der Microsoft-Dienste und die daran anschließenden Erklärungen Microsofts, dass ein Update oder eine Konfigurationsänderung für den Ausfall verantwortlich sei.
DevOps beschreibt einen Prozessverbesserungs-Ansatz aus den Bereichen der Softwareentwicklung und Systemadministration. DevOps ist ein Kunstwort aus den Begriffen Development (englisch für Entwicklung) und IT Operations (englisch für IT-Betrieb). DevOps soll durch gemeinsame Anreize, Prozesse und Software-Werkzeuge (englisch: tools) eine effektivere und effizientere Zusammenarbeit der Bereiche Dev, Ops und Qualitätssicherung (QS) ermöglichen. Mit DevOps sollen die Qualität der Software, die Geschwindigkeit der Entwicklung und der Auslieferung sowie das Miteinander der beteiligten Teams verbessert werden.
Aufgeworfen wurde, laut crn.com-Artikel die Frage von einer ungenannt bleiben wollenden Quelle, die vom betreffenden Ausfall betroffen war. Sie wird mit folgenden Aussagen zitiert.
It looks to me like they have a DevOps problem. It looks like they are pushing out software updates that are causing the outages. They have so much going on right now, rolling Teams out at a breakneck pace. I think they are running into an issue where code tested out fine but there is a configuration problem when they deploy it.
Der Betroffene sieht ein DevOps-Problem bei Microsoft, weil die Änderungen und Software-Updates in einem halsbrecherischen Tempo ausgerollt würden und dann die die Ausfälle verursachen. Die Teams bei Microsoft hätten im Moment so viel zu tun, so dass sich Probleme häufen. Der Code sei zwar gut getestet worden, es aber ein Konfigurationsproblem gegeben habe, dieses Update bereitzustellen.
Microsoft hat gegenüber crn.com jegliche Stellungnahme bezüglich dieser Frage verweigert. Ein Sprecher des Unternehmens sagte nur, dass kein Unternehmen gegen kurzzeitige Ausfälle der Cloud immun sei – was natürlich stimmt. Die oben zitierte Quelle, wohl ein leitender Angestellter eines betroffenen Kunden, findet es äußerst beunruhigend, zwei Ausfälle von Office 365 in so kurzer Zeit zu sehen, die anscheinend das Ergebnis von Software-Code-Änderungen seien. Er wird im Artikel so zitiert:
Microsoft ist ein Unternehmen, das als Entwickler fungiert und im Allgemeinen für [gute] DevOps [Praxis] bekannt ist, so dass die Frage lautet: "Warum passiert das? Ich liebe Microsoft, aber warum wird ein Unternehmen, das 7,5 Milliarden Dollar für Github, das weltweit führende Unternehmen für Quellcode-Repositorys, bezahlt hat, von Code zu Fall gebracht, der nicht gut getestet wird oder Bugs enthält. Das ist lächerlich. Wenn wir diese Art von Produktionsausfall für einen Kunden verursachen würden, würden wir gefeuert und möglicherweise auf eine schwarze Liste der Kunden gesetzt. Wir müssen 1.000 als Partner schlagen.
Da steht für mich das 'Monopol von Microsoft' als Elefant im Raum und es stellt sich wirklich die Frage, ob der Cloud-Ansatz Microsofts, der die kommenden Jahre ja stark wachsen und den Umsatz für Microsoft tragen soll, gut aufgestellt ist. Wie seht ihr das?
Anzeige
Wenn die aktuellen Probleme so weiter gehen, sehe ich da das angepeilte "Wachstum" nicht. Zu schnell kann man mit solchen – anhaltenden – Problemen Kunden vergraulen.
MS scheint auch keine echte "Roadmap" zu haben, wohin die "Reise" gehen soll. Neues wird zu oft, zu früh implementiert. Und dies, obwohl – intern – noch Probleme bekannt sind.
Microsoft ist eben ein Elefant im "Tutu", der wenn es darauf ankommt, eben kein "Affengriff" hinbekommt…..
Wo ist denn das "Problem"? Dafür gibt es doch eine nachvollziehbare Begründung: Release early, release often. Nur so konnte beispielsweise auch Windows 10 extrem erfolgreich werden. ;)
Volkswagen hat das Prinzip auch verstanden, siehe Golf 8. ;)
Wie lautet denn die Alternative für den Manager von heute, der mit einem Blumenstrauss an Möglichkeiten gelockt wird, seine teure Hardware im Keller verschrotten darf und sich von günstigen Einstiegstarifen blenden lässt?