Outlook.com-Störungen (4. Okt. 2020) – hat Microsoft ein DevOps-Problem?

Nutzer von Microsofts Dienst Outlook.com kämpfen seit Ende September 2020 mit sporadischen Ausfällen. Ein Blog-Leser hat mich jetzt über Probleme zum 4. und 5. Oktober 2020 bei Outlook.com informiert. In den Medien taucht jetzt die Frage auf, ob Microsoft seine DevOps-Prozesse noch im Griff hat. Kunden scheinen durch die Ausfälle bei Office 365 in den letzten Tagen jedenfalls genervt und werfen diese Fragen auf.


Anzeige

Neue Störung bei Outlook.com (4.10)?

Bereits zum 1. Oktober 2020 hatte ich im Blog-Beitrag Outlook.com war gestört (1. Okt. 2020) über eine vierstündige Störung berichtet. Verursacht wurde diese, so Microsoft in einer nachgelagerten Meldung, durch eine ausgerollte Konfigurationsänderung per Update (heise berichtete hier). Zum 4. Oktober 2020 erreichte mich eine Mail von Blog-Leser Karl, dass Outlook.com erneut gestört sei. Er schriebt Mittags:

Ich habe heute mehrfach versucht mails zu über ein "'.live.de Konto ( MSN Outlook) an meinen Domainaccount zu versenden ( Mobil als auch PC).

Die Mails gehen zwar "raus", werden beim Empfänger nicht zugestellt.

Sind auch nicht im Spamfilter.

Aktuelle Recherche zeigt an, dass es wohl wieder Probleme gibt.

Die nachfolgende Grafik, die Karl mitgeschickt hat, zeigt ein Ereignis am späteren Morgen (4.10.2020).

Outlook.com-Störung 4.10.2020

Vor wenigen Stunden (5.10.2020) kam die Information:


Anzeige

die mails die am Mittag versandt wurden, sind erst am Abend dann gegen 22 Uhr eingetroffen.

Solange hat MS gebraucht die Mails dann weiterzusenden.

Wenigstens gingen die nicht verloren, weder die "produktiven", noch die Testmails.

Hat Microsoft ein DevOps-Problem

Kurze Ausfälle von Diensten kann es immer wieder geben. Aber inzwischen machen sich Leute aber Gedanken, ob die Häufung der Ausfälle von Microsofts Cloud-Diensten nicht auf eine grundsätzliche Schieflage hindeuten. Einen ersten Ansatz hatte ich die Tage bereits im Blog-Beitrag Microsoft Cloud: Ist Azure Active Directory ein Single Point of Failure? angerissen. Dort wurde auf das Problem hingewiesen, dass extrem viele Dienste auf Azur Active Directory angewiesen sind. Streikt diese Lösung, sind alle abhängigen Dienste auch tot.

Tweet zu Office 365-Ausfällen

Gestern ist mir dann obige Tweet unter die Augen gekommen, wo crn.com die Frage aufwirft, ob Microsoft ein DevOps-Problem hat. Hintergrund für die Frage sind die immer wieder auftretenden Ausfälle der Microsoft-Dienste und die daran anschließenden Erklärungen Microsofts, dass ein Update oder eine Konfigurationsänderung für den Ausfall verantwortlich sei.

DevOps beschreibt einen Prozessverbesserungs-Ansatz aus den Bereichen der Softwareentwicklung und Systemadministration. DevOps ist ein Kunstwort aus den Begriffen Development (englisch für Entwicklung) und IT Operations (englisch für IT-Betrieb). DevOps soll durch gemeinsame Anreize, Prozesse und Software-Werkzeuge (englisch: tools) eine effektivere und effizientere Zusammenarbeit der Bereiche Dev, Ops und Qualitätssicherung (QS) ermöglichen. Mit DevOps sollen die Qualität der Software, die Geschwindigkeit der Entwicklung und der Auslieferung sowie das Miteinander der beteiligten Teams verbessert werden.

Aufgeworfen wurde, laut crn.com-Artikel die Frage von einer ungenannt bleiben wollenden Quelle, die vom betreffenden Ausfall betroffen war. Sie wird mit folgenden Aussagen zitiert.

It looks to me like they have a DevOps problem. It looks like they are pushing out software updates that are causing the outages. They have so much going on right now, rolling Teams out at a breakneck pace. I think they are running into an issue where code tested out fine but there is a configuration problem when they deploy it.

Der Betroffene sieht ein DevOps-Problem bei Microsoft, weil die Änderungen und Software-Updates in einem halsbrecherischen Tempo ausgerollt würden und dann die die Ausfälle verursachen. Die Teams bei Microsoft hätten im Moment so viel zu tun, so dass sich Probleme häufen. Der Code sei zwar gut getestet worden, es aber ein Konfigurationsproblem gegeben habe, dieses Update bereitzustellen.

Microsoft hat gegenüber crn.com jegliche Stellungnahme bezüglich dieser Frage verweigert. Ein Sprecher des Unternehmens sagte nur, dass kein Unternehmen gegen kurzzeitige Ausfälle der Cloud immun sei – was natürlich stimmt. Die oben zitierte Quelle, wohl ein leitender Angestellter eines betroffenen Kunden, findet es äußerst beunruhigend, zwei Ausfälle von Office 365 in so kurzer Zeit zu sehen, die anscheinend das Ergebnis von Software-Code-Änderungen seien. Er wird im Artikel so zitiert:

Microsoft ist ein Unternehmen, das als Entwickler fungiert und im Allgemeinen für [gute]  DevOps [Praxis] bekannt ist, so dass die Frage lautet: "Warum passiert das? Ich liebe Microsoft, aber warum wird ein Unternehmen, das 7,5 Milliarden Dollar für Github, das weltweit führende Unternehmen für Quellcode-Repositorys, bezahlt hat, von Code zu Fall gebracht, der nicht gut getestet wird oder Bugs enthält. Das ist lächerlich. Wenn wir diese Art von Produktionsausfall für einen Kunden verursachen würden, würden wir gefeuert und möglicherweise auf eine schwarze Liste der Kunden gesetzt. Wir müssen 1.000 als Partner schlagen.

Da steht für mich das 'Monopol von Microsoft' als Elefant im Raum und es stellt sich wirklich die Frage, ob der Cloud-Ansatz Microsofts, der die kommenden Jahre ja stark wachsen und den Umsatz für Microsoft tragen soll, gut aufgestellt ist. Wie seht ihr das?


Anzeige

Dieser Beitrag wurde unter Outlook.com, Störung abgelegt und mit , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

3 Antworten zu Outlook.com-Störungen (4. Okt. 2020) – hat Microsoft ein DevOps-Problem?

  1. Alfred Neumann sagt:

    Wenn die aktuellen Probleme so weiter gehen, sehe ich da das angepeilte "Wachstum" nicht. Zu schnell kann man mit solchen – anhaltenden – Problemen Kunden vergraulen.

    MS scheint auch keine echte "Roadmap" zu haben, wohin die "Reise" gehen soll. Neues wird zu oft, zu früh implementiert. Und dies, obwohl – intern – noch Probleme bekannt sind.

    Microsoft ist eben ein Elefant im "Tutu", der wenn es darauf ankommt, eben kein "Affengriff" hinbekommt…..

  2. Max sagt:

    Wo ist denn das "Problem"? Dafür gibt es doch eine nachvollziehbare Begründung: Release early, release often. Nur so konnte beispielsweise auch Windows 10 extrem erfolgreich werden. ;)

    Volkswagen hat das Prinzip auch verstanden, siehe Golf 8. ;)

  3. Onkel Hotte sagt:

    Wie lautet denn die Alternative für den Manager von heute, der mit einem Blumenstrauss an Möglichkeiten gelockt wird, seine teure Hardware im Keller verschrotten darf und sich von günstigen Einstiegstarifen blenden lässt?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros). Kommentare abseits des Themas bitte unter Diskussion.

Du findest den Blog gut, hast aber Werbung geblockt? Du kannst diesen Blog auch durch eine Spende unterstützen.