IT der Stadt Wuppertal ist down (17.2.2023)

Es sind die "technischen Probleme", die Kommunen in die "Auszeit zwingen". Die Stadt Wuppertal hat wohl die Flügel gestreckt und kämpft mit technischen IT-Problemen … Ergänzung: Es wird nun von einem Hardwareausfall berichtet.


Anzeige

Danke an den Leser für den telefon. Hinweis – auf Twitter hat die Stadt Wuppertal nur ein kurzes Statement über einen IT-Ausfall veröffentlicht. Es heißt, wegen technischer Probleme ist die Stadt Wuppertal weder telefonisch noch per E-Mail erreichbar.

Stadt Wuppertal: Schwerwiegende technische (IT) Probleme

Da auch von Präsenzterminen abgeraten wird, kann es nicht am kaputten Telefon oder abgerauchtem E-Mail-Server liegen. Auf der Webseite wuppertal.de der Stadt erscheint ebenfalls eine Störungsmeldung: (teilweise umgeleitet auf den Pressebereich. Das Web-Angebot der Stadt ist wohl offline – da ist was Größeres passiert.

Stadt Wuppertal: Schwerwiegende technische (IT) Probleme


Anzeige

Es steht irgendwie das böse Wort "Cyber" im Raum, was auf Angriff hindeutet. 2022 war die Bergische Universität Wuppertal Opfer eines Cyberangriffs. HW kaputt sehen ich als unwahrscheinlich an, die werden ja mehr als einen Rechner haben …

Wohl Hardwareausfall als Ursache?

Ergänzung: Ich staune gerade Bauklötze, denn es wird nun von einem Hardwareausfall berichtet, der die IT der Stadt Wuppertal in die Knie zwingt. Die Westdeutsche Zeitung (WZ) ist näher am Geschehen dran und schreibt in diesem Artikel, dass es Server-Probleme gebe. Stadtdirektor Stefan Kühn wird so zitiert, dass diese kurz nach Mitternacht zu Freitag "kaputtgegangen wären".

Was jetzt der Grund für den Serverausfall sei, ist noch nicht ganz klar. Es gebe keine Anzeichen für einen Hackerangriff, heißt es. Aber eine Cyber-Attacke wird auch nicht ausgeschlossen. Golem deutet hier dagegen, mit Verweis auf den WZ-Artikel, einen Hardware-Ausfall als Ursache an.

Von Stadtdirektor Stefan Kühn heißt es nur, dass man einige Teile an den Servern getauscht habe und hofft, "der Lösung" näher zu kommen. "Es wird jetzt das Wochenende durchgearbeitet. Unser Ziel ist, dass Montag alles wieder funktioniert.", wird der Stadtdirektor zitiert.

Inzwischen scheint sich die Situation zu entspannen. Nachdem die zuständige Fachfirma um 2:00 Uhr Nachts vor Ort war und Teile tauschte, konnte Freitag Mittag (17.2.2023) mit dem Hochfahren der Systeme begonnen werden. Ab 13:00 Uhr seien die städtischen Rufnummern wieder eingeschränkt erreichbar, schreibt die WZ. Der Mailserver soll wohl bald folgen.

Scheinbar hat Mc Murphy zugeschlagen, denn laut Stadtdirektor Stefan Kühn habe die Umschaltung auf den "Ersatzserver" reibungslos funktioniert – der spätere Wechsel auf den (wohl reparierten) Hauptserver ging aber schief. Demnach musste der Ersatzserver weiter her halten und der Hauptserver werde gründlich durchgecheckt – in der Hoffnung, dass Montag alles wieder läuft.

Erstaunt hat mich persönlich, dass eine Großstadt mit über 354.600 Einwohnern von der IT-Technik scheinbar doch etwas "schmalbrüstiger" aufgestellt ist – und einen Hauptserver sowie einen Ersatzserver als Rückgrat fährt, wobei die Umschaltung zwischen diesen Servern wohl problematisch ist.

Ergänzung 2: Mich erreichte der Hinweis, dass es "einen Ausfall der Hardware im Storage Bereich gegeben habe". Der WDR-Beitrag hier trägt dagegen noch mehr zur Verwirrung bei.

Zum Storage-Fehler hat mich ein Leser noch auf eine spekulative Theorie hingewiesen. Bei bestimmten (Toshiba) SSDs gab es Firmware-Fehler, so dass z.B. Fujitsu Servern mit bestimmten SSDs aufgrund dieses Firmwarefehlers nach 70.000 Std. den Dienst quittieren. Das Thema wurde in diversen Beiträgen von HP, Fujitsu und Oracle angesprochen.

 


Anzeige

Dieser Beitrag wurde unter Sicherheit abgelegt und mit verschlagwortet. Setze ein Lesezeichen auf den Permalink.

32 Antworten zu IT der Stadt Wuppertal ist down (17.2.2023)

  1. Daniel sagt:

    Der Webserver für die Hinweisseite läuft sicher auf Linux und ist nicht betroffen.

    Die Stadt Wuppertal hat sicher auch viele Produkte von Microsoft im Einsatz und sicher auch einige die nicht mehr unterstützt werden. Aber es wird sicher wieder neu aufgesetzt mit den gleichen Lücken wie vorher wie in allen anderen Bereichen und nicht mal ernsthaft über einen Umstieg nachgedacht.

    • Wil Ballerstedt sagt:

      Never change … du weißt schon; und wenn der Haushalt so klamm ist, wird's halt so versucht.

    • User007 sagt:

      Was soll'n die Kommunen denn auch machen – von Jetzt auf Gleich mit den nicht vorhandenen Finanzmitteln und dem nicht vorhandenen Fachpersonal alles auf Links drehen?
      Völlig realitätsfremd, da wird geflickt, so lang' bis eben i-wann wirklich überhaupt gar nix mehr geht – das is' eben gelebter Pragmatismus in D! 🤷‍♂️

    • Marc sagt:

      Wie ich so etwas liebe. Keine Ahnung über die Ursache der Störung haben, aber trotzdem mal rum tönen. Und natürlich direkt die "Mit Linux wäre das nicht passiert" Keule schwingen. Oh mann.

    • Andy sagt:

      Ach, dann halt mal schnell alles umstellen…
      Geht natürlich nicht.
      Was jeweils genau bremst, ist ziemlich individuell.
      Ich habe z.B. gerade die Möglichkeit, ein Fachverfahren auf Linux zu bringen.
      Die Migration hat aber nur bei Beteiligung des Herstellers Support. Nächst möglicher Termin des Herstellers: "vielleicht Ende 2024".
      Die Wirtschaftsunternehmen scheinen völlig überfordert, so überall irgendwie:
      Am Mittwoch ist endlich ein Kabel verlegt worden, das vor 12 Monaten beauftragt wurde.
      Ein Supportfall wegen einem defekten Hotspot hat eine Woche und 5 Anläufe gebraucht, bis das weitere Vorgehen beim Hersteller geklärt werden könnte. Es also überhaupt losgehen konnte.
      Eine ganze Liegenschaft ist seit 12 Monaten ohne Netz, weil die Telekom ihre Leitung nicht gelegt hat und eine andere Glasfaser nicht gelegt wurde. Wir haben Hoffnung für Sommer, ist ja auch nur eine Schule.
      Derzeit trifft massiver Änderungswahn im öffentlichen Bereich auf 0 wirtschaftliche Auschreibungsergebnisse und 0 Leistungsfähigkeit in ganzen Wirtschaftszweigen.

      Am besten, wir stellen jetzt noch alles auf Linux um, so nur mit den ganzen IT-Cracks in den Kommunen und ohne Support. Dann wird alles besser… ;)

      Man sollte vorschreiben, dass alle Neueinführungen nur noch mit Linux stattfinden sollten. Dann wird ganz sicher weniger Neueinführungsaktivismus und möglicherweise mittelfristig sogar weniger Windows zu finden sein.
      Hätte beides positive Auswirkungen auf die Sicherheit.

      Schönes Wochenende

    • Anonymous sagt:

      Du bist anscheinend ein Insider. Du hast aber die Quelle deiner Infos vergessen.

  2. janil sagt:

    Is egal… is Karneval…

  3. Egon sagt:

    Und die mit href="error.css" und src="wtal.png" statt besser mit href="/error.css" und src="/wtal.png" verlinkten Dateien auf der Fehlerseite müllen jetzt bei Aufruf aller ehem. Unterseiten das Error Log des Servers weiter zu und verursachen Darstellungsfehler wie im Screenshot im Betrag, einmal mit Profis…

    • User007 sagt:

      Sowas liegt aber leider oft auch an "Fehlern" in (Code)Generatoren.
      Oder glaubt jemand wirklich, da wird jede Codezeile händisch zusammengeschustert? Wohl eher nicht… 🤷‍♂️

      • Egon sagt:

        Sowas liegt vor allem an mangelhaftem technischen Verständnis, was da wo und wie zusammengeklickt wird.

        Eine "Desaster" Seite sollte ihr CSS inline mitbringen und Grafiken (wenn überhaupt) als Data-URI und auch einen favicon.ico Verweis als Data-URI, um jegliche weitere Requests zu vermeiden.

        Derzeit triggert ein wuppertal.de/blablubb/ Aufruf eine 404 Seite und zusätzlich noch drei weitere Requests die alle je einen weiteren 404 erzeugen.

        Es gibt im Moment sicherlich ganz andere Probleme dort, aber alleine schon an der mangelhaften "Desaster" Seite kann man ablesen, dass es allgemein ggf. auch an weiterem technischen Verständnis fehlen könnte, mit den derzeit sichtbaren Gesamtfolgen.

  4. Michael Schiller sagt:

    Bei unserer Stadt arbeiten nur Grosskotze und Versager.Man muss sich schämen hier geboren zu sein

  5. Singlethreaded sagt:

    Laut Golem.de soll es sich wohl um einen Hardware-Defekt und nicht um einen Cyberangriff handelt.

  6. Paul sagt:

    Auch geht das Telefon wieder (was wohl ohne Daten Zugriff nicht viel nutzt)

    Es sei problemlos auf einen Ersatz Server umgeschaltet worden, aber das Zurück auf den Hauptserver habe nicht geklappt, obwohl Mal physikalische Komponenten ausgetauscht hat ???
    siehe https://www.wz.de/nrw/wuppertal/it-ausfall-in-wuppertal-stadt-ist-telefonisch-wieder-erreichbar_aid-85099921

    es darf spekuliert werden. :-)
    Eine Platte eines RAID ausgefallen? (es war die letzte)?
    SSD ausgenudelt und nur noch readonly?
    ?

    • 1ST1 sagt:

      Ich würde sagen, 2 ESXi oder HyperV Server auf denen alles läuft, man denke an den Patchday und die inzwischen dringlichen anstehenden VMWare-Updates, einer sollte geupdated werden, alle VMs auf den anderen Server verschoben, und dann ging der kaputt.

      • Ottilius sagt:

        Dafür gibt's Clusterlösungen. Nur zwei Maschinen ist aus verschiedenen Gründen dilletantisch und mehr als fahrlässig.

        • rpr sagt:

          Na ja, etwas arg verkürzt aber ja selbst eine simple Vmware Essential Lizenz erlaubt 3 ESX Hosts für kleinere Umgebungen.
          2 Hosts sind ok wenn ein funktionierendes getestetes Backup/ Restore-Verfahren vorliegt und bei Bedarf Ersatzhardware halbwegs fix verfügbar ist.
          Gruß

  7. Paul sagt:

    Es ist aber seltsam, daß Vodafone die Hauptrechner bei Wartungsarbeiten an der Telefonanlage gehimmelt haben können soll.
    Oder haben die mehrere Wartungsvorgänge zusammengefasst, weil jetzt da ja wg. Fasching wenig Nachfrage ist? (Die Postbank wollte ja auch den Umzug auf die Deutsche Bankserver zwischen Weihnachten und Silvester erledigen..) Link
    Siehe auch update der LH-App (Link).
    War vielleicht zu viel?

    • rpr sagt:

      Die Postbank hat es letzte Woche geschafft das seit Anfang Januar defekte Login meiner Frau im Online-Banking zu fixen. Die Migration ist mal richtig beschissen gelaufen.

  8. Paul sagt:

    "Bei bestimmten (Toshiba) SSDs gab es Firmware-Fehler"

    Samsung rulez. …

    Aber auch die hatten mal einen ähnlichen Bug, der aber schneller gefixt wurde als die Teile vom Lager kamen.
    Sind halt auch nur Menschen.

    • 1ST1 sagt:

      Von wegen! Samsungs 980 und 990 SSDs altern in ihren SMART-Daten fehlerhaft schnell…

      Samsung has been investigating customer inquiries about anomalies related to the SMART of the 990 PRO SSD.
      These anomalies were found to be caused by issues with the 990 PRO SSD's firmware. Accordingly, a firmware update was released today, February 13, 2023, that fixes these anomalies.
      (SMART values ​​are not restored to factory settings after firmware update. Actual SMART values ​​of each SSD vary depending on user environment and usage conditions).
      The update can be downloaded from Samsung Magician or here:
      https://semiconductor.samsung.com/consumer-storage/support/tools/
      You can find our warranty conditions for the 990 PRO SSD athttps://semiconductor.samsung.com/consumer-storage/support/warranty/.

      • Paul sagt:

        Oh, Danke. Schon wieder. Mist.
        Ich hatte mich auch schon mal über die schlechte SMART Gesundheit gewundert, aber das war nicht Besorgnis erregend viel und sie sollten eh alle 5 Jahre erneuert werden. (Systeme sind nicht so kritisch).

        Also immer Samsung und Toshiba im RAID mixen.
        Schöne neue Welt…

  9. Paul sagt:

    Fujitsu schreibt, das die 70000 Stunden (7 Jahre 11 Monate) bei den ersten Kunden jetzt im Februar 2023 erfüllt sind. Leider gibt es keine Serien Nummern.
    Wenn die Platte im RAID eingesetzt sind, dann fallen natürlich alle Platten gleichzeitig aus…
    Ein Firmware Update würde helfen.

    Eigentlich hätte sich der Distri schon im Dezember 2021 melden müssen/können. Aber dank Ausschreibung, hat der Billigste den Zuschlag bekommen, you get what you pay for…?

    Schönes Wochenende…

    PS.
    Die 70000 kommen von einem Logfile, das die Platte schreibt… Wozu?

    • Paul sagt:

      Möglicherweise erklärt das auch, warum diee Telefon Anlage kurz aus gefallen war.
      Die werden ja alle Server zur gleichen Zeit gekauft haben. Die Telefon-Anlage konnten sie wohl rel. einfach "Baremetal" restaurieren.

      Das muß für die Admins wie ein Albtraum gewesen sein.

  10. Paul sagt:

    Der Ausfall erfolgt wohl erst nach einem Power Cycle.
    Daher möglicher weise der Zusammenhang mit den Arbeiten an der Telefonanlage.

    Der Firmware update läßt sich aber ohne Neustart und Datenverlust einspielen.
    Insofern ist nicht verständlich, warum man das nicht gemacht haben soll. Zumal das Teil ja eh sauber runtergefahren worden wäre.
    Aber vielleicht wussten die Fachfirma nichts davon und sahen nur das die SSDs kaputt waren.
    Ende Spekulationen

  11. JR sagt:

    Was soll da „schmalbrüstig" aufgestellt sein, lieber Herr Born? Falls ein SAN als typische moderne (Storage-)Infrastruktur verwendet wird (worauf einiges am bislang bekannten Befundbild m.E. hindeutet), kann's trotz Redundanz zu solchen Situationen kommen, sobald bspw. die Controller in der fabric nach Firmware-Update unerwartet die Grätsche machen; beliebter Praxisfälle sind die FC-Adapter. Dann hilft selbst Dreifach-Redundanz mittels zusätzlichem Dritten VC nix mehr, sondern nur vernünftige QS auf Herstellerseite.

  12. Paul sagt:

    Redundanz ersetzt kein Backup, sondern verbessert nur die Verfügbarkeit…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros). Kommentare abseits des Themas bitte unter Diskussion.

Du findest den Blog gut, hast aber Werbung geblockt? Du kannst diesen Blog auch durch eine Spende unterstützen.