Noch ein kleines Wochenendthema: Was kostet eigentlich ein Ausfall einer Rechnerinfrastruktur ein Unternehmen? Mit sind vor einigen Tagen einige Zahlen von Gartner in die Hände gefallen, die ich interessierten Leser/innen nicht vorenthalten möchte.
Anzeige
Können aufgrund eines Netzwerkausfalls Mitarbeiter nicht mehr auf ihre Arbeitsumgebung zugreifen oder werden ganze Produktionsabläufe oder Auslieferungsprozesse gestört, kann es teuer werden: 4.900 Euro pro Minute kostet Downtime ein Unternehmen durchschnittlich laut Gartner. Bezieht man unterschiedliche Unternehmensbranchen mit ein, reichen die Downtime-Kosten von 120.000 Euro bis zu 475.000 Euro pro Stunde.
Grund für die hohen Ausfallzeitkosten ist die immer umfangreichere Digitalisierung verschiedenster Unternehmensprozesse. Überall laufen mehr und mehr kritische Daten über Netzwerke. So wird der Zugriff beispielsweise auf Anwendungen und Daten aus der Cloud in vielen Unternehmen mittlerweile häufig unabdingbar, um reibungslose Geschäftsabläufe zu gewährleisten.
Das Absichern einer robusten Connectivity ist auch für den IoT-Bereich geschäftskritisch. Die Einsatzgebiete sind mittlerweile vielfältig: seien es Maschinen in der smarten Fabrik, vernetzte Heiz-, Lüftungs- und Kühltechnik im Facility Management, intelligente Verkehrs- und Transportsysteme oder Buchungs- oder Kassensysteme in Einzelhandel, Gastronomie und Hotellerie.
Mit der fortschreitenden Digitalisierung wird die Verhinderung von Ausfallzeiten zu einer Kernaufgabe für Unternehmen. Denn die betriebswirtschaftlichen Folgen eines Ausfalls infolge von Umsatzverlust, Schadensersatzforderungen durch Kunden sowie erhöhte Personalkosten können schnell existenzgefährdend sein. Ganz abgesehen von einem möglichen Imageschaden für das betroffene Unternehmen.
Anzeige
Herausforderungen der Fernüberwachung von kritischen IT-Infrastrukturen
Branchenübergreifend ist daher besonders für Unternehmen mit Filialnetzen, verteilten Rechenzentren, Produktions- oder Office-Standorten ein verlässlicher Fernzugriff für ihre kritische IT-Infrastrukturen entscheidend, um Downtime zu minimieren. Denn ein verteiltes Netzwerk hat von Natur aus mehr Schwachstellen und ist anfälliger für Serviceunterbrechungen.
Gängige Methoden für Fernzugriff und Wartung sind häufig herkömmliche In-Band-Tools wie Telnet (Teletype Network). Das Problem: Diese Tools sind auf die Verfügbarkeit des Netzwerks angewiesen. Bei großen technischen Problemen wie Netzwerk- oder Konnektivitätsausfällen kann das IT-Team jedoch nicht mehr aus der Ferne auf Geräte zugreifen. Stattdessen muss ein technischer Mitarbeiter im Außeneinsatz zeit- und kostenaufwändig vor Ort klären, ob zum Beispiel ein Ersatzteil oder ein neues Gerät bestellt werden muss. Dadurch steigen die Meantime to Repair (MTTR) sowie die Netzwerkausfallzeit und mit ihr die Folgekosten durch Störung der Geschäftskontinuität.
Um dieses Problem zu lösen, benötigen IT-Teams deshalb ein Framework, das auf einem zweiten, unabhängigen Weg jederzeit eine Verbindung zu kritischen Infrastrukturen herstellen kann; einschließlich der Netzwerkgeräte wie Router, Switches, WAN-Optimierungslösungen, Firewalls sowie verteilter Anwendungen und Server.
Out-of-Band-Management: Unabhängige Überwachung und Fernzugriff
Netzwerkgeräte verfügen in der Regel über serielle Schnittstellen. Diese lassen sich unabhängig vom primären Netzwerk ansprechen und geben dem Administrator damit einen vollen Überblick über den Status eines Geräts. IT-Teams können so per Out-of-Band (OOB) eine alternative Verbindung aufbauen, wenn das primäre Netzwerk ausfällt. Zudem lässt sich damit auf kritische Geräte zugreifen, um diese per Fernwartung reparieren oder den genauen Fehler feststellen zu können.
Heutige Out-of-Band-Management-Lösungen bieten dabei nicht nur die serielle Schnittstelle, sondern auch USB-, Ethernet- und Fibre-Management-Anschlüsse sowie eine Ausfalllösung per Mobilfunk (4G LTE oder 3G) für eine schnelle Verbindung. Dabei überwachen OOB-Console-Server konstant den Datenverkehr und aktivieren eine Mobilfunkverbindung nur dann, wenn die übliche Ethernet-Verbindung ausfallen sollte. Dadurch bleiben übertragene Datenmengen und die Kosten überschaubar.
Automatisierung von Diagnose, Reparatur und Reporting
Mit Out-of-Band-Management lassen sich viele Probleme automatisch erkennen, bevor sie den lokalen Datenverkehr beeinträchtigen. OOB-Lösungen können mittels eines Autoresponse-Systems Netzwerkausfälle beheben, indem sie Diagnose- und Reparaturhilfen für häufig auftretende Fehler verwenden. Dies geschieht mit Wiederherstellungsskripten ohne menschliches Eingreifen.
So erkennt ein Out-of-Band-Console-Server zum Beispiel einen nicht mehr erreichbaren Router automatisch und führt in diesem Fall einen Neustart durch. Mittels Sensoren lässt sich zudem nahezu die gesamte Infrastruktur überwachen, inklusive der physischen Umgebung wie Temperatur, Feuchtigkeit, Rauch oder Vibrationen. Falls etwa die Temperatur im Rack zu hoch sein sollte, kann ein entsprechend konfigurierter OOB-Console-Server Netzwerk-Komponenten ordnungsgemäß herunterfahren, bevor ein Schaden entsteht.
Für alle Vorfälle können automatisch Alarme per E-Mail, SMS und SNMP-Traps an die Administratoren versendet werden, inklusive Protokollierung für detaillierte Berichte. Auch ein automatisiertes Strom-Management ist möglich. Administratoren können die Verwaltung von hunderten PDUs und USV-Systemen verschiedener Anbieter konsolidieren.
Zudem erlaubt eine entsprechende OOB-Management-Software eine zentrale Verwaltung aller Geräte sowie die schnelle Einbindung neuer Geräte in die bestehende Netzwerkstruktur. OOB-Console-Server, die beispielsweise einmal durch den Administrator am Hauptunternehmensstandort vorkonfiguriert wurden, müssen am Remote-Standort nur noch verkabelt werden (ZTP, Zero Touch Provisioning). Auch können mehrere Geräte gleichzeitig vorkonfiguriert werden. Dies reduziert sowohl Bereitstellungkosten als auch menschliche Fehlerquellen.
Anzeige
Ich befürchte selbst mit den oben angeführten stündlichen Kosten ist es nicht einfach das Management zur Investition in OOB-Lösungen zu überzeugen.
Telnet ist in allen Umgebungen, in denen ich die letzten 10 Jahren gearbeitet habe, verboten gewesen, einfaches FTP auch. Weil nicht sicher, aber es gibt jeweils eigentlich sichere Nachfolger, z.B. SSH, SFTP, usw.
OOB in Außenstellen kann nur funktionieren, wenn nicht zentrale Geräte der Außenstelle, der gar die Verbindung dorthin selbst unterbrochen ist. Seriell eignet sich eher selten zur Ferndiagnose, sofern man nicht vor Ort einen Hansel hat, der serielle Kabel umstöpseln kann. Vor allem braucht man noch einen PC mit serieller Schnittstelle, oder einen USB-Adapter, der auch wirklich funktioniert.