[English]Der Hersteller HPE warnt erneut vor einem Problem bei seinen SSDs für Server-Storage-Systemen. Durch einen Software-Bug in der Firmware können die SSDs nach 40.000 Stunden ausfallen. Ein Firmware-Update ist verfügbar.
Anzeige
Ich hatte bereits im November 2019 erstmals im Beitrag HPE SSD-Storage Systeme bald vom Ausfall bedroht auf den Sachverhalt hingewiesen. Damals war ein Zähler in einer Firmware, der nach 32.768 Betriebsstunden einen Datenverlust verursachte, das Problem. Obwohl der Ausfallmodus ähnlich wie beim Fall aus dem November 2019 ist, ist, steht dieses Problem nicht in Zusammenhang mit dem damals beschriebenen SSD-Problem.
Datenverlust nach 40.000 Stunden
In dieser Support-Mitteilung warnt HPE nun vor einem neuen Ausfall-Szenario. Bestimmte Modelle der HPE SAS-Solid-State-Laufwerke benötigen eine kritische Firmware-Aktualisierung, um einen Laufwerksausfall bei 40.000 Betriebsstunden zu verhindern. HPE wurde von einem Hersteller von Solid State Drives (SSD) über einen Firmware-Defekt informiert, der bestimmte SAS-SSD-Modelle betrifft:
HPE Model Number | HPE SKU | HPE SKU DESCRIPTION | HPE Spare Part SKU | HPE Firmware Fix Date |
EK0800JVYPN | 846430-B21 | HPE 800GB 12G SAS WI-1 SFF SC SSD | 846622-001 | 3/20/2020 |
EO1600JVYPP | 846432-B21 | HPE 1.6TB 12G SAS WI-1 SFF SC SSD | 846623-001 | 3/20/2020 |
MK0800JVYPQ | 846434-B21 | HPE 800GB 12G SAS MU-1 SFF SC SSD | 846624-001 | 3/20/2020 |
MO1600JVYPR | 846436-B21 | HPE 1.6TB 12G SAS MU-1 SFF SC SSD | 846625-001 | 3/20/2020 |
Die SSD-Modelle wurden in einer Reihe von HPE-Server- und Speicherprodukten (d.h. HPE ProLiant, Synergy, Apollo 4200, Synergy-Speichermodule, D3000-Speichergehäuse, StoreEasy 1000-Speicher) verbaut. Das Problem betrifft SSDs mit einer HPE-Firmwareversion vor HPD7, die bei 40.000 Betriebsstunden (d.h. 4 Jahre, 206 Tage, 16 Stunden) zu einem SSD-Ausfall führt.
Dieses Problem betrifft möglicherweise auch andere Hersteller und Kunden, die diese Laufwerke gekauft haben. In diesem Artikel schreibt heise, dass auch Dell-Systeme betroffen seien und dass mutmaßlich SSDs von Sandisk verbaut sind.
Die Lösung besteht darin, sofort auf die von HPE herausgegebene Laufwerks-Firmware Version HPD7 zu aktualisieren. vermeiden. HPE empfiehlt die Durchführung eines Online-Firmware-Updates auf HPE Gen9-Servern bei minimaler E/A-Aktivität. Dies erfordert in den meisten Fällen keinen Neustart. In Fällen, in denen das Online-Firmware-Update nicht erfolgreich abgeschlossen wird, ist jedoch ein Offline-Update erforderlich. Nach Abschluss des Flash-Updates gibt die Smart-Komponente eine Meldung darüber aus, ob das Flash erfolgreich abgeschlossen wurde.
Anzeige
WICHTIG: Diese HPD7-Firmware gilt als kritische Korrektur und ist erforderlich, um das unten beschriebene Problem zu beheben. HPE empfiehlt dringend die sofortige Anwendung dieses kritischen Fixes. Die Vernachlässigung der Aktualisierung auf die SSD-Firmware-Version HPD7 führt bei 40.000 Betriebsstunden zu einem Laufwerksausfall samt Datenverlust und erfordert die Wiederherstellung von Daten aus der Sicherung, sofern keine Fehlertoleranz (wie z.B. RAID 0 oder in einem fehlertoleranten RAID-Modus) besteht. Weitere Details, auch zu den Firmware-Updates lassen sich hier abrufen.
Anzeige
Wie kann man eine Firmware nur so unsauber schreiben?
Denn darauf läuft es wohl hinaus. Irgendein Programmierer hat hier einen "Zeiger" falsch gestellt. Dieser sollte doch außerhalb der Garantiezeit liegen ;-)
Wieder einmal ein schönes Beispiel für geplante Obsoleszenz, die eben "zu knapp" bemessen war.
Die SSDs gehen doch alle ohne Ausnahme ein und das wird Konsequenzen haben und auch einen großen Hersteller in den Ruin treiben. Wer kauft denn dann noch etwas von ihm?
Supportende spielt da keine Rolle, wenn es als Sabotage ausgelegt wird. .
Mal eine Frage: Stellt HPE SSD-Datenträger her?
Ich denke nicht.
Es kann an den SSD-Datenträgen liegen oder an der Software (von HPE?), die die Dinger zerstören.
Mit hat es eine Festplatte im RAID-Modus "zerschossen", MY Cloud Mirror von WD. Nie wieder Festplatten spiegeln. Es bringt nichts und macht alles kaputt; lieber klassische Variante. Ich bin sehr sauer, da das Ganze auch sehr teuer ist.
Natürlich habe ich keinen Datenverlust, nur Ärger. Was mache ich mit der anderen RED-WD-Festplatte (die ok ist) . Ich habe diese dort wieder eingebaut. Da kann man speichern, aber immer mit einem blöden Gefühl.
Bei heise wird über Sandisk spekuliert – und ja, es scheint ein Bug in der Firmware zu sein.
>Mal eine Frage: Stellt HPE SSD-Datenträger her?
Ist egal wer das tut, die verkaufen die mit ihrem Namen. Firmware und Hardware haben zu funktionieren. Es gibt auch bei Aufträgen Lasten- und Pflichtenhefte.
>Ich denke nicht.
Man merkts.
Setzt man also nicht HPE Datenträger ein, wird das RAID gleich als DEGRADED gemeldet, das ganze läuft aber.
Setzt man HPE* Datenträger ein ist alles i.O. aber "irgendwann geht nix mehr.
*also die echten mit der Goldkante
Das Problem ist doch mE zweiseitig.
# Entweder stimmt die Firmware nicht, die was zerschießt.
# Oder es sind die Festplatten.
Es kann doch nicht sein, dass man extra teure und extra sichere Festplatten (SSD oder andere) installiert und die dann kaputt gehen. Das hängt mit der Betriebsdauer doch nur selten zusammen. Ich habe aus gegebenen Gründen WD-Festpatten im Einsatz und habe auf meinem HP-PC (Jan 2013 gekauft) diese nun mit einer Black-WD ausgetauscht. Auch ich hatte mal einen kompletten Crash einer externen Festplatte. Das war sehr ärgerlich.
Es macht dann auch das normale sichern keinen Spaß, wenn die Sicherungsfestplatte dann sagt "keine Lust". Oder eben die neu eingebaute.
Das Festplatten-Thema kommt bei Günter ab und zu mal hoch. Es ist aber nicht zu unterschätzen, denn ohne Festplatte geht gar nichts. Es gibt auch keine sinnvollen Programme, die sinnvoll ein Problem melden. Das einzig Positive, was mir einfällt ist das Programm "CrystalDiskInfo". Viele Festplatten-Testprogramm kann man vergessen und seit Win10 ist es totaler Müll, was Win10 da anbietet.
Lass ich eine Festplatte mit bekannten Fehlers und schlechten SMART-Werten überprüfen, so meldet mit Win10 tatsächlich, dass alles i.o. sei.
Ach so, Sandisk wurde von WD aufgekauft. Dann sind SSD-Festplatten anders gestrickt als "normale" Festplatten. Sandisk-chips funktionieren nie so lange wie man meint. Alte Fotos auf alte Sandisk, "ha, ha" :)
Heute hat meine Sandisk SSD Plus (verbaut in HP-Desktop von 2016) den Geist aufgegeben.
System blieb zunächst hängen und nach einem Neustart wurde nichts gebootet.
Wurde plötzlich als "Sandisk Milpitas SSD" mit 16kb (Größe war ursprünglich 256mb) erkannt und konnte nicht booten, hier die Info von "smartctl":
=== START OF INFORMATION SECTION ===
Device Model: Sandisk Milpitas SSD
Serial Number: [No Information Found]
Firmware Version: 0.00
User Capacity: 16.384 bytes [16,3 KB]
Sector Size: 512 bytes logical/physical
Auch wenn ich nicht auf die 40000 Betriebsstunden komme, frage ich mich, ob das ein ähnliches Problem sein könnte.
Angekündigt hat sich der Fehler jedenfalls nicht, das ganze passierte quasi von jetzt auf gleich nach dem Entsperren des PC's.
Es waren soweit ich weis auch keine großartigen Dateioperationen im Hintergrund.
Dass das falsche Modell und keine Seriennummer ermittelt wird spricht ja eigentlich dafür dass das ein Firmware bzw. Controller-Problem sein könnte …
Mir aber ein rätsel wie der einfach so den Dienst versagen kann.
Mal schnell noch irgendwelche Daten retten kann ich in dem Zustand jedenfalls vergessen.