[English]Solid State Disks (SSDs) sind genau so zuverlässig wie Harddisks (HDDs). Das ist die auf den Punkt gebrachte Erkenntnis aus dem Drive Status-Report 2021 des Cloud-Anbieters Backblaze. Der Anbieter setzt SSDs seit dem 4. Quartal 2018 ein und hatte im Jahr 2021 die Zahl von 2.200 SSDs im Einsatz.
Anzeige
Datenspeicher können immer wieder ausfallen und fallen auch aus. Kaputte Festplatten oder SSDs hat wohl jeder schon mal gehabt, der mit der Materie zu tun hat. In den Hinterköpfen hält sich aber bei vielen Nutzer weiterhin das Gefühlt, dass Solid State Disks (SSDs) da schneller kaputt gehen. Da ist es interessant, was der Cloud-Anbieter Backblaze zum Thema mitzuteilen hat. Ich bin die Tage hier auf einen entsprechenden Artikel gestoßen.
Backblaze Drive Status-Report 2021
Am 1. Februar 2022 hat Backblaze seinen Bericht Backblaze Drive Stats for 2021 veröffentlicht und dann am 3. März 2022 den ergänzenden Blog-Beitrag The SSD Edition: 2021 Drive Stats Review nachgeschoben. Der letztgenannte Beitrag bezieht sich rein auf SSDs, während der Bericht aus 2021 sich auf Festplatten bezog.
Zum 31. Dezember 2021 hatte Backblaze 2.200 SSDs im Einsatz, wobei SSDs seit dem 4. Quartal 2018 eingesetzt werden. Seit Q4 2018 wurden bei allen neuen Speicherservern und bei allen Systemen mit ausgefallenen HDD-Boot-Laufwerken SSDs installiert. Die Startlaufwerke in der Backblace-Umgebung dienen nicht nur zum Booten der Speicherserver. Auf den SSDs werden auch Protokolldateien und temporäre Dateien, die vom Speicherserver erzeugt werden, gespeichert. Jeden Tag liest, schreibt und löscht ein Boot-Laufwerk Dateien in Abhängigkeit von der Aktivität des Speicherservers selbst.
Anzeige
Obige Tabelle gibt die Ausfallraten von SSDs über verschiedene Modelle in den Jahren 2019 bis 2021 an. Der AFR-Wert (Ausfallrate) wird dabei nach folgender Formel kalkuliert:
AFR = (drive failures / (drive days / 365)) * 100
In obiger Tabelle stechen zwei SSD-Modelle mit extrem hohen Ausfallraten hervor: Das Modell von Crucial: CT250MX500SSD1 (43,22%) und das Modell von Seagate: ZA2000CM10002 (28,81%). Diese Daten darf man aber nicht überbewerten, denn bei der Crucial gibt es nur 20 Laufwerke, die im Dezember 2021 installiert wurden. Bei der Seagate-Festplatte gab es nur vier Laufwerke, von denen eines Anfang 2021 ausfiel. In beiden Fällen basiert die AFR auf sehr wenigen Daten, was zu einem sehr großen Konfidenzintervall führt, schreibt Backblaze.
Interessant ist die Auswertung über alle SSD-Laufwerke. Die kumulative AFR lag für alle SSD-Laufwerke im vierten Quartal 2021 bei 1,07 %. Im Vergleich lag die kumulative AFR (während der Lebensdauer) für die verwendeten Festplatten bei 1,40 % (gemäß Bericht zu den Laufwerksstatistiken aus dem Jahr 2021). Die Ausfallraten liegen also in der gleichen Größenordnung, wobei aber die beiden Gruppen (SSDs und HDDs) sich nicht am gleichen Punkt ihres Lebenszyklus befinden.
Backblaze warnt jedoch, dass die Gesamtzahl der in Betrieb befindlichen SSDs noch relativ klein sei. Die Auswertung ist also noch nicht in Stein gemeißelt, sondern gibt Hinweise. Andy Klein, der Verfasser der Auswertung schreibt dazu: "Je mehr Daten wir haben, desto besser, und je älter die SSDs werden, desto aufmerksamer werden wir sein, um zu sehen, wie lange sie halten. Für HDDs haben wir eine Menge Daten zu diesem Thema, aber bei SDDs sind wir noch am Lernen."
Interessant ist aber, dass die drei älteren SSD-Modelle, die Backblaze im Einsatz hat, im Jahr 2021 eine kumulative Ausfallrate von weniger als 1 Prozent aufwiesen. Der kumulierte AFR für alle SSD-Laufwerke lag bei 1,07 Prozent. Zumindest ist ein Trend zu sehen: SSDs scheinen in der Zuverlässigkeit nicht schlechter als HDDs zu sein. Die Details sind dem verlinkten Backblaze-Dokument und deren Report zu entnehmen.
Anzeige
Was mich in diesem Kontext interessieren würde — vielleicht hat da jemand Informationen: Wie lange hält eine SSD die Daten, wenn sie nicht mit Strom versorgt wird?
Das kann man vermutlich nur mit einem ganz eindeutigen "Kommt drauf an" beantworten. Flash-Typ? Consumer oder Enterprise? Ganz wichtig scheint auch die Temperatur bei der Lagerung zu sein – kühler ist besser.
Tante Google spuckt von "10 Jahre Lagerung lt. Spezifikation problemlos" bis "nach einem Jahr waren die Daten weg" alles mögliche aus. Letztlich hilft wohl nur der Blick ins Datenblatt des betreffenden Modells.
Für Langzeitarchivierung ist die Technik aber wohl eher ungeeignet, da bieten sich klassische Festplatten eher an. Oder darauf basierende Lösungen wie RDX (garantierte Archivdauer von min. 10 Jahren)
Danke — eine Aussage wie "genau 243 Tage" hatte ich auch gar nicht erwartet ;-)
Ich werde also wohl dabei bleiben, solche wenig genutzten SSDs respektive die drumherumhängenden PCs alle paar Monate mal unter Strom zu setzen.
Quick 'n dirty betr. "… alle paar Monate mal unter Strom zu setzen.":
Folie S. 16 in /1/ legt unter dem Titel "Flash Correct-and-Refresh (FCR)" nahe, dass 'Strom an' alleine nicht genügt. Man muss wohl auch 'Logik anstossen'.
Selbst wenn man '0 Fehler' unterstellt, ist für die Ladungsauffrischung u. U. ein 'Refresh' vonnöten; reine Vermutung meinerseits.
/1/
Aus 2012: https://people.inf.ethz.ch/omutlu/pub/mutlu_iccd12_talk.pdf
Danke. Es war mein Verständnis (oder meine Annahme?), dass halbwegs aktuelle SSDs selbständig solche Remapping- / Reprogramming-Strategien fahren. Was aber natürlich nur geht, wenn sie ab und zu mal unter Strom gesetzt werden.
Oder ist diese meine Annahme falsch?
Hallo Herr Bachmann,
Betr. Ihrer Frage "Oder ist diese meine Annahme falsch?"
Ich kann es Ihnen leider nicht sagen. Je tiefer man gräbt, desto vielfältiger und widersprüchlicher fallen die Aussagen aus.
Vielleicht wollen Sie /1/ zum Ausgangspunkt weiterer Recherchen machen.
P. S. Unter Ihrem Kommentar fehlte der "Antworten"-Button, sodass dieser Beitrag nicht ganz am richtigen Ort resp. nicht eingerückt erscheint.
/1/
Ausschnitt: "… simply powering the drive on and using it as you normally would for a few minutes should be sufficient to maintain data integrity…"
Zitat: "In den Hinterköpfen hält sich aber bei vielen Nutzer weiterhin das Gefühlt, dass Solid State Disks (SSDs) da schneller kaputt gehen."
Komisch, bei mir ist das Gefühl genau anders herum. :) Wenn mal SSDs defekt sind, dann handelt es sich meist um bestimmte Serien, einige Intels waren so Kandidaten oder auch ganz früher die ersten OCZ-Laufwerke, reine Katastrophe. Mutmaßlich handelte es sich hierbei aber eher um Firmware-Probleme. Mit Samsung-Laufwerken, egal ob OEM oder Retail, gab es hingegen fast keinen Ärger. Und das sage ich als jemand, der Samsung nicht besonders gern mag. ;)
Meine eigene Datenbasis ist mit ca. 300 SSDs in Kunden-PCs und -servern natürlich eher bescheiden, aber subjektiv würde ich sagen: SSDs sind generell (von einzelnen Ausreißern abgesehen) zuverlässiger als klassische HDDs. Gleichzeitig sind die Ausfälle bei HDDs weiter zurück gegangen.
Spannend allerdings, dass überwunden geglaubte Probleme so langsam wieder auftauchen: Die ersten SATA-SSDs hatten keinerlei Kummer mit großer Wärmeentwicklung, bei aktuellen NVMe-SSDs in Notebooks/kleinen Gehäusen sieht das plötzlich anders aus. Auch das hat sicherlich Auswirkungen auf die Lebensdauer.
Also ich habe in meinem Leben deutlich! mehr kaputte HDDs als SSDs gesehen. Das gleicht auch der Umstand nicht aus, dass es SSDs erst seit rund 12 Jahren im Consumer-Markt gibt. Tatsächlich hatte ich bisher nur 2 defekte SSDs in meinen Fingern, eine Intel Postville 160GB mit einem bekannten Firmware-Bug (SSD wurde damals anstandslos getauscht) und eine Crucial M550 (Consumer SSD), die 8 Jahre lang dauerhaft in nem "Server" lief. Alle anderen von mir verbauten SSDs laufen immer noch problemlos bis heute (darunter z.B. die damals getauschte Intel Postville 160GB) – was ich von diversen verbauten HDDs leider nicht behaupten kann (hatte bestimmt schon über 100 kaputte HDDs in den Händen).
Wie von Nordtech und Oli erwähnt, ist auch mein Eindruck, dass SSDs eher zuverlässiger sind. Allerdings ist es meiner Einschätzung nach so, dass die Wahrscheinlichkeit eines plötzlichen (unvorhersehbaren) Ausfalls einer SSD höher ist. Bei HDDs ist es eher so, dass sie allmählich langsamer und störungsanfälliger werden, bevor sie irgendwann ganz ausfallen.
Ob sich dieser Unterschied in Zukunft mit mehr wirklich alten SSDs verstärkt zeigen wird, steht noch in den Sternen.
HDDs können auch plötzlich ausfallen. Der HDD Controller kann sich von jetzt auf gleich verabschieden. Oder auch in seltenen fällen durch Headcrash (Schreib-Lesekopf berührt die sich drehenden Magnetscheiben). Eine HDD kann also Theoretisch jederzeit durch einen Mechanischen defekt ausfallen, oder wie gesagt auch durch defekt des HDD Controllers auf der unterseite. Und der HDD Motor der die Magnetscheiben dreht, kann ebenfalls ausfallen. Bei einer SSD hingegen wenn diese ausfällt, ist meist der SSD Controller defekt. Die Speicherzellen Kaputtschreiben schafft man bei heutigen SSDs bei normaler nutzung (Office / PC Spiele) nicht.
Dito, wobei das bei mir kein Eindruck ist, sondern schon fast eine Tatsache. Beide ausgefallenen SSDs hatten einen kompletten Datenverlust, HDDs hatten hingegen häufig nur Teildefekte (defekte Sektoren etc.), wo die meisten Daten noch gerettet werden konnten. Also Backups werden sicherlich nicht obsolet…
Ich verbaue seit 2013 SSDs in Consumergeräten und habe extrem wenig Ausfälle.
Soweit ich mich erinnern kann, waren das um 2013/2014 herum 2 oder 3 Stk. Samsung Dell-OEM-SSDs 120GB (aus Dell-Notebooks) sowie 2 Mikron-SSDs 250GB Sata 2,5". Darüber hinaus höchstens noch 2-3 Stk. andere, kann ich mich aber nicht mehr erinnern.
Zur obigen Tabelle:
Die Crucial CT250MX500SSD1 ist ein 250GB-Modell, kein 500 GB.
Das 500GB-Modell müsste CT500MX500SSD1 heißen.
Das Crucial-Modell MX500 ist ein Consumermodell und ist eigentlich nicht für den Serverbetrieb und 24/7 ausgelegt.
Somit macht das Modell eigentlich einen guten Job.
Bei Einsatz von Server-SSDs währe die Ausfallrate sicherlich unter 1 % zu drücken.
Die anderen Modelle in der obigen Tabelle kenne ich nicht.
Für Consumer/Bürogeräte verbaue ich vorwiegend Samsung-SSDs beginnend mit 840 Basic, 8×0 EVO und 970 Evo plus (jedoch KEINE QVO-Modelle).
Menge seit ca. 2013: ca. 300 stk.
Ausfälle: KEINE
Serverseitig Samsung Server-SSDs: ca. 40 Stk.
Laufzeit ca. 6 Jahre
Ausfälle: keine
Die Crucial MX500 verbaue ich seit ca. 2-3 Jahren alternativ zu den Samsung-SSDs als Preisalternative.
Menge verbaut ca.: 15 Stk.
Ausfälle bisher: Keine
Ich habe mittlerweile auch eine Samsung 8TB QVO verbaut, wobei diese mehr gelesen als beschrieben wird. Ich bin gespannt, wie diese sich in ihrer Haltbarkeit zeigt.