SSD: Regelmässig Pending Sectors

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
Benutzeravatar
heisenberg
Beiträge: 3692
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

SSD: Regelmässig Pending Sectors

Beitrag von heisenberg » 23.05.2024 01:12:42

Hallo zusammen,

ich habe hier zwei gleichartige SSDs, die das gleiche Verhalten zeigen. Mehrmals am Tag liefert das Monitoring einen oder zwei Pending Sectors. Das ist jetzt für mich kein Problem, dass ich lösen will, weil es zum einen nicht ein Server ist, für den ich die Verantwortung habe und zum anderen scheint es da sonst kein Problem zu sein. Aber das kenne ich so von keiner anderen SSD, die ich im Einsatz habe - sind jetzt auch nicht so viele.

Aber ich finde das interessant. Deswegen zeige ich da mal die Screenshots dazu. Einmal die Pending Sectors für einen 25-Stunden-Zeitraum und einmal für 8 Tage.

4839

4840

Die SSD ist eine ...

Code: Alles auswählen

Model Family:     Crucial/Micron Client SSDs
Device Model:     CT1000MX500SSD1
Firmware Version: M3CR043
User Capacity:    1.000.204.886.016 bytes [1,00 TB]
... also nicht so die dolle Datacenter-SSD, die schon die Hälfte Ihrer Schreibkapazität hinter sich hat (s. u.).

Die sonstigen Smartwerte sind:

Code: Alles auswählen

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   000    Pre-fail  Always       -       0
  5 Reallocate_NAND_Blk_Cnt 0x0032   100   100   010    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       16032
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       2
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
173 Ave_Block-Erase_Count   0x0032   056   056   000    Old_age   Always       -       581
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       0
180 Unused_Reserve_NAND_Blk 0x0033   000   000   000    Pre-fail  Always       -       64
183 SATA_Interfac_Downshift 0x0032   100   100   000    Old_age   Always       -       0
184 Error_Correction_Count  0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   071   058   000    Old_age   Always       -       29 (Min/Max 0/42)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_ECC_Cnt 0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       0
202 Percent_Lifetime_Remain 0x0030   056   056   001    Old_age   Offline      -       44
206 Write_Error_Rate        0x000e   100   100   000    Old_age   Always       -       0
210 Success_RAIN_Recov_Cnt  0x0032   100   100   000    Old_age   Always       -       0
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       94043858040
247 Host_Program_Page_Count 0x0032   100   100   000    Old_age   Always       -       1979980433
248 FTL_Program_Page_Count  0x0032   100   100   000    Old_age   Always       -       5793704250
Grüße,
h.

rhHeini
Beiträge: 2394
Registriert: 20.04.2006 20:44:10

Re: SSD: Regelmässig Pending Sectors

Beitrag von rhHeini » 23.05.2024 10:00:22

Ich hab hier eine 2TB-Version Deiner SSD, hier mal meine Werte:

Code: Alles auswählen

smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.7.12+bpo-amd64] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron Client SSDs
Device Model:     CT2000MX500SSD1
Firmware Version: M3CR033
User Capacity:    2,000,398,934,016 bytes [2.00 TB]

Code: Alles auswählen

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR-K   100   100   000    -    0
  5 Reallocate_NAND_Blk_Cnt -O--CK   100   100   010    -    0
  9 Power_On_Hours          -O--CK   100   100   000    -    13298
 12 Power_Cycle_Count       -O--CK   100   100   000    -    2785
171 Program_Fail_Count      -O--CK   100   100   000    -    0
172 Erase_Fail_Count        -O--CK   100   100   000    -    0
173 Ave_Block-Erase_Count   -O--CK   100   100   000    -    3
174 Unexpect_Power_Loss_Ct  -O--CK   100   100   000    -    11
180 Unused_Reserve_NAND_Blk PO--CK   000   000   000    -    65
183 SATA_Interfac_Downshift -O--CK   100   100   000    -    3
184 Error_Correction_Count  -O--CK   100   100   000    -    0
187 Reported_Uncorrect      -O--CK   100   100   000    -    0
194 Temperature_Celsius     -O---K   076   062   000    -    24 (Min/Max 0/38)
196 Reallocated_Event_Count -O--CK   100   100   000    -    0
197 Current_Pending_ECC_Cnt -O--CK   100   100   000    -    0
198 Offline_Uncorrectable   ----CK   100   100   000    -    0
199 UDMA_CRC_Error_Count    -O--CK   100   100   000    -    14
202 Percent_Lifetime_Remain ----CK   100   100   001    -    0
206 Write_Error_Rate        -OSR--   100   100   000    -    0
210 Success_RAIN_Recov_Cnt  -O--CK   100   100   000    -    0
246 Total_LBAs_Written      -O--CK   100   100   000    -    3262012836
247 Host_Program_Page_Count -O--CK   100   100   000    -    25703342
248 FTL_Program_Page_Count  -O--CK   100   100   000    -    47278353
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning
Schau mal auf die Zeile 202 Percent_Lifetime_Remain, da ist Deine schon deutlich runter. Da ist was faul, das sollte so nicht sein. Läuft da Trim?

niemand
Beiträge: 714
Registriert: 22.12.2023 16:35:53
Kontaktdaten:

Re: SSD: Regelmässig Pending Sectors

Beitrag von niemand » 23.05.2024 10:51:28

rhHeini hat geschrieben: ↑ zum Beitrag ↑
23.05.2024 10:00:22
Da ist was faul, das sollte so nicht sein.
Nope, ist nicht faul. Schau auf die „LBAs written“, da sind dort 94.043.858.040 bei werner vs. 3.262.012.836 bei dir. Das Ding wird einfach intensiver genutzt (es sei denn, das ist nicht der Fall – dann wär’ tatsächlich was faul).
„I fought in the Vim-Emacs-War.“ Quelle

rhHeini
Beiträge: 2394
Registriert: 20.04.2006 20:44:10

Re: SSD: Regelmässig Pending Sectors

Beitrag von rhHeini » 23.05.2024 10:56:18

Da hast Du einen Punkt. Das bedeutet aber auch das die ganz schön unter Stress steht und bald (?) abnippelt.

niemand
Beiträge: 714
Registriert: 22.12.2023 16:35:53
Kontaktdaten:

Re: SSD: Regelmässig Pending Sectors

Beitrag von niemand » 23.05.2024 11:11:59

„Bald“ stünde dann hier für „in etwa zwei Jahren“, sofern nicht noch ein Defekt dazukommt (oder die Dinger turnusmäßig ersetzt werden). Vermutlich würde es eh länger halten – wobei der Test von Heise ja auch schon wieder länger zurückliegt; dort hatten sie ja z.T. das Zehnfache des vom Hersteller angegebenen Werts für die Schreibleistung ermittelt (wenngleich ich den Test für fragwürdig hielt, weil die Data Retention Time am Ende möglicherweise nur noch wenige Stunden betragen haben mag – hat ja keiner gemessen).
„I fought in the Vim-Emacs-War.“ Quelle

Benutzeravatar
spiralnebelverdreher
Beiträge: 1298
Registriert: 23.12.2005 22:29:03
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Frankfurt am Main

Re: SSD: Regelmässig Pending Sectors

Beitrag von spiralnebelverdreher » 23.05.2024 11:13:47

rhHeini hat geschrieben: ↑ zum Beitrag ↑
23.05.2024 10:56:18
Da hast Du einen Punkt. Das bedeutet aber auch das die ganz schön unter Stress steht und bald (?) abnippelt.
Mir ist letzthin eine ähnliche SSD aus dieser Qualitätsklasse im Notebook ohne Vorwarnung verreckt (wurde wg. Gewährleistung ausgetauscht) und die hatte deutlich weniger Betriebsstunden und deutlich mehr An/Aus Zyklen auf dem Buckel.

Die Werte

Code: Alles auswählen

 9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       16032
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       2
deuten auf einen 24/7 Betrieb hin, und wenn die Lebenszeiterwartung aus den SMART Werten etwa hinkommt, dauert es bis zum Exitus noch mehr als ein Jahr. Oder es kommt doch früher, und das Backup-Einspielen wird richtig wichtig.

rhHeini
Beiträge: 2394
Registriert: 20.04.2006 20:44:10

Re: SSD: Regelmässig Pending Sectors

Beitrag von rhHeini » 23.05.2024 11:44:43

Ich würd diese Pending Sectors als Warnzeichen ansehen. Die ist auf 44% runter, und es kann jetzt ganz schnell gehen mit dem Rest.

Benutzeravatar
heisenberg
Beiträge: 3692
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: SSD: Regelmässig Pending Sectors

Beitrag von heisenberg » 23.05.2024 12:20:54

@rHeini:

"44"? Du hast also 100 - 56 (Lifetime remain) gerechnet? Wieso das? Lifetime Remain steht doch als Wert für sich selbst.

---

Ansonsten: Diese SSD steckt in einem Server in einem RZ, läuft also 24/7.

Ich gehe davon aus, dass die SSD in <2 Jahren ersetzt werden muss.

rhHeini
Beiträge: 2394
Registriert: 20.04.2006 20:44:10

Re: SSD: Regelmässig Pending Sectors

Beitrag von rhHeini » 23.05.2024 16:32:12

heisenberg hat geschrieben: ↑ zum Beitrag ↑
23.05.2024 12:20:54
"44"? Du hast also 100 - 56 (Lifetime remain) gerechnet? Wieso das? Lifetime Remain steht doch als Wert für sich selbst. Ansonsten: Diese SSD steckt in einem Server in einem RZ, läuft also 24/7.

Ich gehe davon aus, dass die SSD in <2 Jahren ersetzt werden muss.
Sorry, da hab ich hinten in die Zeile geschaut (Raw Value).

Auf die 2 Jahre würde ich mich jetzt nicht mehr verlassen. Da sind durch die hohe Schreiblast bereits 44% der Reserve verbraucht. Die anderen Zellen sind ja nicht unbelastet, sondern werden auch mehr oder weniger häufig beschrieben. Und der Stress geht von Tag zu Tag weiter ...

Hab ein scharfes Auge auf die Zeile 202. Wenn ich Du wäre würd ich mir jetzt eine Reserve-SSD bereitlegen die ich wenns kritisch wird (<10%) oder kracht (0%, oder das Ding ist nicht mehr ansprechbar) reinschieben kann.

niemand
Beiträge: 714
Registriert: 22.12.2023 16:35:53
Kontaktdaten:

Re: SSD: Regelmässig Pending Sectors

Beitrag von niemand » 23.05.2024 16:36:00

rhHeini hat geschrieben: ↑ zum Beitrag ↑
23.05.2024 16:32:12
Auf die 2 Jahre würde ich mich jetzt nicht mehr verlassen. Da sind durch die hohe Schreiblast bereits 44% der Reserve verbraucht.
Naja … die bereits 44% wurden in knapp zwei Jahren verbraucht. Sofern sich das Schreibaufkommen pro Zeit nicht vergrößert, bleiben zumindest in dem Punkt nochmal grob zwei weitere Jahre übrig. Das Feld bezieht sich, soweit mir bekannt, nicht auf die Reserveblöcke, sondern auf die gesamte Schreibleistung.
„I fought in the Vim-Emacs-War.“ Quelle

rhHeini
Beiträge: 2394
Registriert: 20.04.2006 20:44:10

Re: SSD: Regelmässig Pending Sectors

Beitrag von rhHeini » 23.05.2024 16:48:18

Tja, wenns bei einem linearen Verhalten bleibt ist ja alles gut.

Ich befürchte halt das es irgendwann eher Richtung exponentiell geht.

niemand
Beiträge: 714
Registriert: 22.12.2023 16:35:53
Kontaktdaten:

Re: SSD: Regelmässig Pending Sectors

Beitrag von niemand » 23.05.2024 16:59:54

rhHeini hat geschrieben: ↑ zum Beitrag ↑
23.05.2024 16:48:18
Ich befürchte halt das es irgendwann eher Richtung exponentiell geht.
Rein intuitiv halte ich „wieviele Prozent Lebensdauer bleiben noch“ für eine laut Definition lineare Angabe: 10% am Anfang sollten genausoviel sein, wie 10% am Ende. Ansonsten könnte man sich das Feld ja auch schenken.

Anders sähe es bei Angabe der tatsächlichen Reserve aus, die etwa mein SSD mir angibt:

Code: Alles auswählen

Available Spare:                    100%
Available Spare Threshold:          10%

Da würde ich mir bei 50% Ersatz bereitlegen. Aber ich denke mal, in RZ wird eh Ersatz vorgehalten – dass das Ding laut SMART noch lange nicht durch ist, schließt ja einen spontanen Ausfall keinesfalls aus.
„I fought in the Vim-Emacs-War.“ Quelle

Benutzeravatar
heisenberg
Beiträge: 3692
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: SSD: Regelmässig Pending Sectors

Beitrag von heisenberg » 23.05.2024 17:08:14

Das hier scheint die Reserve zu sein:

Code: Alles auswählen

180 Unused_Reserve_NAND_Blk 0x0033   000   000   000    Pre-fail  Always       -       64

niemand
Beiträge: 714
Registriert: 22.12.2023 16:35:53
Kontaktdaten:

Re: SSD: Regelmässig Pending Sectors

Beitrag von niemand » 23.05.2024 17:48:24

Das ist allerdings etwas seltsam: ist pre-fail, current hat threshold erreicht und überhaupt ist alles Null, was ziemlich untypisch ist. Normalerweise sollte dir da ’ne Warnung mit etwa dem Inhalt

Code: Alles auswählen

SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
entgegenlächeln – oder es liegt daran, dass smartctl das besagte Gerät nicht in der Datenbank hat?
„I fought in the Vim-Emacs-War.“ Quelle

Benutzeravatar
heisenberg
Beiträge: 3692
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: SSD: Regelmässig Pending Sectors

Beitrag von heisenberg » 23.05.2024 17:57:37

Weitere Info: Das aktuelle Fehlerbild ist schon über ein Jahr so.

Benutzeravatar
heisenberg
Beiträge: 3692
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: SSD: Regelmässig Pending Sectors

Beitrag von heisenberg » 23.05.2024 18:04:20

Hier ist ein Bugreport zu der SSD:

https://www.smartmontools.org/ticket/1227

TL;DR: Der Wert bedeutet etwas anderes als "Pending Sectors". Scheint also für mich nicht kritisch zu sein.

Antworten