SMART error (CurrentPendingSector) detected on host: ***

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
inne
Beiträge: 3273
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

SMART error (CurrentPendingSector) detected on host: ***

Beitrag von inne » 20.09.2017 16:01:55

Hallo,

meine Backup-USB-Festplatte wirft diesen Fehler: CurrentPendingSector. (Ich stecke machmal nicht sofort wieder ab...)

Code: Alles auswählen

This message was generated by the smartd daemon running on:

   host name:  ***
   DNS domain: localdomain

The following warning/error was logged by the smartd daemon:

Device: /dev/sdb [SAT], 1 Currently unreadable (pending) sectors

Device info:
WDC WD20NMVW-11EDZS2, S/N:WD-WX61E854X3K1, WWN:5-0014ee-20cfdeda9, FW:01.01A01, 2.00 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original message about this issue was sent at Sun Sep  3 14:32:43 2017 CEST
Another message will be sent in 24 hours if the problem persists.
Eine erste Suche im Internet konnt mir nicht erklären was das bedeutet. Heisst das die reserve Blöcke sind aufgebraucht?

Meine eigentliche Frage ist aber, wie daruf reagieren. Ein badblocks (https://manpages.debian.org/stretch/e2f ... .8.en.html) laufen lassen oder neue Festplatte? Und allgemein: Wie untersucht ihr eure Backup-USB-Festplatten auf tauglichkeit (Andere Datenträgen bitte nicht diskutieren)?

Benutzeravatar
smutbert
Moderator
Beiträge: 8313
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von smutbert » 20.09.2017 16:18:35

Das heißt, dass ein Sektor nicht gelesen werden konnte und deswegen zum Ersetzen durch einen der Reservesektoren vorgemerkt wurde. Der Austausche passiert afaik beim nächsten Schreibzugriff auf diesen Sektor.
Ob das jetzt nur Zufall ist und das für lange Zeit der einzige betroffene Sektor bleibt oder ob demnächst immer mehr Sektoren ausfallen werden, weiß man frühestens dann, wenn man die Sache weiter beobachtet. Du kannst mit

Code: Alles auswählen

$ smartctl -A /dev/sdb
nachsehen wieviele Sektoren schon ausgetauscht wurden (Reallocated Sector Count oder so ähnlich) oder mit smart auch den kurzen oder langen Test durchführen:
https://wiki.debianforum.de/Festplatten ... initiieren
(Allerdings weiß ich nicht ob das alles über USB funktionieren wird - bei meine USB-HDD tut es das jedenfalls nicht.)

(Meiner Erfahrung nach können auch USB- oder bei internen Platten SATA-Probleme schuld an so etwas sein - die Festplatte an sich wäre dann komplett unschuldig und würde diesen Sektor komplett umsonst austauschen.)


Ich mach es außerdem so, dass ich ein Dateisystem mit Prüfsummen verwende (btrfs, zfs, nilfs2), damit ich es unabhängig vom Zustand der HDD bemerke, wenn es Lesefehler oder andere Probleme gibt.
Ansonsten würde ich das vorgehen ein bisschen davon abhängig machen wie genau die Backup-Strategie aussieht: Wenn es das einzige Backup(medium) ist, dann würde ich die Platte austauschen und die fragliche Platte einfach als zusätzliches Backupmedium nutzen - bei mir liegt mein „Hauptbackup“ auf einem raid1 und dort würde ich eine solche Platte einfach solange weiterverwenden wie sie noch läuft.

inne
Beiträge: 3273
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von inne » 20.09.2017 16:28:29

OK. Ich werde das smartctl nacher mal durchlaufen lassen, aber spätestens wieder wenn ich ein Backup anlege und mal sehen was der der SMART Selbsttest bringt, wenns via USB- möglich ist. Ich poste die Ausgabe dann mal hier.

inne
Beiträge: 3273
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von inne » 01.10.2017 10:42:16

Soweit jetzt die Daten mit startctl -A <device>. Mit GNOME-Disks kann ich die SMART-Werte, von dieser USB-Platte leider nicht abfragen.
Habe auch gerade den Long Test (-t long) gestartet und der soll Heute Abend beendet sein.

Code: Alles auswählen

smartctl -A /dev/sdb
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-3-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       18
  3 Spin_Up_Time            0x0027   196   192   021    Pre-fail  Always       -       5166
  4 Start_Stop_Count        0x0032   099   099   000    Old_age   Always       -       1318
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       10532
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       230
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       154
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10010
194 Temperature_Celsius     0x0022   121   101   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
Der Werte für Current_Pending_Sector von 200 (VALUE) ist ja noch weit über 000 (THRESH), aber es wird halt immer angemerkt, mit der Meldung oben.
smutbert hat geschrieben: ↑ zum Beitrag ↑
20.09.2017 16:18:35
Ich mach es außerdem so, dass ich ein Dateisystem mit Prüfsummen verwende (btrfs, zfs, nilfs2), damit ich es unabhängig vom Zustand der HDD bemerke, wenn es Lesefehler oder andere Probleme gibt.
Damit werde ich mich wohl auch mal befassen müssen.

Benutzeravatar
smutbert
Moderator
Beiträge: 8313
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von smutbert » 01.10.2017 11:31:21

Das ist interessant. Bei meiner USB-Platte ist es genau umgekehrt - ich kann die smart-Werte zwar mit dem gnome-disk-utility auslesen, aber nicht mit smartcl (oder ich habe es nur nicht geschafft smartctl mit den richtigen Optionen aufzurufen).

smartd läuft bei mir jedenfalls nicht, aber evenutell meldet der bei dir _jede_ Veränderung bzw. jeden alten Fehler immer wieder von neuem?
Ich hab keinen Überblick über die Konfigurationsmöglichkeiten von smartd, aber ich glaube das Standardverhalten ist es auf jede Änderung aufmerksam zu machen, auch wenn die Änderung laut smart eigentlich harmlos ist (sein sollte). Im Wiki gibt es auch einen schönen Artikel über die smartmontools mit einem eigenen Abschnitt über smartd mit ein paar Beispielen:
https://wiki.debianforum.de/Festplatten ... berwachung

inne
Beiträge: 3273
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von inne » 03.11.2017 13:30:34

Hallo smutbert, hallo Debianforum,

habe nun eine neue USB-Festplatte für die Backups. I.d.R. lege ich einmal im Monat ein Backup aller Daten an. Dazu habe ich Shellscript das ich aus Knoppix 2, von der USB-Festplatte startet. Das Skript macht dann die mounts, rsync usw.

Wie könnte ich das Skript erweitern, um bei kritischen S.M.A.R.T. Werten eine Warnung zu bekommen? Kann der smart-notifier auch manuell gestartet, bessere wäre aber etwas das ähnlich aber auf der Konsole/Knoppix 2 läuft?

Hat GRML hier was?

MfG
Inne

Benutzeravatar
smutbert
Moderator
Beiträge: 8313
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von smutbert » 03.11.2017 14:25:36

Das sollte eigentlich kein Problem sein. Ich weiß natürlich nicht wie dein Skript aussieht, wie man bei dir die passende Gerätedatei ermitteln könnte und ob du eine Desktopbenachrichtigung oder einfach nur eine Ausgabe auf dem Terminal willst, aber der Befehl

Code: Alles auswählen

# smartctl -H /dev/sdX
gibt aus ob es der Platte laut SMART gut geht oder nicht. Für das Skript könntest du dann mit einem Befehl in dieser Art eine eigene Warnung ausgeben:

Code: Alles auswählen

smartctl -H /dev/sdX | grep overall-health | grep PASSED &> /dev/null || echo "Achtung, drohender Defekt der Festplatte!"
edit:
Um die passende Gerätedatei zu erwischen kannst du statt mit /dev/sdX zu hantieren, dich natürlich auch auf die Links in »/dev/disk/by-id/« stützen - dann musst du nur einmal eruieren wie dort deine Backup-Festplatte heißt.

inne
Beiträge: 3273
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von inne » 03.11.2017 15:30:20

Der Schalter -H von smartctl, war was ich gesucht habe.
An die Gerätedatei zu kommen ist etwas tricky, aber das kann wohl vorerst auf /dev/sdb, für die zweite Festplatte im System stehen bleiben.

Benutzeravatar
heisenberg
Beiträge: 3473
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: SMART error (CurrentPendingSector) detected on host: ***

Beitrag von heisenberg » 03.11.2017 16:16:18

inne hat geschrieben: ↑ zum Beitrag ↑
01.10.2017 10:42:16

Code: Alles auswählen

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
Der Werte für Current_Pending_Sector von 200 (VALUE) ist ja noch weit über 000 (THRESH), aber es wird halt immer angemerkt, mit der Meldung oben.
Der Wert für Current_Pending_Sector ist nicht 200 sondern 1 (letzter Wert in der Spalte).
... unterhält sich hier gelegentlich mangels wunschgemäßer Gesprächspartner mal mit sich selbst.

Antworten