(erledigt) SMART error aber trotzdem lesbarer Block?

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
irgendwas
Beiträge: 278
Registriert: 04.04.2016 18:53:19
Lizenz eigener Beiträge: MIT Lizenz

(erledigt) SMART error aber trotzdem lesbarer Block?

Beitrag von irgendwas » 24.07.2019 07:36:02

Guten morgen zusammen.

Heute Nacht erhielt ich von smartd folgende Mails:

Code: Alles auswählen

The following warning/error was logged by the smartd daemon:
Device: /dev/sdd [SAT], Self-Test Log error count increased from 0 to 1
Device info: ST4000DM004-2CV104, S/N:ZFN20250, WWN:5-000c50-0b50cc198, FW:0001, 4.00 TB
und

Code: Alles auswählen

The following warning/error was logged by the smartd daemon:
Device: /dev/sdd [SAT], ATA error count increased from 1 to 2
Device info: ST4000DM004-2CV104, S/N:ZFN20250, WWN:5-000c50-0b50cc198, FW:0001, 4.00 TB
Letzteres ist eigentlich auch eine Steigerung von 0 auf 1, denn ich habe vor kurzem die Benachrichtigung getestet und bin dabei nach diesem Schema vorgegangen https://wiki.ubuntuusers.de/Festplatten ... all-testen. Wenn ich nun einen Test durchführen möchte, bricht smartctl (verständlicherweise) immer wieder ab.

Code: Alles auswählen

smartctl -l selftest /dev/sdd
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-7-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Selective offline   Completed: read failure       90%      1686         104
# 2  Selective offline   Completed: read failure       90%      1686         104
# 3  Selective offline   Completed: read failure       90%      1686         104
# 4  Selective offline   Completed: read failure       90%      1685         104
# 5  Short offline       Completed: read failure       90%      1685         104
# 6  Conveyance captive  Completed: read failure       90%      1685         104
# 7  Extended offline    Completed: read failure       90%      1685         104
# 8  Extended offline    Completed: read failure       90%      1685         104
# 9  Extended offline    Completed: read failure       90%      1685         104
#10  Extended offline    Completed: read failure       90%      1685         104
#11  Short offline       Completed without error       00%      1500         -
#12  Short offline       Completed without error       00%      1327         -
#13  Short offline       Completed without error       00%      1159         -
#14  Extended offline    Completed without error       00%      1143         -
#15  Short offline       Completed without error       00%       991         -
#16  Short offline       Completed without error       00%       823         -
#17  Short offline       Completed without error       00%       655         -
#18  Short offline       Completed without error       00%       493         -
#19  Extended offline    Completed without error       00%       429         -
#20  Short offline       Completed without error       00%       325         -
#21  Short offline       Completed without error       00%       157         -
Möchte ich allerdings den betroffenen Sektor direkt mit hdparm lesen, erhalte ich keinen Fehler:

Code: Alles auswählen

hdparm --read-sector 104 /dev/sdd

/dev/sdd:
reading sector 104: succeeded
0000 0000 0000 0000 0000 0000 0000 0000
...
0000 0000 0000 0000 0000 0000 0000 0000
Die HDD ist Teil eines RAID1. Nicht vom Namen irritieren lassen, das RAID war vor langer Zeit mal in einer Synology und wurde einfach ohne Namensänderung übernommen :D. Die betroffene HDD ist noch relativ neu (deswegen auch größer als sdf, welche demnächst auch gegen eine größere getauscht), während die andere schon einige Stunden hinter sich hat. Da dies mein erster SMART-Fehler ist (neben dem Totalausfall), wäre es interessant zu wissen, wie man mit dem defekten Block umgehen sollte. (Reperaturversuche, Festplattenaustausch, ignorieren, usw.)

Code: Alles auswählen

mdadm --detail /dev/md127
/dev/md127:
        Version : 1.2
  Creation Time : Sat Feb 17 08:36:27 2018
     Raid Level : raid1
     Array Size : 1953383488 (1862.89 GiB 2000.26 GB)
  Used Dev Size : 1953383488 (1862.89 GiB 2000.26 GB)
   Raid Devices : 2
  Total Devices : 2
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Wed Jul 24 06:20:43 2019
          State : clean 
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

           Name : Homeserver:Diskstation
           UUID : 2d562cb8:6c2336b2:7a0d7ee0:cb1d1aeb
         Events : 30217

    Number   Major   Minor   RaidDevice State
       2       8       48        0      active sync   /dev/sdd
       1       8       80        1      active sync   /dev/sdf
       
       
smartctl -A /dev/sdd
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-7-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   083   064   006    Pre-fail  Always       -       201682955
  3 Spin_Up_Time            0x0003   096   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       32
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x000f   073   060   045    Pre-fail  Always       -       22164267
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       1685 (230 134 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       15
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   099   099   000    Old_age   Always       -       1
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   070   051   040    Old_age   Always       -       30 (Min/Max 26/38)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       336
194 Temperature_Celsius     0x0022   030   049   000    Old_age   Always       -       30 (0 24 0 0 0)
195 Hardware_ECC_Recovered  0x001a   083   064   000    Old_age   Always       -       201682955
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       7
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       7
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       369h+29m+05.234s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       21495300594
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       9216289332
Zuletzt geändert von irgendwas am 24.07.2019 22:16:53, insgesamt 2-mal geändert.

pferdefreund
Beiträge: 3791
Registriert: 26.02.2009 14:35:56

Re: SMART error aber trotzdem lesbarer Block?

Beitrag von pferdefreund » 24.07.2019 07:49:19

Kommt wohl hauptsächlich darauf an, wie wichtig die Daten sind und ob vollständige Backups vorhanden sind.
Ich hatte mal ne Platte, die hatte so 20 fehlerhafte Sektoren nach 2 Jahren und lief mit den 20 noch weitere 12 Jahre. Kann gut gehen, kann aber auch direkt jetzt ins Platten-Nirvana wechseln. Kommt halt darauf an. In einer Produktiv-Umgebung würde ich die entsorgen und ggf nur noch als work-Speicher verwenden für Daten, die nur temporär benötigt werden.

irgendwas
Beiträge: 278
Registriert: 04.04.2016 18:53:19
Lizenz eigener Beiträge: MIT Lizenz

Re: SMART error aber trotzdem lesbarer Block?

Beitrag von irgendwas » 24.07.2019 13:06:00

Danke für deine schnelle Antwort. Auf dem RAID liegen Backups anderer Festplatten (die dann nochmal ein Offsite-Backup machen) , daher ist die HDD schon wichtig. Da die HDD grad mal 2 Monate "alt" ist, hab ich einfach mal den Verkäufer angeschrieben und inzwischen sogar einen Retourenschein bekommen. Sie wird also anstandslos ausgetauscht.

Ich werd daher mal schauen, wie ich die Festplatte trotz fehlerhaftem Sektor mit Nullen überschreiben kann und dann einfach zurückschicken. Eine meiner anderen Festplatten zeigt interessanterweise nach 8 Jahren keinen einzigen fehlerhaften Sektor an.

pferdefreund
Beiträge: 3791
Registriert: 26.02.2009 14:35:56

Re: (erledigt) SMART error aber trotzdem lesbarer Block?

Beitrag von pferdefreund » 25.07.2019 09:07:22

Tja, einmal im LKW in der Kiste rumgeworfen und der Kopf hat dummerweise die Magnetschicht berührt - langt schon. Wenn man sieht, wie die Zusteller heutzutage wegen Stress mit dem Zeug umgehen, gehe ich lieber selbst in ein Geschäft und hole, was ich brauche.

Benutzeravatar
MSfree
Beiträge: 10686
Registriert: 25.09.2007 19:59:30

Re: (erledigt) SMART error aber trotzdem lesbarer Block?

Beitrag von MSfree » 25.07.2019 09:30:10

pferdefreund hat geschrieben: ↑ zum Beitrag ↑
25.07.2019 09:07:22
Wenn man sieht, wie die Zusteller heutzutage wegen Stress mit dem Zeug umgehen, gehe ich lieber selbst in ein Geschäft und hole, was ich brauche.
ROFL, der war gut.

Glaubst du wirklich, daß Lieferdienste die für Geschäfte bestimmte Wahre vorsichtiger behandeln als die Wahre für Privatleute?

Benutzeravatar
Lord_Carlos
Beiträge: 5578
Registriert: 30.04.2006 17:58:52
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Dänemark

Re: (erledigt) SMART error aber trotzdem lesbarer Block?

Beitrag von Lord_Carlos » 25.07.2019 10:18:05

Ist oft so das Festplatten entweder ganz am Anfang Kaputt gehen, oder sehr lange halten.
Was manche machen ist badblocks (Debiane2fsprogs) durchlaufen lassen. Das schreibt und liest dann von der Festplatte in verschiedenen Schreibmustern.

Ich glaube der genaue Befehl war ca. so. bacblocks -wsv /dev/drivelocation
Dauert ein paar Tage. Nebenbei nach SMART Fehlern gucken.

Ob es wirklich notwendig ist und bei dir den Fehler haette finden koennen? Kein plan. Kostet nichts ausser Zeit.

Solange es ordentlich verpackt ist sollte Online Handel kein problem sein ;-)

Code: Alles auswählen

╔═╗┬ ┬┌─┐┌┬┐┌─┐┌┬┐╔╦╗
╚═╗└┬┘└─┐ │ ├┤ │││ ║║
╚═╝ ┴ └─┘ ┴ └─┘┴ ┴═╩╝ rockt das Forum!

MaGe
Beiträge: 1708
Registriert: 01.06.2014 17:12:16

Re: (erledigt) SMART error aber trotzdem lesbarer Block?

Beitrag von MaGe » 25.07.2019 12:08:25

pferdefreund hat geschrieben: Wenn man sieht, wie die Zusteller heutzutage wegen Stress mit dem Zeug umgehen, gehe ich lieber selbst in ein Geschäft und hole, was ich brauche.

und die werden vom selben Zusteller beliefert. :mrgreen: :mrgreen: :mrgreen:



gruss MaGe
Wir müssen uns vor der Klimaerwärmung nicht fürchten.
Uns rottet die soziale Kälte viel früher aus.

Antworten