Heute kurz vor Feierabend kommt noch ne Mail von meinem privaten Server zuhause: "disk failing" und dm-raid degraded.
Grund: End-to-end_error auf einer der beiden Seagate ST3000NC002 Constellation CS 3TB:
Code: Alles auswählen
# smartctl -iA /dev/sda
=== START OF INFORMATION SECTION ===
Device Model: ST3000NC002-1DY166
Serial Number: Z1F4E9P5
LU WWN Device Id: 5 000c50 065a36612
Firmware Version: CN02
User Capacity: 3.000.592.982.016 bytes [3,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Fri Jan 8 22:02:12 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 083 063 044 Pre-fail Always - 218364672
3 Spin_Up_Time 0x0003 093 091 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 17
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 8
7 Seek_Error_Rate 0x000f 067 060 030 Pre-fail Always - 111809002780
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15073
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 17
184 End-to-End_Error 0x0032 099 099 099 Old_age Always FAILING_NOW 1
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 4295032833
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 064 058 045 Old_age Always - 36 (Min/Max 31/37)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 16
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 18
194 Temperature_Celsius 0x0022 036 042 000 Old_age Always - 36 (0 26 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 081 000 Old_age Always - 233
Die zweite Platte schaut auch schon Katastrophal aus:
Code: Alles auswählen
# smartctl -iA /dev/sdb
=== START OF INFORMATION SECTION ===
Device Model: ST3000NC002-1DY166
Serial Number: Z1F4E9D7
LU WWN Device Id: 5 000c50 065a3dc31
Firmware Version: CN02
User Capacity: 3.000.592.982.016 bytes [3,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Fri Jan 8 22:06:51 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 074 063 044 Pre-fail Always - 28349880
3 Spin_Up_Time 0x0003 093 091 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 18
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 760
7 Seek_Error_Rate 0x000f 039 039 030 Pre-fail Always - 72520661296869
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15073
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 19
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 065 058 045 Old_age Always - 35 (Min/Max 32/37)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 17
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 18
194 Temperature_Celsius 0x0022 035 042 000 Old_age Always - 35 (0 26 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
Zur Info: Seagate zählt bei seek/read_error_rate nach ausreichend seek/read-Vorgängen von 60/60 runter (davor ist value/worst bei 100/253). Wird der threshold-Wert erreicht/unterschritten -> FAILED.
Für gerade mal 1,7 Jahre ist das ziemlich miserabel - so bescheiden sehen nicht mal die wirklich misshandelten WDs in meinem Testrechner aus, und die haben 5-6 Jahre auf dem Buckel, davon ca 3 im Server...
Ein extended selftest (-t long) auf der ersten Platte wurde zwar ohne Fehler beendet, die Platte bleibt trotzdem erstmal offline. Ersatz für beide wurde schon bestellt - diesmal wieder WD RE4. Die "alten" HGST MegaScale gibts wohl nirgends mehr und die aktuellen Ultrastar (He) sind mir noch etwas suspekt, vor allem bei dem Ruf der Desk(Death)star-Serie in den letzten 1-2 Jahren... (Zudem sind die nochmal fast doppelt so teuer wie die RE4...)
2 Weitere Constellation CS mit 4TB die seit 2 Jahren in nem NAS arbeiten sind zwar nicht ganz so übel, aber auch schon schlechter als die 2TB WD REs die schon fast 4 Jahre dort drin stecken (paar neu zugewiesene Sektoren, error-rates bei 53-57, also auch schon degraded).
Die mittlerweile 4 SSHDs von Seagate die ich im Einsatz habe bekommen ab sofort auch ne strengere Überwachung, scheinen aber soweit noch gut zu sein - die älteste hat aber auch erst etwas über 100 Tage gesamtlaufzeit auf dem Buckel...
Hat jemand ebenfalls Platten aus der CS Serie im Einsatz und ähnliche Erfahrungen gemacht?