Seagate Constellation CS nach <2 Jahren am Ende...

r4pt0r · Beitrag von **r4pt0r** » 08.01.2016 22:59:54

Eventuell gibt es hier ja noch andere die in ner Serverumgebung die Constellation CS von Seagate einsetz(t)en? Mich würden ggf andere Erfahrungen interessieren. Bei mir hat das Vertrauen in Seagate aber heute ganz gewaltig gelitten...

Heute kurz vor Feierabend kommt noch ne Mail von meinem privaten Server zuhause: "disk failing" und dm-raid degraded.
Grund: End-to-end_error auf einer der beiden Seagate ST3000NC002 Constellation CS 3TB:

Code: Alles auswählen

# smartctl -iA /dev/sda
=== START OF INFORMATION SECTION ===
Device Model:     ST3000NC002-1DY166
Serial Number:    Z1F4E9P5
LU WWN Device Id: 5 000c50 065a36612
Firmware Version: CN02
User Capacity:    3.000.592.982.016 bytes [3,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Fri Jan  8 22:02:12 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   083   063   044    Pre-fail  Always       -       218364672
  3 Spin_Up_Time            0x0003   093   091   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       17
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       8
  7 Seek_Error_Rate         0x000f   067   060   030    Pre-fail  Always       -       111809002780
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       15073
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       17
184 End-to-End_Error        0x0032   099   099   099    Old_age   Always   FAILING_NOW 1
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       4295032833
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   064   058   045    Old_age   Always       -       36 (Min/Max 31/37)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       16
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       18
194 Temperature_Celsius     0x0022   036   042   000    Old_age   Always       -       36 (0 26 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   081   000    Old_age   Always       -       233

Auch schon einige CRC-Fehler und die neu zugeordnete Sektoren sind währrend des extended self-test um 2 gestiegen.

Die zweite Platte schaut auch schon Katastrophal aus:

Code: Alles auswählen

# smartctl -iA /dev/sdb
=== START OF INFORMATION SECTION ===
Device Model:     ST3000NC002-1DY166
Serial Number:    Z1F4E9D7
LU WWN Device Id: 5 000c50 065a3dc31
Firmware Version: CN02
User Capacity:    3.000.592.982.016 bytes [3,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Fri Jan  8 22:06:51 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   074   063   044    Pre-fail  Always       -       28349880
  3 Spin_Up_Time            0x0003   093   091   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       18
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       760
  7 Seek_Error_Rate         0x000f   039   039   030    Pre-fail  Always       -       72520661296869
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       15073
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       19
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   065   058   045    Old_age   Always       -       35 (Min/Max 32/37)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       17
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       18
194 Temperature_Celsius     0x0022   035   042   000    Old_age   Always       -       35 (0 26 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

(reallocated_sector_ct und seek_error_rate)

Zur Info: Seagate zählt bei seek/read_error_rate nach ausreichend seek/read-Vorgängen von 60/60 runter (davor ist value/worst bei 100/253). Wird der threshold-Wert erreicht/unterschritten -> FAILED.

Für gerade mal 1,7 Jahre ist das ziemlich miserabel - so bescheiden sehen nicht mal die wirklich misshandelten WDs in meinem Testrechner aus, und die haben 5-6 Jahre auf dem Buckel, davon ca 3 im Server...

Ein extended selftest (-t long) auf der ersten Platte wurde zwar ohne Fehler beendet, die Platte bleibt trotzdem erstmal offline. Ersatz für beide wurde schon bestellt - diesmal wieder WD RE4. Die "alten" HGST MegaScale gibts wohl nirgends mehr und die aktuellen Ultrastar (He) sind mir noch etwas suspekt, vor allem bei dem Ruf der Desk(Death)star-Serie in den letzten 1-2 Jahren... (Zudem sind die nochmal fast doppelt so teuer wie die RE4...)

2 Weitere Constellation CS mit 4TB die seit 2 Jahren in nem NAS arbeiten sind zwar nicht ganz so übel, aber auch schon schlechter als die 2TB WD REs die schon fast 4 Jahre dort drin stecken (paar neu zugewiesene Sektoren, error-rates bei 53-57, also auch schon degraded).
Die mittlerweile 4 SSHDs von Seagate die ich im Einsatz habe bekommen ab sofort auch ne strengere Überwachung, scheinen aber soweit noch gut zu sein - die älteste hat aber auch erst etwas über 100 Tage gesamtlaufzeit auf dem Buckel...

Hat jemand ebenfalls Platten aus der CS Serie im Einsatz und ähnliche Erfahrungen gemacht?

gbotti · Beitrag von **gbotti** » 16.03.2016 13:08:39

Hi.

Wir haben einige 3TB aus der CS-Serie im Einsatz. Die halten inzwischen schon länger als die zuvor eingesetzten Platten von WD, jedoch sind mir da auch schon welche unter einem Jahr abgeraucht. Besserung brachte bei uns ein SSD-Cache direkt am RAID-Controller, wodurch die Festplatten erheblich entlastet wurden.

Von HGST hat ein Kunde von mir 24 x 4TB seit etwa 9 Monaten in einem FreeNAS-System im Einsatz. Bisher noch kein Ausfall.

r4pt0r · Beitrag von **r4pt0r** » 16.03.2016 17:04:14

Soweit ich das rausfinden konnte sind wohl die 1, 1.5 und 2 TB Modelle der CS-Serie recht anfällig - also mal wieder nen Volltreffer gelandet

Die beiden Platten wurden bei der migration zu ZFS zusammen mit einer jungen 3TB WD in einen mirror gepackt - eine davon wurde sofort von ZFS mit Fehlern moniert, ist mittlerweile von Seagate ersetzt worden. Die zweite habe ich gestern ausgebaut, nachdem diese beim scrubbing in der Nacht den threshold für neu zugewiesene Sektoren unterschritten hat...

Der ZFS-Pool läuft ebenfalls mit SSD-cache, somit sind die Platten schon "entlastet" bzw werden deutlich gleichmäßiger belastet - was der zweiten aber auch nichts brachte, die hat munter weiter Sektoren verloren.

Mit ZFS sehe ich das mittlerweile aber entspannter - redundanz ist vorhanden und ZFS erkennt und korrigiert Fehler lange bevor SMART-Werte auffällig werden, da kann man sich entspannt auf den Wechsel vorbereiten bzw ne Ersatzplatte dazustecken... md-raid meldet sich eben erst wenn die Bude brennt.
Ärgerlich ist es trotzdem wenn (für den "Privateinsatz") relativ teure Platten schon so schnell die Hufe hochreißen...

debianforum.de

Seagate Constellation CS nach <2 Jahren am Ende...

Seagate Constellation CS nach <2 Jahren am Ende...

Re: Seagate Constellation CS nach <2 Jahren am Ende...

Re: Seagate Constellation CS nach <2 Jahren am Ende...