S.M.A.R.T Werte interpretieren

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
snowy
Beiträge: 125
Registriert: 12.12.2017 22:32:52

S.M.A.R.T Werte interpretieren

Beitrag von snowy » 23.03.2018 01:35:02

traue der Festplatte in einem Laptop nicht mehr so richtig über den Weg
habe deshalb smartmontools und GSmartControl. installiert.

Ehrlich gesagt tue ich mich mit der Interpretation des Output schwer :oops:
Kennt jemand ein Forum, wo die Smart-Experten sitzen?

DeletedUserReAsG

Re: S.M.A.R.T Werte interpretieren

Beitrag von DeletedUserReAsG » 23.03.2018 07:38:23

Einige Threads zum Thema kannst du mit der Suchfunktion hier im Forum finden, und wenn du deine Ausgabe posten würdest, könnte dir auch jemand etwas dazu sagen.

pferdefreund
Beiträge: 3791
Registriert: 26.02.2009 14:35:56

Re: S.M.A.R.T Werte interpretieren

Beitrag von pferdefreund » 23.03.2018 09:27:26

Wichtig sind die Werte für realloc sector count , offline und pending - alles betreffs sector. Die raw_read_error rate auch noch. Da sollte überall 0 sein. Wenn nicht, dann im Auge behalten und wenn die Werte hochgehen - erst mal Backup und dann Platte kaufen.

Benutzeravatar
TRex
Moderator
Beiträge: 8038
Registriert: 23.11.2006 12:23:54
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: KA

Re: S.M.A.R.T Werte interpretieren

Beitrag von TRex » 23.03.2018 16:34:22

Manche Werte sind herstellerspezifisch. Prinzipiell gilt der Rat von pferdefreund, aber bevor ich ne neue Platte kaufe, würde ich (falls es nicht sonnenklar ist) ein Herstellertool befragen.

edit: besser mal ein konkretes Beispiel ranziehen:

Code: Alles auswählen

~# smartctl --attributes /dev/sdc
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-3-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   100   253   021    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       4
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   087   087   000    Old_age   Always       -       10012
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       4
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       2
193 Load_Cycle_Count        0x0032   199   199   000    Old_age   Always       -       3634
194 Temperature_Celsius     0x0022   122   113   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

In Spalten VALUE, WORST und THRESH sollte man in der Theorie auf den Zustand schließen können. Tatsächlich sieht man aber schon in der ersten Zeile bei ID 1, dass das irgendwie keinen Sinn ergibt: der RAW_VALUE ist 0, und den drei Zahlen nach ist die Platte völlig hinüber (VALUE x4 über THRESH). Bleibt dir also nur die Interpretation der Werte, und wenn du das hier in deinem jetzigen Fall nicht kannst, solltest du das einfach uns überlassen. Der Platte da gehts übrigens gut.
Jesus saves. Buddha does incremental backups.
Windows ist doof, Linux funktioniert nichtDon't break debian!Wie man widerspricht

DeletedUserReAsG

Re: S.M.A.R.T Werte interpretieren

Beitrag von DeletedUserReAsG » 23.03.2018 17:58:44

TRex hat geschrieben: ↑ zum Beitrag ↑
23.03.2018 16:34:22
Tatsächlich sieht man aber schon in der ersten Zeile bei ID 1, dass das irgendwie keinen Sinn ergibt: der RAW_VALUE ist 0, und den drei Zahlen nach ist die Platte völlig hinüber (VALUE x4 über THRESH).
Ich denke, das wird etwas anders interpretiert: Value ist der derzeitige Wert. Da gibt es einen initialen Wert (je nach Hersteller 253, 200 oder 100, seltener andere Werte), von dem aus wird dann runtergezählt. Worst sollte der bislang schlechteste Wert sein (einige Werte können sich auch wieder „erholen“); das es nicht immer so ist, zeigt das Beispiel (kann’s sein, dass das betreffende Device nicht in der Datenbank ist?). Treshold ist die Grenze, unterhalb der man einen Austausch in Betracht ziehen sollte. Aufpassen: damit das funktioniert, muss das Device sich in der Datenbank der smartmontools befinden. Ist’s das nicht, kann die Interpretation unter Umständen falsch sein.

Und weil’s auch gerne Anlass zur Panik gibt: Werte vom Typ „Old_age“ sind eher informativ, wirklich relevant sind die Pre-fail-Werte. Auch von Bedeutung: die Raw-Werte sind nicht in jedem Fall das, was man zunächst annehmen würde. Zur Beurteilung sollte man daher immer die interpretierten Werte heranziehen. Und nicht zuletzt: eigentlich interessant sind die Selbsttests, die man über SMART anschubsen kann (und beim Verdacht, dass ein Device nicht mehr ganz so fit ist, auch sollte).

snowy
Beiträge: 125
Registriert: 12.12.2017 22:32:52

Re: S.M.A.R.T Werte interpretieren

Beitrag von snowy » 24.03.2018 21:12:10

Hallo,

sorry für die späte Reaktion, anbei mal die Werte meiner Platte.
Steht für mein Geschmack viel "Error" drin, aber schon fast ein Jahr her?
Vermutlich kann ich den Output nicht wirklich interpretieren :oops:
Aufpassen: damit das funktioniert, muss das Device sich in der Datenbank der smartmontools befinden. Ist’s das nicht, kann die Interpretation unter Umständen falsch sein.
Super, mein altes Ding scheint ja schon mal nicht drin zu sein
Device is: Not in smartctl database

Code: Alles auswählen

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-6-amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     Hitachi HTS723232A7A364
Serial Number:    E3834523GESE8N
LU WWN Device Id: 5 000cca 6d5c640c5
Firmware Version: EC2OA60W
User Capacity:    320,072,933,376 bytes [320 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Sat Mar 24 13:05:36 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121)	The previous self-test completed having
					the read element of the test failed.
Total time to complete Offline 
data collection: 		(   45) seconds.
Offline data collection
capabilities: 			 (0x51) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  82) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   096   077   062    Pre-fail  Always       -       589824
  2 Throughput_Performance  0x0025   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0023   235   100   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       3749
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       2 (0 2)
  7 Seek_Error_Rate         0x002f   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -       7057
 10 Spin_Retry_Count        0x0033   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   000    Old_age   Always       -       3747
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   097    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   068   000    Old_age   Always       -       243692335792174
188 Command_Timeout         0x0032   095   087   000    Old_age   Always       -       3945
190 Airflow_Temperature_Cel 0x0022   075   047   045    Old_age   Always       -       25 (Min/Max 24/25)
191 G-Sense_Error_Rate      0x0032   087   087   000    Old_age   Always       -       3458
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       4259905
193 Load_Cycle_Count        0x0032   060   060   000    Old_age   Always       -       403546
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       2
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       3
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   Always       -       0
223 Load_Retry_Count        0x002a   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 3091 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 3091 occurred at disk power-on lifetime: 7055 hours (293 days + 23 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 50 76 b8 03  Error: WP at LBA = 0x03b87650 = 62420560

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  61 90 60 d8 3a 4c 40 00      00:05:06.943  WRITE FPDMA QUEUED
  61 08 58 10 a5 75 40 00      00:05:06.857  WRITE FPDMA QUEUED
  61 08 50 38 ac b0 40 00      00:05:06.857  WRITE FPDMA QUEUED
  60 08 48 50 76 b8 40 00      00:05:06.857  READ FPDMA QUEUED
  ea 00 00 00 00 00 a0 00      00:05:06.857  FLUSH CACHE EXT

Error 3090 occurred at disk power-on lifetime: 7055 hours (293 days + 23 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 50 76 b8 03  Error: WP at LBA = 0x03b87650 = 62420560

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  61 10 80 28 ac b0 40 00      00:05:05.919  WRITE FPDMA QUEUED
  61 28 78 00 ac b0 40 00      00:05:05.919  WRITE FPDMA QUEUED
  60 08 10 50 76 b8 40 00      00:05:04.297  READ FPDMA QUEUED
  60 08 08 48 76 b8 40 00      00:05:04.297  READ FPDMA QUEUED
  60 08 00 40 76 b8 40 00      00:05:04.296  READ FPDMA QUEUED

Error 3089 occurred at disk power-on lifetime: 7055 hours (293 days + 23 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 50 76 b8 03  Error: UNC at LBA = 0x03b87650 = 62420560

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 30 a8 98 3a bb 40 00      00:05:01.728  READ FPDMA QUEUED
  60 08 a0 08 38 bb 40 00      00:05:01.728  READ FPDMA QUEUED
  60 30 98 28 76 b8 40 00      00:05:01.728  READ FPDMA QUEUED
  60 10 90 48 5c 77 40 00      00:05:01.728  READ FPDMA QUEUED
  60 08 88 10 5b 77 40 00      00:05:01.728  READ FPDMA QUEUED

Error 3088 occurred at disk power-on lifetime: 7052 hours (293 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 c8 e7 87 01  Error: UNC at LBA = 0x0187e7c8 = 25683912

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 b0 c8 e7 87 40 00      00:17:04.898  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00      00:17:04.898  SET FEATURES [Enable SATA feature]
  ec 00 00 00 00 00 a0 00      00:17:04.897  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00      00:17:04.896  SET FEATURES [Set transfer mode]
  ef 10 02 00 00 00 a0 00      00:17:04.896  SET FEATURES [Enable SATA feature]

Error 3087 occurred at disk power-on lifetime: 7052 hours (293 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 c8 e7 87 01  Error: UNC at LBA = 0x0187e7c8 = 25683912

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 28 c8 e7 87 40 00      00:17:02.359  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00      00:17:02.359  SET FEATURES [Enable SATA feature]
  ec 00 00 00 00 00 a0 00      00:17:02.358  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00      00:17:02.357  SET FEATURES [Set transfer mode]
  ef 10 02 00 00 00 a0 00      00:17:02.357  SET FEATURES [Enable SATA feature]

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7057         50060524
# 2  Short offline       Completed: read failure       90%      7056         50060524
# 3  Extended offline    Completed: read failure       90%      7054         50060524
# 4  Short offline       Completed: read failure       90%      7054         50060524
# 5  Short offline       Completed: read failure       90%      7054         53800958
# 6  Extended offline    Aborted by host               90%      6951         -
# 7  Short offline       Completed without error       00%      6951         -
# 8  Short offline       Completed without error       00%         6         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

pferdefreund
Beiträge: 3791
Registriert: 26.02.2009 14:35:56

Re: S.M.A.R.T Werte interpretieren

Beitrag von pferdefreund » 26.03.2018 14:39:45

Ist das Backup schon gemacht ? Dem Ding würde ich nicht mehr wirklich trauen. Pending sectors > 0, realloc > 0 ... läßt auch Oberflächenfehler schließen. Mal, falls möglich, Herstellertool besorgen - gibts eventuell als bootfähiges Image.

snowy
Beiträge: 125
Registriert: 12.12.2017 22:32:52

Re: S.M.A.R.T Werte interpretieren

Beitrag von snowy » 26.03.2018 17:47:44

Dem Ding würde ich nicht mehr wirklich trauen.
Danke für die Bestätigung meines "Gefühls", aufgrund diverser unklarer Vorkommnisse
läßt auch Oberflächenfehler schließen
wenn man sehen würde, wie der Benutzer des Laptops (nicht ich :wink: ) mit dem Ding umgeht, frage ich mich sowieso schon lange, wieso es noch keine Headcrash gegeben hat

pferdefreund
Beiträge: 3791
Registriert: 26.02.2009 14:35:56

Re: S.M.A.R.T Werte interpretieren

Beitrag von pferdefreund » 27.03.2018 13:12:02

Nen kleinen gab es ja wohl schon - eventuell bei ruhender Platte, da ist halt noch nicht alles am A...h.

Antworten