festplatten problem nach tage/wochenlangem betrieb

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
bizzY23
Beiträge: 10
Registriert: 14.09.2003 02:24:41

festplatten problem nach tage/wochenlangem betrieb

Beitrag von bizzY23 » 19.09.2003 17:23:14

ich habe zwar kein debianspezifisches problem, hoffe aber, dass ihr mir trotzdem helfen könnt...habe im keller einen debian server mit kernel 2.4.22 stehen, dient als fileserver und emuleclient und laüft, auch wenn ich erst seit ca 1.5 jahren auf debian umgestiegen bin und nicht soo viel zeit habe alles zu können mehr als stabil, mir ist es bisher noch kein einziges mal untergekommen dass das ding abstürzt, gab natürlich mal aufgehängte emule clients, etc, aber das hat ja mit dem server nichts zu tun und nach einem "killall -9 xmule" ist die welt auch immer in ordnung...der server müsste also eingentlich monate lang durchlaufen können, uptime record ist bisher etwas über 4 wochen...und jetzt kommt das berühmte ABER, aber nach tage/wochenlanger laufzeit kriegt die root partiton (ext2) probleme, programme können oft nicht gestertet werden (segmantation fault), mein xmule kann keine quellen halten, man könte sagen er "vergisst sie *g" und wenn nicht rebootet wird, kann ich nach einiger zeit auch nicht mehr auf der root partition schreiben....scheint dann read-only gemounted zu sein...wenn ich reboote und er einen fsck macht, findet er haufenweise "falsche inodes?", kann aber alles reparieren und das sys läuft wieder für tage/wochen....

dazu hätte ich einige fragen...

1.warum passiert sowas mit meiner root partitition und was kann ich dagegen tun?

2. er macht ja leider erst nach x malen einen fsck beim hochfahren, wo und wie kann ich einstellen, dass er bei jedem hochfahren eienn fsck macht...dann könnte man das problem durch "alle x tage rebooten" quasi "umgehen...

3.irgendwelche tipps wie ich diese scheiss fehler auf der root in zukunft verhindern kann?

vielen dank!

Benutzeravatar
Hendri
Beiträge: 586
Registriert: 23.08.2003 12:17:43
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Hendri » 19.09.2003 22:00:14

Hallo,
Check mal:
-) den SMART Status deiner Festplatte, möglicher weise ein Hardware Defekt?
-) mal die Logs überprüfen!
-) die Settings mit der die Festplatte angesprochen wird z.B. mit hdparm /dev/hda und schaun ob die Platte das auch kann (Google)
-) IDE Kabel

Für die fsck Geschichte schau dir mal

Code: Alles auswählen

man tune2fs
an...


SMART siehe:
http://www.debianforum.de/forum/viewtopic.php?t=12724

Ciao, Hendri

bizzY23
Beiträge: 10
Registriert: 14.09.2003 02:24:41

Beitrag von bizzY23 » 20.09.2003 12:14:49

vielen dank für deine antwort....habe mal nen smartctl gemacht...soweit ich das beurteilen kann, sieht es gar nicht gut aus...

server:~# smartctl -a /dev/hda
Device: SAMSUNG SV2044D Supports ATA Version 4
Drive supports S.M.A.R.T. and is enabled
Attribute ID 5 Failed
Please save all data and call drive manufacture immediately.


Error Log Structure 1:
DCR FR SC SN CL SH D/H CR Timestamp
00 00 08 27 08 d8 e0 20 16319
00 00 08 af f0 fb e0 20 16319
00 00 08 ef 07 fc e0 20 16319
ff 00 08 5f 71 20 e1 20 16320
00 00 05 01 aa 00 a0 a1 16335
00 04 05 01 aa 00 a0 88 0
Error condition: 0 Error State: 3
Number of Hours in Drive Life: 7050 (life of the drive in hours)

Error Log Structure 2:
DCR FR SC SN CL SH D/H CR Timestamp
00 00 08 f7 f0 1f e1 30 31109
00 00 08 4f f0 bf e0 30 31109
00 00 08 ef 07 fc e0 20 31109
ff 00 08 4f f0 bf e0 30 31110
00 00 05 01 aa 00 a0 a1 31125
00 04 05 01 aa 00 a0 88 0
Error condition: 0 Error State: 3
Number of Hours in Drive Life: 7173 (life of the drive in hours)

Error Log Structure 3:
DCR FR SC SN CL SH D/H CR Timestamp
00 00 08 7f 1b 4d e1 30 4264494
00 da 00 00 4f c2 e0 b0 4264511
00 d0 01 00 4f c2 e0 b0 4264511
00 d1 01 01 4f c2 e0 b0 4264511
00 d5 01 01 4f c2 e0 b0 4264511
00 04 05 01 aa 00 a0 88 0
Error condition: 0 Error State: 3
Number of Hours in Drive Life: 7029 (life of the drive in hours)

Error Log Structure 4:
DCR FR SC SN CL SH D/H CR Timestamp
04 03 44 01 00 00 a0 00 21040
00 00 00 00 00 00 a0 10 21040
00 00 3f 00 00 00 af 91 21040
00 00 10 00 00 00 ec c6 21040
00 00 00 00 aa 00 a0 e3 21040
00 04 05 01 aa 00 a0 80 0
Error condition: 0 Error State: 3
Number of Hours in Drive Life: 7029 (life of the drive in hours)

Error Log Structure 5:
DCR FR SC SN CL SH D/H CR Timestamp
04 03 44 01 00 00 a0 00 10
00 00 00 00 00 00 a0 10 10
00 00 3f 00 00 00 af 91 10
00 00 10 00 00 00 ec c6 10
00 00 00 00 aa 00 a0 e3 10
00 04 05 01 aa 00 a0 80 0
Error condition: 0 Error State: 3
Number of Hours in Drive Life: 7029 (life of the drive in hours)


ich glaube ich sollte so schnell wie möglich die partition sichern und auf ne neue platte kloppen...

korrigiert mich wenn ich das falsch sehen...

dazu hätte ich noch ne frage, lohnt es sich die platte platt zu machen, evtl sector erase und für andere zwecke nochmal einzubauen, oder sollte ich die in die berühmte tonne kloppen?!
und noch eine frage, was soll mir dieses "error in log structure" sagen?!

greetz bizzY

Benutzeravatar
Hendri
Beiträge: 586
Registriert: 23.08.2003 12:17:43
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Hendri » 20.09.2003 16:43:48

jeep,
das mit den Datensichern würde ich auch so rasch wie möglich beginnen...

Im Übgrigen glaube ich das "error in log stucture" die SMART Register der Festplatte sind, die Hersteller spezifisch sind -> Hesteller fragen was das genau für Fehler sind (VERMUTUNG)

Die Platte kannst du vergessen, ein Low-Level format würde nur die Markierung der defekten Sektoren löschen, was aber nicht heisst das sie dann funzen...

Ciao, Hendri

Antworten