Serverabstürze

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
filou
Beiträge: 190
Registriert: 02.02.2004 21:21:40

Serverabstürze

Beitrag von filou » 29.08.2004 08:15:33

Hallo,

ich hoffe das ist das richtige Forum.
Ich habe bei nem Kunden nen Simens Primergy Server stehen. Installiert ist Debian Woody.

Nun rebootet dieser Server fast jeden Tag zu unbestimmten Zeiten neu. Die längste Uptime war mal knapp 2 Tage !!

Meine Frage, ist es ein Hardware Problem und wenn ja, wie kann ich dem auf die Spur kommen ?

Gibt es unter Linux einen Fehler, der dieses Verhalten auslöst ? Dei Serverlast ist minimal, en PANIC oder oops ist in keinem Logeintrag zu finden..

Langsam weiß ich nimmr weiter.

mfg

Benutzeravatar
mistersixt
Beiträge: 6601
Registriert: 24.09.2003 14:33:25
Lizenz eigener Beiträge: GNU Free Documentation License

Beitrag von mistersixt » 29.08.2004 09:27:57

Gerade dann, wenn der Kernel keine Chance mehr hatte, irgendwas in irgendeinem Logfile "loszuwerden", deuetet das stark auf ein Hardwareproblem hin. Ich würde mal die Speichertimings im BIOS runterschrauben oder anfangen, die Hardware Stück für Stück auszutauschen. Falls Du einen modularen Kernel hast, evtl. mal ein paar Module mit rmmod entfernen, so dass manche Devices (Parport, Sounddevice, ...), die nicht unbedingt gebraucht werden, auch nicht "aktiviert" werden.

Gruss, mistersixt
--
System: Debian Bookworm, 6.5.x.-x-amd64, ext4, AMD Ryzen 7 3700X, 8 x 4.0 Ghz., Radeon RX 5700 XT, 16 GB Ram, XFCE

filou
Beiträge: 190
Registriert: 02.02.2004 21:21:40

Beitrag von filou » 29.08.2004 10:02:48

Hallo,

ja, grade eben war ich mal eingeloggt und dann iss mir die Verbindung zusammengebrochen. Also wiede ein Absturz. Definitiv kein aufruf von init oder sonstiges.

Hmm, Module - Module werden doch nur geladen, wenn sie benötigt werden, oder ? Beim Starten möchte er gerne apm.o laden - dieses schlägt aber fehl.

Code: Alles auswählen

 apm BIOS not found
sollte aber ned relevant sein, oder ?

Weiterhin beim Starten als Fehlermeldung:;

Code: Alles auswählen

kernel: ERROR only one CPU found
sollte aber auch ned relevant sein, oder ?

lsmod zeigt mir auch nur 3 Module an:
ipx
keybdev
input

Hardware tauschen ist leider nicht so einfach. Dr Server steht ein paar Kilometer weit weg. Ich muss ja auch definitiv sagen können, das es sich um ein HW Problem handelt. Ich muss ausschließen können, das irgendein Mdul, Software sonstiges so ein Verhalten veranlasst.
Wie gesagt, ein

Code: Alles auswählen

 last  -x | grep runl 
zeigt mir auf jedenfall an, dass kein init 6 aufgerufen wird. Also gehe ich wohl recht in der Annahmen, das kein Neustart vom System initiiert wird. Zudem wird das filesystem "bereinigt"; was mir sagt, dass das Teil hart resettet wurde.

Hatte ja schon die Putze in Verdacht....

Benutzeravatar
mistersixt
Beiträge: 6601
Registriert: 24.09.2003 14:33:25
Lizenz eigener Beiträge: GNU Free Documentation License

Beitrag von mistersixt » 29.08.2004 12:48:18

Wie Du bereits schreibst, hört sich alles nach einem harten Reset an, das kann im Prinzip nur ein Hardware-Fehler sein. Man müsste halt mal davorsitzen und es live sehen ;) .

Gruss, mistersixt
--
System: Debian Bookworm, 6.5.x.-x-amd64, ext4, AMD Ryzen 7 3700X, 8 x 4.0 Ghz., Radeon RX 5700 XT, 16 GB Ram, XFCE

filou
Beiträge: 190
Registriert: 02.02.2004 21:21:40

Beitrag von filou » 30.08.2004 18:51:24

Hallo,

zur Info:

Es sit wohl so, das bei Inbetriebnahme des Servers, jemand die Kabel derUSV vertauscht hat. D.h. der Servermonitor bekommt den sauberen Strom und der Server hängt am Netz - welches laut Admin vor Ort nicht das allerbeste ist.

:x ui ui ui

mfg

Antworten