Ursache für Abstürze ermitteln

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
Benutzeravatar
GregorS
Beiträge: 2597
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Ursache für Abstürze ermitteln

Beitrag von GregorS » 19.03.2023 06:54:57

Hallo zusammen!

Ich habe einen Mac Mini mit aktuellem Debian, der ohne Tastatur und Monitor in meinem Heimnetz hängt und nun zum zweiten Mal abgestürzt ist. Beide Male hatte ich mich per 'ssh -X' eingeloggt und xaos gestartet, um künstlich Systemlast zu erzeugen.

Wegen eines einzelnen Absturzes treibe ich normalerweise keinen Aufwand, mittlerweile sind wirklich heftige Hänger ja nichts Außergewöhnliches mehr :-(

Da das nun aber das zweite Mal ist, wüsste ich gerne, was die Ursache des Absturzes ist. Vielleicht ist ja xaos kein geeignetes Tool mehr. Wie gehe ich am besten vor? htop oder ähnliches kann ich ja schlecht benutzen, wenn ich mich nur per ssh einloggen kann und das Netzwerk womöglich das Erste ist, was hängt.

TIA

Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])

DeletedUserReAsG

Re: Ursache für Abstürze ermitteln

Beitrag von DeletedUserReAsG » 19.03.2023 07:26:11

GregorS hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 06:54:57
Wie gehe ich am besten vor?
Die meisten Leute schauen dann zunächst ins Log, ob dort irgendwelche Hinweise zu finden sind. Wenn da nichts ist (was im Falle eines harten, hardwareseitigen Crashes durchaus die Regel ist), kann man immer noch weiterschauen: memtest für RAM, cpuburn für CPU, System in eine Minimalkonfiguration bringen und schauen, ob der Fehler auftritt, und wenn nicht, stückweise wieder zusammenbauen und nach jedem Stück prüfen.
GregorS hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 06:54:57
htop oder ähnliches kann ich ja schlecht benutzen, wenn ich mich nur per ssh einloggen kann und das Netzwerk womöglich das Erste ist, was hängt.
Selbst wenn das Netz das Erste wäre, das hängt (was in der Regel nicht der Fall ist, im Gegenteil), hättest du dann immer noch die Daten von unmittelbar vor dem Absturz. Sprich: Auslastungen der CPUs, des RAMs, CPU-Temperaturen, Prozesse, …

Benutzeravatar
GregorS
Beiträge: 2597
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Ursache für Abstürze ermitteln

Beitrag von GregorS » 19.03.2023 07:37:05

niemand hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 07:26:11
...
Vielen Dank für die Hinweise!

Mir ist gerade eingefallen, dass ich noch eine „Notfall-Tastatur“ in der Schublade habe. Die habe ich angeschlossen und Strg-Alt-F1 und Strg-Alt-Entf gedrückt. Siehe da: Das vertraute Einschalt-Bing ertönte. Vielleicht ist es ja das 'ssh -X', das Probleme macht.

Und jetzt gehe ich Logs lesen.

Gruß

Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])

Benutzeravatar
GregorS
Beiträge: 2597
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Ursache für Abstürze ermitteln

Beitrag von GregorS » 19.03.2023 08:50:01

Hallo!

Noch eine Zusatzfrage: cpuburn scheint es nicht mehr zu geben. Was kann man stattdessen nehmen, um kontrolliert CPU-Last zu erzeugen?

Hintergrund: Ich überwache die CPU-Temperatur. Die scheint im faulen Webserver-Normalbetrieb okay zu sein (so um 40-45 °C), bei Last aber stark zu steigen (> 80 °C). Ich frage mich, wie gut so ein Mac Mini als schicker „Hauptrechner“ zu gebrauchen ist. Mein jetziger ist langsamer als so ein alter Intel-Mac-Mini, wird aber auch bei großer Last kaum wärmer als 55 °C.

Schee sans ja scho, die Macs ...

Gruß

Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])

DeletedUserReAsG

Re: Ursache für Abstürze ermitteln

Beitrag von DeletedUserReAsG » 19.03.2023 09:31:08

GregorS hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 08:50:01
Noch eine Zusatzfrage: cpuburn scheint es nicht mehr zu geben. Was kann man stattdessen nehmen, um kontrolliert CPU-Last zu erzeugen?
Da wüsste ich aus dem Kopf auch nichts. Eine eher krude, aber vermutlich funktionierende Möglichkeit wäre, einfach pro CPU-Thread, der zur Verfügung steht, einmal /dev/zero zu hashen:

Code: Alles auswählen

niemand@MIN ~ % md5sum /dev/zero
^C
md5sum /dev/zero  20,04s user 0,71s system 99% cpu 20,747 total
Bei beispielsweise vier CPU-Kernen mit Multithreading entsprechend achtmal gestartet, heizt das schon recht gut.

Je nach Alter des Rechners kann ein komplettes Reinigen des Kühlsystems (incl. Abnehmen aller Kühlkörper und Erneuern der Wärmeleitpaste) für ein erheblich kühler laufendes System sorgen. BTDT

Benutzeravatar
GregorS
Beiträge: 2597
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Ursache für Abstürze ermitteln

Beitrag von GregorS » 19.03.2023 09:52:40

niemand hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 09:31:08
Da wüsste ich aus dem Kopf auch nichts. Eine eher krude, aber vermutlich funktionierende Möglichkeit wäre, einfach pro CPU-Thread, der zur Verfügung steht, einmal /dev/zero zu hashen:
Krude ist sympathisch :-)

Das funktioniert wunderbar. Da ich jetzt auch xosview mitlaufen lasse, kann ich dort wunderbar sehen, wie die Last steigt.
Je nach Alter des Rechners kann ein komplettes Reinigen des Kühlsystems (incl. Abnehmen aller Kühlkörper und Erneuern der Wärmeleitpaste) für ein erheblich kühler laufendes System sorgen. BTDT
Das ist nicht das Problem. Als ich den Rechner bekommen habe, waren die Öffnungen, wo Luft eingesaugt wird, kaum verstaubt. Auch im Rechner sieht's sauber aus - aber allzu tief kann man da eh nicht reingucken.

Gruß

Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])

DeletedUserReAsG

Re: Ursache für Abstürze ermitteln

Beitrag von DeletedUserReAsG » 19.03.2023 10:47:30

GregorS hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 09:52:40
Das ist nicht das Problem.
Wie angedeutet: Wärmeleitpaste kann krümlig werden und die Wärmeleitfähigkeit zum Teil verlieren, Halterungen können verrutschen, an neuralgischen Stellen mag sich eine Staubflocke abgesetzt haben, etc. – gerade bei Kisten, deren Kühlung eh auf Kante genäht ist, lohnt’s sich, da mal hinzuschauen. Vorausgesetzt natürlich, es zeigt sich tatsächlich ein Zusammenhang zwischen Abstürzen und der Temperatur.

Was gerade bei älteren Kisten auch sein kann: Elkos an bestimmten Stellen, die durch Alterung ihre Spezifikationen verlassen haben (Kapazität, aber insbesondere auch ESR) – zeigt sich dann manchmal durch Abstürze bei impulsartiger Belastung. Das zu prüfen, ist allerdings nicht gar so trivial.

JTH
Moderator
Beiträge: 3023
Registriert: 13.08.2008 17:01:41
Wohnort: Berlin

Re: Ursache für Abstürze ermitteln

Beitrag von JTH » 19.03.2023 11:27:10

GregorS hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 08:50:01
Noch eine Zusatzfrage: cpuburn scheint es nicht mehr zu geben. Was kann man stattdessen nehmen, um kontrolliert CPU-Last zu erzeugen?
Es gibt da, neben bestimmt noch anderen: Debianstress, Debianstress-ng, Debianstressant.
Manchmal bekannt als Just (another) Terminal Hacker.

Benutzeravatar
GregorS
Beiträge: 2597
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Ursache für Abstürze ermitteln

Beitrag von GregorS » 19.03.2023 12:28:34

Hallo nochmal!

Danke soweit für die Infos. Mir hat wohl das geeignete Suchwort gefehlt.

Und weil ich's grad mal wieder spaßig finde, wie sich auch mit einfachen Mitteln informative und hübsche Diagramme zeichnen lassen, kommt hier noch ein PDF des aktuellen Ergebnisses meiner „Untersuchung“: https://test.szaktilla.de/plot.pdf. Beteiligte: cron, gnuplot, ps2pdf

Gruß

Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])

Benutzeravatar
hikaru
Moderator
Beiträge: 13585
Registriert: 09.04.2008 12:48:59

Re: Ursache für Abstürze ermitteln

Beitrag von hikaru » 20.03.2023 09:36:46

Ich nutze zum Auslasten der CPU den Torture-Test-Modus (Small FFT) von mprime [1], hauptsächlich um die Qualität von Kühllösungen zu testen.
Vielleicht müsste ich mir die Optionen von Debianstress-ng und Konsorten genauer anschauen, aber ich habe bisher mit keinem anderen Programm so hohe CPU-Temperaturen gesehen.

[1] https://www.mersenne.org/download/

Benutzeravatar
MSfree
Beiträge: 10759
Registriert: 25.09.2007 19:59:30

Re: Ursache für Abstürze ermitteln

Beitrag von MSfree » 20.03.2023 10:00:48

GregorS hat geschrieben: ↑ zum Beitrag ↑
19.03.2023 06:54:57
Ich habe einen Mac Mini mit aktuellem Debian
Es gibt, wenn ich mich nicht verzählt habe, 21 Mac Mini Modelle mit Intel CPU, vom 32 Bit Core Solo (Early 2006) bis zum Core i5-8500B (November 2018).
der ohne Tastatur und Monitor in meinem Heimnetz hängt
Was nun wirklich nichts besonderes ist.
zum zweiten Mal abgestürzt ist. Beide Male hatte ich mich per 'ssh -X' eingeloggt und xaos gestartet
In dem Fall kann es nicht an der Intel-GPU liegen, denn die wird bei einer remote X-Session gar nicht benutzt.
mittlerweile sind wirklich heftige Hänger ja nichts Außergewöhnliches mehr :-(
Wie soll man das interpretieren? Meinst du den Mac oder Debian generell?
Mein Mac Mini hat solche Probleme bisher jedenfalls nicht (Macmini5.1, 120GB Intenso SSD, Debian Bookworm, Netz über Gbit-Ethernet)
Vielleicht ist ja xaos kein geeignetes Tool mehr.
Zumindest nicht, wenn du es remote laufen läßt.
wenn ich mich nur per ssh einloggen kann und das Netzwerk womöglich das Erste ist, was hängt.
Zur fehlenden Systeminformation kommt nun noch, daß du vergißt zu erwähnen, ob du LAN oder WLAN nutzt.

Antworten