Ursache für Abstürze ermitteln
Ursache für Abstürze ermitteln
Hallo zusammen!
Ich habe einen Mac Mini mit aktuellem Debian, der ohne Tastatur und Monitor in meinem Heimnetz hängt und nun zum zweiten Mal abgestürzt ist. Beide Male hatte ich mich per 'ssh -X' eingeloggt und xaos gestartet, um künstlich Systemlast zu erzeugen.
Wegen eines einzelnen Absturzes treibe ich normalerweise keinen Aufwand, mittlerweile sind wirklich heftige Hänger ja nichts Außergewöhnliches mehr
Da das nun aber das zweite Mal ist, wüsste ich gerne, was die Ursache des Absturzes ist. Vielleicht ist ja xaos kein geeignetes Tool mehr. Wie gehe ich am besten vor? htop oder ähnliches kann ich ja schlecht benutzen, wenn ich mich nur per ssh einloggen kann und das Netzwerk womöglich das Erste ist, was hängt.
TIA
Gregor
Ich habe einen Mac Mini mit aktuellem Debian, der ohne Tastatur und Monitor in meinem Heimnetz hängt und nun zum zweiten Mal abgestürzt ist. Beide Male hatte ich mich per 'ssh -X' eingeloggt und xaos gestartet, um künstlich Systemlast zu erzeugen.
Wegen eines einzelnen Absturzes treibe ich normalerweise keinen Aufwand, mittlerweile sind wirklich heftige Hänger ja nichts Außergewöhnliches mehr
Da das nun aber das zweite Mal ist, wüsste ich gerne, was die Ursache des Absturzes ist. Vielleicht ist ja xaos kein geeignetes Tool mehr. Wie gehe ich am besten vor? htop oder ähnliches kann ich ja schlecht benutzen, wenn ich mich nur per ssh einloggen kann und das Netzwerk womöglich das Erste ist, was hängt.
TIA
Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])
Re: Ursache für Abstürze ermitteln
Die meisten Leute schauen dann zunächst ins Log, ob dort irgendwelche Hinweise zu finden sind. Wenn da nichts ist (was im Falle eines harten, hardwareseitigen Crashes durchaus die Regel ist), kann man immer noch weiterschauen: memtest für RAM, cpuburn für CPU, System in eine Minimalkonfiguration bringen und schauen, ob der Fehler auftritt, und wenn nicht, stückweise wieder zusammenbauen und nach jedem Stück prüfen.
Selbst wenn das Netz das Erste wäre, das hängt (was in der Regel nicht der Fall ist, im Gegenteil), hättest du dann immer noch die Daten von unmittelbar vor dem Absturz. Sprich: Auslastungen der CPUs, des RAMs, CPU-Temperaturen, Prozesse, …GregorS hat geschrieben:19.03.2023 06:54:57htop oder ähnliches kann ich ja schlecht benutzen, wenn ich mich nur per ssh einloggen kann und das Netzwerk womöglich das Erste ist, was hängt.
Re: Ursache für Abstürze ermitteln
Vielen Dank für die Hinweise!
Mir ist gerade eingefallen, dass ich noch eine „Notfall-Tastatur“ in der Schublade habe. Die habe ich angeschlossen und Strg-Alt-F1 und Strg-Alt-Entf gedrückt. Siehe da: Das vertraute Einschalt-Bing ertönte. Vielleicht ist es ja das 'ssh -X', das Probleme macht.
Und jetzt gehe ich Logs lesen.
Gruß
Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])
Re: Ursache für Abstürze ermitteln
Hallo!
Noch eine Zusatzfrage: cpuburn scheint es nicht mehr zu geben. Was kann man stattdessen nehmen, um kontrolliert CPU-Last zu erzeugen?
Hintergrund: Ich überwache die CPU-Temperatur. Die scheint im faulen Webserver-Normalbetrieb okay zu sein (so um 40-45 °C), bei Last aber stark zu steigen (> 80 °C). Ich frage mich, wie gut so ein Mac Mini als schicker „Hauptrechner“ zu gebrauchen ist. Mein jetziger ist langsamer als so ein alter Intel-Mac-Mini, wird aber auch bei großer Last kaum wärmer als 55 °C.
Schee sans ja scho, die Macs ...
Gruß
Gregor
Noch eine Zusatzfrage: cpuburn scheint es nicht mehr zu geben. Was kann man stattdessen nehmen, um kontrolliert CPU-Last zu erzeugen?
Hintergrund: Ich überwache die CPU-Temperatur. Die scheint im faulen Webserver-Normalbetrieb okay zu sein (so um 40-45 °C), bei Last aber stark zu steigen (> 80 °C). Ich frage mich, wie gut so ein Mac Mini als schicker „Hauptrechner“ zu gebrauchen ist. Mein jetziger ist langsamer als so ein alter Intel-Mac-Mini, wird aber auch bei großer Last kaum wärmer als 55 °C.
Schee sans ja scho, die Macs ...
Gruß
Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])
Re: Ursache für Abstürze ermitteln
Da wüsste ich aus dem Kopf auch nichts. Eine eher krude, aber vermutlich funktionierende Möglichkeit wäre, einfach pro CPU-Thread, der zur Verfügung steht, einmal /dev/zero zu hashen:GregorS hat geschrieben:19.03.2023 08:50:01Noch eine Zusatzfrage: cpuburn scheint es nicht mehr zu geben. Was kann man stattdessen nehmen, um kontrolliert CPU-Last zu erzeugen?
Code: Alles auswählen
niemand@MIN ~ % md5sum /dev/zero
^C
md5sum /dev/zero 20,04s user 0,71s system 99% cpu 20,747 total
Je nach Alter des Rechners kann ein komplettes Reinigen des Kühlsystems (incl. Abnehmen aller Kühlkörper und Erneuern der Wärmeleitpaste) für ein erheblich kühler laufendes System sorgen. BTDT
Re: Ursache für Abstürze ermitteln
Krude ist sympathischniemand hat geschrieben:19.03.2023 09:31:08Da wüsste ich aus dem Kopf auch nichts. Eine eher krude, aber vermutlich funktionierende Möglichkeit wäre, einfach pro CPU-Thread, der zur Verfügung steht, einmal /dev/zero zu hashen:
Das funktioniert wunderbar. Da ich jetzt auch xosview mitlaufen lasse, kann ich dort wunderbar sehen, wie die Last steigt.
Das ist nicht das Problem. Als ich den Rechner bekommen habe, waren die Öffnungen, wo Luft eingesaugt wird, kaum verstaubt. Auch im Rechner sieht's sauber aus - aber allzu tief kann man da eh nicht reingucken.Je nach Alter des Rechners kann ein komplettes Reinigen des Kühlsystems (incl. Abnehmen aller Kühlkörper und Erneuern der Wärmeleitpaste) für ein erheblich kühler laufendes System sorgen. BTDT
Gruß
Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])
Re: Ursache für Abstürze ermitteln
Wie angedeutet: Wärmeleitpaste kann krümlig werden und die Wärmeleitfähigkeit zum Teil verlieren, Halterungen können verrutschen, an neuralgischen Stellen mag sich eine Staubflocke abgesetzt haben, etc. – gerade bei Kisten, deren Kühlung eh auf Kante genäht ist, lohnt’s sich, da mal hinzuschauen. Vorausgesetzt natürlich, es zeigt sich tatsächlich ein Zusammenhang zwischen Abstürzen und der Temperatur.
Was gerade bei älteren Kisten auch sein kann: Elkos an bestimmten Stellen, die durch Alterung ihre Spezifikationen verlassen haben (Kapazität, aber insbesondere auch ESR) – zeigt sich dann manchmal durch Abstürze bei impulsartiger Belastung. Das zu prüfen, ist allerdings nicht gar so trivial.
Re: Ursache für Abstürze ermitteln
Es gibt da, neben bestimmt noch anderen: stress, stress-ng, stressant.GregorS hat geschrieben:19.03.2023 08:50:01Noch eine Zusatzfrage: cpuburn scheint es nicht mehr zu geben. Was kann man stattdessen nehmen, um kontrolliert CPU-Last zu erzeugen?
Manchmal bekannt als Just (another) Terminal Hacker.
Re: Ursache für Abstürze ermitteln
Hallo nochmal!
Danke soweit für die Infos. Mir hat wohl das geeignete Suchwort gefehlt.
Und weil ich's grad mal wieder spaßig finde, wie sich auch mit einfachen Mitteln informative und hübsche Diagramme zeichnen lassen, kommt hier noch ein PDF des aktuellen Ergebnisses meiner „Untersuchung“: https://test.szaktilla.de/plot.pdf. Beteiligte: cron, gnuplot, ps2pdf
Gruß
Gregor
Danke soweit für die Infos. Mir hat wohl das geeignete Suchwort gefehlt.
Und weil ich's grad mal wieder spaßig finde, wie sich auch mit einfachen Mitteln informative und hübsche Diagramme zeichnen lassen, kommt hier noch ein PDF des aktuellen Ergebnisses meiner „Untersuchung“: https://test.szaktilla.de/plot.pdf. Beteiligte: cron, gnuplot, ps2pdf
Gruß
Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])
Re: Ursache für Abstürze ermitteln
Ich nutze zum Auslasten der CPU den Torture-Test-Modus (Small FFT) von mprime [1], hauptsächlich um die Qualität von Kühllösungen zu testen.
Vielleicht müsste ich mir die Optionen von stress-ng und Konsorten genauer anschauen, aber ich habe bisher mit keinem anderen Programm so hohe CPU-Temperaturen gesehen.
[1] https://www.mersenne.org/download/
Vielleicht müsste ich mir die Optionen von stress-ng und Konsorten genauer anschauen, aber ich habe bisher mit keinem anderen Programm so hohe CPU-Temperaturen gesehen.
[1] https://www.mersenne.org/download/
Re: Ursache für Abstürze ermitteln
Es gibt, wenn ich mich nicht verzählt habe, 21 Mac Mini Modelle mit Intel CPU, vom 32 Bit Core Solo (Early 2006) bis zum Core i5-8500B (November 2018).
Was nun wirklich nichts besonderes ist.der ohne Tastatur und Monitor in meinem Heimnetz hängt
In dem Fall kann es nicht an der Intel-GPU liegen, denn die wird bei einer remote X-Session gar nicht benutzt.zum zweiten Mal abgestürzt ist. Beide Male hatte ich mich per 'ssh -X' eingeloggt und xaos gestartet
Wie soll man das interpretieren? Meinst du den Mac oder Debian generell?mittlerweile sind wirklich heftige Hänger ja nichts Außergewöhnliches mehr
Mein Mac Mini hat solche Probleme bisher jedenfalls nicht (Macmini5.1, 120GB Intenso SSD, Debian Bookworm, Netz über Gbit-Ethernet)
Zumindest nicht, wenn du es remote laufen läßt.Vielleicht ist ja xaos kein geeignetes Tool mehr.
Zur fehlenden Systeminformation kommt nun noch, daß du vergißt zu erwähnen, ob du LAN oder WLAN nutzt.wenn ich mich nur per ssh einloggen kann und das Netzwerk womöglich das Erste ist, was hängt.