Verabschiedet sich mein Lenovo T420?
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Verabschiedet sich mein Lenovo T420?
Ich hatte diesen Hänger seit einem Jahr immer wieder mal, mittlerweile, seit einigen Wochen mehr oder weniger regelmäßig (wöchentlich) und seit ein paar Tagen ist es Roulette.
Mal ist es CPU#1 mal CPU#3...
Ich kam jetzt leider nicht ins Einloggen, weil ich die Anmeldung ins Recovery-System geskippt habe um es nochmal zu versuchen, danach ging dann wie immer gar nichts mehr - ausser hartem Ausschalten...
Wird es endgültig Zeit, mir ein neues altes Notebook zu besorgen?
Re: Verabschiedet sich mein Lenovo T420?
Macht auf mich den Eindruck als würde nur ein Prozess länger laufen oder möglicherweise länger nicht reagieren als man erwarten würde. Das kann viele Ursachen haben, z. B. ein Problem mit der HDD oder SSD (in die Richtung geht mein erster Verdacht, weil laut deinem Screenshot auch das Mounten der EFI System Partition scheitert).
Ich würde einmal ein Live-System von einem USB-Stick (oder auch ein auf einem USB-Stick installiertes Debian oä) booten.
Wenn das normal läuft, ist ein anderes schwerwiegendes Hardwareproblem unwahrscheinlich und außerdem lässt sich von so einem System eher die interne SSD oder HDD genauer begutachten und gleichzeitig dmesg im Auge behalten, ohne dass das ganze System gleich wieder stehen bleibt oder unbenutzbar wird.
Ich würde einmal ein Live-System von einem USB-Stick (oder auch ein auf einem USB-Stick installiertes Debian oä) booten.
Wenn das normal läuft, ist ein anderes schwerwiegendes Hardwareproblem unwahrscheinlich und außerdem lässt sich von so einem System eher die interne SSD oder HDD genauer begutachten und gleichzeitig dmesg im Auge behalten, ohne dass das ganze System gleich wieder stehen bleibt oder unbenutzbar wird.
Re: Verabschiedet sich mein Lenovo T420?
[1] Empfiehlt als Workaround das Hochsetzen des (Kernel-)Einstellung watchdog_thresh. Vielleicht entschärft das dein Problem bis zur eigentlichen Lösung bzw. (falls du keine Lösung findest) bis zur Neuinstallation.
[1] https://www.suse.com/support/kb/doc/?id=000018705https://www.suse.com/support/kb/doc/?id=000018705 hat geschrieben: While these messages cannot be disabled entirely, in some situations, increasing the time before these soft lockups are fired can relax the situation. To do so, increase the following sysctl parameter: kernel.watchdog_thresh
Default value for this parameter is 10 and to double the value might be a good start.
e.g.
# echo 20 > /proc/sys/kernel/watchdog_thresh
or
# echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf
# sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Re: Verabschiedet sich mein Lenovo T420?
Soweit ich das sehe, würde das zwar die Meldungen verhindern oder reduzieren, könnte aber das Hängenbleiben nicht beheben.
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
Die lassen sich eigentlich immer ganz normal Hochfahren. Stimmt.smutbert hat geschrieben:01.04.2022 12:17:03Ich würde einmal ein Live-System von einem USB-Stick (oder auch ein auf einem USB-Stick installiertes Debian oä) booten.
Wenn das normal läuft, ist ein anderes schwerwiegendes Hardwareproblem unwahrscheinlich
Du meinst zB. per "fsck /dev/sda1-3..." ? Also Check sda1, check sda2 usw. ?und außerdem lässt sich von so einem System eher die interne SSD oder HDD genauer begutachten
Kannst du mir das näher erklären?und gleichzeitig dmesg im Auge behalten, ...
Re: Verabschiedet sich mein Lenovo T420?
Zuerst einmal sollten keine unverzichtbaren Daten mehr auf der HDD/SSH sein (in dem Fall würde ich zuerst versuchen die Daten wegzusichern).
Dann könntest du in einem Terminalfenster
ausführen und laufen lassen. Neue Meldungen des Kernels sollten dort direkt auftauchen.
Parallel zum bereits laufenden Terminal als nächstes die Partitionstabelle ausgeben lassen
und wenn keine Fehler auftreten und alles richtig aussieht, versuchen die Dateisysteme zu mounten, angefangen z.B. mit der EFI System Partition, weil wir wissen, dass die schon mindestens einmal Probleme gemacht hat.
(Da würde ich bereits mit möglicherweise aufschlußreichen Fehlermeldungen rechnen.)
So nebenbei wären auch die SMART-Werte interessant, also etwa die Ausgabe von
(dazu ist smartmontools notwendig)
Dann könntest du in einem Terminalfenster
Code: Alles auswählen
$ su -
# dmesg -W
Parallel zum bereits laufenden Terminal als nächstes die Partitionstabelle ausgeben lassen
Code: Alles auswählen
fdisk -l /dev/sdX
(Da würde ich bereits mit möglicherweise aufschlußreichen Fehlermeldungen rechnen.)
So nebenbei wären auch die SMART-Werte interessant, also etwa die Ausgabe von
Code: Alles auswählen
smartctl -a /dev/sdX
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
Okay, danke.
Ich werde schauen, das Ganze aus einem Livesystem raus mal anzustoßen, heute oder morgen. Habe sogar noch einen persistenten Debianstick rumliegen, wo ich smartmontools nachinstallieren könnte. Oder vlt. hat sogar grml das dabei. Muss gucken.
Danke vorerst, melde mich, wenn gemacht. Hier geht zur Zeit alles ein bisschen Drunter und Drüber...
EDIT: ja, grml sollte das installiert haben, sehr gut.
Ich werde schauen, das Ganze aus einem Livesystem raus mal anzustoßen, heute oder morgen. Habe sogar noch einen persistenten Debianstick rumliegen, wo ich smartmontools nachinstallieren könnte. Oder vlt. hat sogar grml das dabei. Muss gucken.
Danke vorerst, melde mich, wenn gemacht. Hier geht zur Zeit alles ein bisschen Drunter und Drüber...
EDIT: ja, grml sollte das installiert haben, sehr gut.
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
Hallo smutbert, ich hoffe, ich habe das alles richtig gemacht.
Wollte ursprgl. von einem grml aus, da haperte es auf die Schnelle aber mit dem Kopieren der Ausgaben in einen Editor, jetzt hab ich's von einem Sparky-Rescue aus gemacht.
Wie auch immer, hier die Ausgaben:
41622
nach Nopaste verschoben, smutbert
Für mich ist das Klingonisch.
Also dieses Old Age und Pre-fail klingt jetzt nicht so prickelnd für meine - unklingonischen - Ohren.
Wollte ursprgl. von einem grml aus, da haperte es auf die Schnelle aber mit dem Kopieren der Ausgaben in einen Editor, jetzt hab ich's von einem Sparky-Rescue aus gemacht.
Wie auch immer, hier die Ausgaben:
41622
nach Nopaste verschoben, smutbert
Für mich ist das Klingonisch.
Also dieses Old Age und Pre-fail klingt jetzt nicht so prickelnd für meine - unklingonischen - Ohren.
Zuletzt geändert von smutbert am 03.04.2022 12:23:30, insgesamt 1-mal geändert.
Re: Verabschiedet sich mein Lenovo T420?
Ja passt alles. Es sind keine Fehler aufgetreten und smart sagt auch, dass die SSD in Ordnung ist. Das mit dem gescheiterten Mounten der EFI System Partition könnte ein Folgefehler vom hängengebliebenen Prozess gewesen sein.
Jedenfalls deutet nichts auf eine defekte SSD hin. Die Bezeichnungen old-age und pre-fail brauchen dich nicht zu beunruhigen. Damit wird nur zwischen Werten unterschieden, von denen man erwartet, dass sie sich ändern während die SSD älter wird (old-age) und Werten bei denen rein vom Altern her eigentlich keine Änderung zu erwarten wäre und die deswegen auf einen drohenden Ausfall hindeuten, wenn sie sich doch ändern (pre-fail).
Zumindest theoretisch wäre es auch möglich, dass irgendein Aufräumvorgang (z.B. fstrim) läuft und durch die hohe I/O-Last die anderen Prozesse bis über einen Timeout hinaus blockiert. Leuchtet die HDD-Led, wenn das System so hängenbleibt?
Wieviel Platz ist auf der SSD denn noch frei (/dev/sda2 und /dev/sda3, sind das / und /home? und die EFI System Partition /dev/sda1 ist vielleicht auch interessant)?
Temperaturen und Lüfter sind auch in Ordnung? (Habe jetzt keine Erfahrung mit Lenovo Notebooks, aber ich nehme an, die Temperaturen lassen sich mit sensors aus lm-sensors anzeigen.)
Mit Sparky rescue kannst du auch länger normal arbeiten ohne dass das System hängenbleibt?
(Wenn ja, mache ich eine 180°-Drehung und glaube ab jetzt eher an einen Softwarefehler.)
Jedenfalls deutet nichts auf eine defekte SSD hin. Die Bezeichnungen old-age und pre-fail brauchen dich nicht zu beunruhigen. Damit wird nur zwischen Werten unterschieden, von denen man erwartet, dass sie sich ändern während die SSD älter wird (old-age) und Werten bei denen rein vom Altern her eigentlich keine Änderung zu erwarten wäre und die deswegen auf einen drohenden Ausfall hindeuten, wenn sie sich doch ändern (pre-fail).
Zumindest theoretisch wäre es auch möglich, dass irgendein Aufräumvorgang (z.B. fstrim) läuft und durch die hohe I/O-Last die anderen Prozesse bis über einen Timeout hinaus blockiert. Leuchtet die HDD-Led, wenn das System so hängenbleibt?
Wieviel Platz ist auf der SSD denn noch frei (/dev/sda2 und /dev/sda3, sind das / und /home? und die EFI System Partition /dev/sda1 ist vielleicht auch interessant)?
Temperaturen und Lüfter sind auch in Ordnung? (Habe jetzt keine Erfahrung mit Lenovo Notebooks, aber ich nehme an, die Temperaturen lassen sich mit sensors aus lm-sensors anzeigen.)
Mit Sparky rescue kannst du auch länger normal arbeiten ohne dass das System hängenbleibt?
(Wenn ja, mache ich eine 180°-Drehung und glaube ab jetzt eher an einen Softwarefehler.)
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
Ah, ok.smutbert hat geschrieben:03.04.2022 00:20:29Die Bezeichnungen old-age und pre-fail brauchen dich nicht zu beunruhigen. Damit wird nur zwischen Werten unterschieden, von denen ...
Das muss ich beobachten beim nächsten mal.Leuchtet die HDD-Led, wenn das System so hängenbleibt?
Genau:Wieviel Platz ist auf der SSD denn noch frei (/dev/sda2 und /dev/sda3, sind das / und /home? und die EFI System Partition /dev/sda1 ist vielleicht auch interessant)?
Code: Alles auswählen
sebastian@t420:~$ df -h
Dateisystem Größe Benutzt Verf. Verw% Eingehängt auf
udev 3,9G 0 3,9G 0% /dev
tmpfs 784M 1,2M 783M 1% /run
/dev/sda2 19G 4,9G 13G 29% /
tmpfs 3,9G 0 3,9G 0% /dev/shm
tmpfs 5,0M 4,0K 5,0M 1% /run/lock
/dev/sda3 216G 100G 106G 49% /home
/dev/sda1 88M 3,4M 85M 4% /boot/efi
tmpfs 784M 28K 784M 1% /run/user/1000
sebastian@t420:~$
Auch ohne lm-sensors sage ich mal, ja, voll in Ordnung. Der Lüfter dreht eigentlich selten auf, der Laptop wird auch nicht heiss, meistens nicht mal warm.Temperaturen und Lüfter sind auch in Ordnung?
Sparky weiß ich nicht, aber zB. Tails läuft sauber für 1-2 Stunden durch.Mit Sparky rescue kannst du auch länger normal arbeiten ohne dass das System hängenbleibt?
Softwarefehler. Hmmm. Das mit fstrim klang für mich im ersten Moment schlüssig, aber dieser Hänger passiert auch mehrmals hintereinander. Vom aufgesetzten System her hatte ich das auch schon, als ich noch ein fertiges Desktop-Environment benutzt habe (MATE).
Re: Verabschiedet sich mein Lenovo T420?
Passiert das eigentlich, wenn es passiert, immer beim Start oder auch mittendrin?
Reagiert das System dann gar nicht mehr (Mauszeiger?) oder nur sehr langsam?
Reagiert das System dann gar nicht mehr (Mauszeiger?) oder nur sehr langsam?
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
Das passiert ausschließlich beim Hochfahren. Noch vor der Anmeldung.
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
Und das ist schon schräg. Da hatte ich wochenlang FAST täglich damit zu kämpfen und jetzt macht er wieder keinen Mucks und anstandslos, was er soll.
- OrangeJuice
- Beiträge: 625
- Registriert: 12.06.2017 15:12:40
Re: Verabschiedet sich mein Lenovo T420?
Das könnte etwas mit der Firmware zu tun haben. Der Kernel gibt "tainted" aus, damit kann man es nochmals abfragen.
Hier gibt es ein kurze Erklärung zu "soft lockup": What are all these "Bug: soft lockup" messages about?
Falls noch eine separate NVIDIA Grafikkarte verbaut ist, könnte man dort vielleicht noch ansetzten, die Treiber machen manchmal Probleme. Ich kann ansonsten nicht weiterhelfen.
Code: Alles auswählen
cat /proc/sys/kernel/tainted
for i in $(seq 18); do echo $(($i-1)) $(($(cat /proc/sys/kernel/tainted)>>($i-1)&1));done
More detailed explanation for tainting
0. G if all modules loaded have a GPL or compatible license,...
...
11. I if the kernel is working around a severe bug in the platform firmware (BIOS or similar).
...
14. L if a soft lockup has previously occurred on the system.
Quelle:kernel.org - tainted-kernels11. workaround for bug in platform firmware applied
14. soft lockup occurred
Hier gibt es ein kurze Erklärung zu "soft lockup": What are all these "Bug: soft lockup" messages about?
Falls noch eine separate NVIDIA Grafikkarte verbaut ist, könnte man dort vielleicht noch ansetzten, die Treiber machen manchmal Probleme. Ich kann ansonsten nicht weiterhelfen.
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
OrangeJuice hat geschrieben:04.04.2022 12:00:30Der Kernel gibt "tainted" aus, damit kann man es nochmals abfragen...
Code: Alles auswählen
sebastian@t420:~$ cat /proc/sys/kernel/tainted
2048
sebastian@t420:~$ for i in $(seq 18); do echo $(($i-1)) $(($(cat /proc/sys/kernel/tainted)>>($i-1)&1));done
0 0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0
11 1
12 0
13 0
14 0
15 0
16 0
17 0
sebastian@t420:~$
Wenn ich mir nochmal den 2. Screenshot anschaue, interpretiere ich dann richtig?
Code: Alles auswählen
Tainted G (Propblob geladen) I (Workaround für EFI-Bug angewendet) L (Softlockup aufgetreten
- ja vielen Dank für die Mitteilung, ich hätt's sonst glatt übersehen...)
Trotzdem danke!
-
- Beiträge: 1885
- Registriert: 12.07.2020 11:21:17
Re: Verabschiedet sich mein Lenovo T420?
Kurzes Update, nach kompletter Umstellung auf mein ganz eigenes Desktopenvironment und mehrmaliger Neuinstallation desselben, zickt mein Rechner nunmehr seit zwei Monaten nicht mehr rum.
Ich nehme an, dass das da irgendein (TM) Dienst am Laufen war, mit dem mein Mate+Awesome-Hybrid nicht ganz klar kam, so in der Art.
Ich nehme an, dass das da irgendein (TM) Dienst am Laufen war, mit dem mein Mate+Awesome-Hybrid nicht ganz klar kam, so in der Art.