Verabschiedet sich mein Lenovo T420?

Debian auf Notebooks und speziellen Geräten wie eingebetteten Systemen, Routern, Set-Top-Boxen, ...
Antworten
dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 01.04.2022 10:58:45

3633

3634

Ich hatte diesen Hänger seit einem Jahr immer wieder mal, mittlerweile, seit einigen Wochen mehr oder weniger regelmäßig (wöchentlich) und seit ein paar Tagen ist es Roulette.

Mal ist es CPU#1 mal CPU#3...

Ich kam jetzt leider nicht ins Einloggen, weil ich die Anmeldung ins Recovery-System geskippt habe um es nochmal zu versuchen, danach ging dann wie immer gar nichts mehr - ausser hartem Ausschalten... :facepalm: :roll: :oops:

Wird es endgültig Zeit, mir ein neues altes Notebook zu besorgen?

Benutzeravatar
smutbert
Moderator
Beiträge: 8315
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von smutbert » 01.04.2022 12:17:03

Macht auf mich den Eindruck als würde nur ein Prozess länger laufen oder möglicherweise länger nicht reagieren als man erwarten würde. Das kann viele Ursachen haben, z. B. ein Problem mit der HDD oder SSD (in die Richtung geht mein erster Verdacht, weil laut deinem Screenshot auch das Mounten der EFI System Partition scheitert).

Ich würde einmal ein Live-System von einem USB-Stick (oder auch ein auf einem USB-Stick installiertes Debian oä) booten.
Wenn das normal läuft, ist ein anderes schwerwiegendes Hardwareproblem unwahrscheinlich und außerdem lässt sich von so einem System eher die interne SSD oder HDD genauer begutachten und gleichzeitig dmesg im Auge behalten, ohne dass das ganze System gleich wieder stehen bleibt oder unbenutzbar wird.

Benutzeravatar
tegula
Beiträge: 439
Registriert: 04.06.2004 13:51:04
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von tegula » 01.04.2022 12:36:12

[1] Empfiehlt als Workaround das Hochsetzen des (Kernel-)Einstellung watchdog_thresh. Vielleicht entschärft das dein Problem bis zur eigentlichen Lösung bzw. (falls du keine Lösung findest) bis zur Neuinstallation.
https://www.suse.com/support/kb/doc/?id=000018705 hat geschrieben: While these messages cannot be disabled entirely, in some situations, increasing the time before these soft lockups are fired can relax the situation. To do so, increase the following sysctl parameter: kernel.watchdog_thresh
Default value for this parameter is 10 and to double the value might be a good start.
e.g.
# echo 20 > /proc/sys/kernel/watchdog_thresh
or
# echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf
# sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
[1] https://www.suse.com/support/kb/doc/?id=000018705

Benutzeravatar
smutbert
Moderator
Beiträge: 8315
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von smutbert » 01.04.2022 13:30:20

Soweit ich das sehe, würde das zwar die Meldungen verhindern oder reduzieren, könnte aber das Hängenbleiben nicht beheben.

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 01.04.2022 15:06:07

smutbert hat geschrieben: ↑ zum Beitrag ↑
01.04.2022 12:17:03
Ich würde einmal ein Live-System von einem USB-Stick (oder auch ein auf einem USB-Stick installiertes Debian oä) booten.
Wenn das normal läuft, ist ein anderes schwerwiegendes Hardwareproblem unwahrscheinlich
Die lassen sich eigentlich immer ganz normal Hochfahren. Stimmt.
und außerdem lässt sich von so einem System eher die interne SSD oder HDD genauer begutachten
Du meinst zB. per "fsck /dev/sda1-3..." ? Also Check sda1, check sda2 usw. ?
und gleichzeitig dmesg im Auge behalten, ...
Kannst du mir das näher erklären?

Benutzeravatar
smutbert
Moderator
Beiträge: 8315
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von smutbert » 01.04.2022 21:03:33

Zuerst einmal sollten keine unverzichtbaren Daten mehr auf der HDD/SSH sein (in dem Fall würde ich zuerst versuchen die Daten wegzusichern).
Dann könntest du in einem Terminalfenster

Code: Alles auswählen

$ su -
# dmesg -W
ausführen und laufen lassen. Neue Meldungen des Kernels sollten dort direkt auftauchen.

Parallel zum bereits laufenden Terminal als nächstes die Partitionstabelle ausgeben lassen

Code: Alles auswählen

fdisk -l /dev/sdX
und wenn keine Fehler auftreten und alles richtig aussieht, versuchen die Dateisysteme zu mounten, angefangen z.B. mit der EFI System Partition, weil wir wissen, dass die schon mindestens einmal Probleme gemacht hat.
(Da würde ich bereits mit möglicherweise aufschlußreichen Fehlermeldungen rechnen.)

So nebenbei wären auch die SMART-Werte interessant, also etwa die Ausgabe von

Code: Alles auswählen

smartctl -a /dev/sdX
(dazu ist Debiansmartmontools notwendig)

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 02.04.2022 09:15:49

Okay, danke. :THX:

Ich werde schauen, das Ganze aus einem Livesystem raus mal anzustoßen, heute oder morgen. Habe sogar noch einen persistenten Debianstick rumliegen, wo ich Debiansmartmontools nachinstallieren könnte. Oder vlt. hat sogar grml das dabei. Muss gucken.

Danke vorerst, melde mich, wenn gemacht. Hier geht zur Zeit alles ein bisschen Drunter und Drüber... :lol:

EDIT: ja, grml sollte das installiert haben, sehr gut.

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 02.04.2022 15:39:27

Hallo smutbert, ich hoffe, ich habe das alles richtig gemacht.

Wollte ursprgl. von einem grml aus, da haperte es auf die Schnelle aber mit dem Kopieren der Ausgaben in einen Editor, jetzt hab ich's von einem Sparky-Rescue aus gemacht.

Wie auch immer, hier die Ausgaben:

NoPaste-Eintrag41622
nach Nopaste verschoben, smutbert

Für mich ist das Klingonisch. :lol:

Also dieses Old Age und Pre-fail klingt jetzt nicht so prickelnd für meine - unklingonischen - Ohren.
Zuletzt geändert von smutbert am 03.04.2022 12:23:30, insgesamt 1-mal geändert.

Benutzeravatar
smutbert
Moderator
Beiträge: 8315
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von smutbert » 03.04.2022 00:20:29

Ja passt alles. Es sind keine Fehler aufgetreten und smart sagt auch, dass die SSD in Ordnung ist. Das mit dem gescheiterten Mounten der EFI System Partition könnte ein Folgefehler vom hängengebliebenen Prozess gewesen sein.

Jedenfalls deutet nichts auf eine defekte SSD hin. Die Bezeichnungen old-age und pre-fail brauchen dich nicht zu beunruhigen. Damit wird nur zwischen Werten unterschieden, von denen man erwartet, dass sie sich ändern während die SSD älter wird (old-age) und Werten bei denen rein vom Altern her eigentlich keine Änderung zu erwarten wäre und die deswegen auf einen drohenden Ausfall hindeuten, wenn sie sich doch ändern (pre-fail).

Zumindest theoretisch wäre es auch möglich, dass irgendein Aufräumvorgang (z.B. fstrim) läuft und durch die hohe I/O-Last die anderen Prozesse bis über einen Timeout hinaus blockiert. Leuchtet die HDD-Led, wenn das System so hängenbleibt?
Wieviel Platz ist auf der SSD denn noch frei (/dev/sda2 und /dev/sda3, sind das / und /home? und die EFI System Partition /dev/sda1 ist vielleicht auch interessant)?

Temperaturen und Lüfter sind auch in Ordnung? (Habe jetzt keine Erfahrung mit Lenovo Notebooks, aber ich nehme an, die Temperaturen lassen sich mit sensors aus Debianlm-sensors anzeigen.)

Mit Sparky rescue kannst du auch länger normal arbeiten ohne dass das System hängenbleibt?

(Wenn ja, mache ich eine 180°-Drehung und glaube ab jetzt eher an einen Softwarefehler.)

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 03.04.2022 09:20:04

smutbert hat geschrieben: ↑ zum Beitrag ↑
03.04.2022 00:20:29
Die Bezeichnungen old-age und pre-fail brauchen dich nicht zu beunruhigen. Damit wird nur zwischen Werten unterschieden, von denen ...
Ah, ok.
Leuchtet die HDD-Led, wenn das System so hängenbleibt?
Das muss ich beobachten beim nächsten mal.
Wieviel Platz ist auf der SSD denn noch frei (/dev/sda2 und /dev/sda3, sind das / und /home? und die EFI System Partition /dev/sda1 ist vielleicht auch interessant)?
Genau:

Code: Alles auswählen

sebastian@t420:~$  df -h
Dateisystem    Größe Benutzt Verf. Verw% Eingehängt auf
udev            3,9G       0  3,9G    0% /dev
tmpfs           784M    1,2M  783M    1% /run
/dev/sda2        19G    4,9G   13G   29% /
tmpfs           3,9G       0  3,9G    0% /dev/shm
tmpfs           5,0M    4,0K  5,0M    1% /run/lock
/dev/sda3       216G    100G  106G   49% /home
/dev/sda1        88M    3,4M   85M    4% /boot/efi
tmpfs           784M     28K  784M    1% /run/user/1000
sebastian@t420:~$ 
Das sollte eigentlich passen
Temperaturen und Lüfter sind auch in Ordnung?
Auch ohne lm-sensors sage ich mal, ja, voll in Ordnung. Der Lüfter dreht eigentlich selten auf, der Laptop wird auch nicht heiss, meistens nicht mal warm.
Mit Sparky rescue kannst du auch länger normal arbeiten ohne dass das System hängenbleibt?
Sparky weiß ich nicht, aber zB. Tails läuft sauber für 1-2 Stunden durch.

Softwarefehler. Hmmm. Das mit fstrim klang für mich im ersten Moment schlüssig, aber dieser Hänger passiert auch mehrmals hintereinander. Vom aufgesetzten System her hatte ich das auch schon, als ich noch ein fertiges Desktop-Environment benutzt habe (MATE).

Benutzeravatar
smutbert
Moderator
Beiträge: 8315
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von smutbert » 03.04.2022 22:42:42

Passiert das eigentlich, wenn es passiert, immer beim Start oder auch mittendrin?
Reagiert das System dann gar nicht mehr (Mauszeiger?) oder nur sehr langsam?

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 04.04.2022 07:59:09

Das passiert ausschließlich beim Hochfahren. Noch vor der Anmeldung.

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 04.04.2022 11:32:51

Und das ist schon schräg. Da hatte ich wochenlang FAST täglich damit zu kämpfen und jetzt macht er wieder keinen Mucks und anstandslos, was er soll.

Benutzeravatar
OrangeJuice
Beiträge: 616
Registriert: 12.06.2017 15:12:40

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von OrangeJuice » 04.04.2022 12:00:30

Das könnte etwas mit der Firmware zu tun haben. Der Kernel gibt "tainted" aus, damit kann man es nochmals abfragen.

Code: Alles auswählen

cat /proc/sys/kernel/tainted

for i in $(seq 18); do echo $(($i-1)) $(($(cat /proc/sys/kernel/tainted)>>($i-1)&1));done
More detailed explanation for tainting

0. G if all modules loaded have a GPL or compatible license,...
...
11. I if the kernel is working around a severe bug in the platform firmware (BIOS or similar).
...
14. L if a soft lockup has previously occurred on the system.
11. workaround for bug in platform firmware applied
14. soft lockup occurred
Quelle:kernel.org - tainted-kernels

Hier gibt es ein kurze Erklärung zu "soft lockup": What are all these "Bug: soft lockup" messages about?
Falls noch eine separate NVIDIA Grafikkarte verbaut ist, könnte man dort vielleicht noch ansetzten, die Treiber machen manchmal Probleme. Ich kann ansonsten nicht weiterhelfen.

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 04.04.2022 17:55:10

OrangeJuice hat geschrieben: ↑ zum Beitrag ↑
04.04.2022 12:00:30
Der Kernel gibt "tainted" aus, damit kann man es nochmals abfragen...

Code: Alles auswählen

sebastian@t420:~$  cat /proc/sys/kernel/tainted
2048
sebastian@t420:~$  for i in $(seq 18); do echo $(($i-1)) $(($(cat /proc/sys/kernel/tainted)>>($i-1)&1));done
0 0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0
11 1
12 0
13 0
14 0
15 0
16 0
17 0
sebastian@t420:~$ 
Bedeutet die 1 bei 11: ja, es wird ein BIOS-Workaround angewandt? Das bekomme ich nämlich bei jedem Hochfahren ohnehin schön mitgeteilt, hat noch nie gestört. Ist auf letztmöglichen Stand das EFI.

Wenn ich mir nochmal den 2. Screenshot anschaue, interpretiere ich dann richtig?

Code: Alles auswählen

Tainted G (Propblob geladen) I (Workaround für EFI-Bug angewendet) L (Softlockup aufgetreten 
- ja vielen Dank für die Mitteilung, ich hätt's sonst glatt übersehen...)
Nvidia ist keine verbaut, auch sonst nichts Exotisches.

Trotzdem danke! :THX:

dasebastian
Beiträge: 1847
Registriert: 12.07.2020 11:21:17
Lizenz eigener Beiträge: MIT Lizenz

Re: Verabschiedet sich mein Lenovo T420?

Beitrag von dasebastian » 29.06.2022 20:46:56

Kurzes Update, nach kompletter Umstellung auf mein ganz eigenes Desktopenvironment und mehrmaliger :lol: Neuinstallation desselben, zickt mein Rechner nunmehr seit zwei Monaten nicht mehr rum.

Ich nehme an, dass das da irgendein (TM) Dienst am Laufen war, mit dem mein Mate+Awesome-Hybrid nicht ganz klar kam, so in der Art. :THX:

Antworten