mce: [Hardware Error]

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
refused

mce: [Hardware Error]

Beitrag von refused » 19.07.2020 16:20:55

Hi,

beim booten sind mir einige komische Meldungen aufgefallen:

Code: Alles auswählen

$ sudo cat /var/log/syslog | grep -i mce
Jul 19 11:57:37 T800 kernel: [    1.181951] mce: Using 12 MCE banks
Jul 19 12:59:42 T800 kernel: [    1.170950] mce: Using 12 MCE banks
Jul 19 15:41:07 T800 kernel: [    0.339083] mce: [Hardware Error]: Machine check events logged
Jul 19 15:41:07 T800 kernel: [    0.339084] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 6: ae00000000801136
Jul 19 15:41:07 T800 kernel: [    0.339086] mce: [Hardware Error]: TSC 0 ADDR 8b445140 MISC 3040000086 
Jul 19 15:41:07 T800 kernel: [    0.339089] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173229 SOCKET 0 APIC 0 microcode d6
Jul 19 15:41:07 T800 kernel: [    0.339091] mce: [Hardware Error]: Machine check events logged
Jul 19 15:41:07 T800 kernel: [    0.339091] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 11: ae00000000801136
Jul 19 15:41:07 T800 kernel: [    0.339093] mce: [Hardware Error]: TSC 0 ADDR 8b445100 MISC 43040000086 
Jul 19 15:41:07 T800 kernel: [    0.339094] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173229 SOCKET 0 APIC 0 microcode d6
Jul 19 15:41:07 T800 kernel: [    1.198096] mce: Using 12 MCE banks
Jul 19 15:50:00 T800 kernel: [    0.342874] mce: [Hardware Error]: Machine check events logged
Jul 19 15:50:00 T800 kernel: [    0.342875] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 6: ae00000000801136
Jul 19 15:50:00 T800 kernel: [    0.342878] mce: [Hardware Error]: TSC 0 ADDR 8b445140 MISC 3040000086 
Jul 19 15:50:00 T800 kernel: [    0.342881] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173781 SOCKET 0 APIC 0 microcode d6
Jul 19 15:50:00 T800 kernel: [    0.342882] mce: [Hardware Error]: Machine check events logged
Jul 19 15:50:00 T800 kernel: [    0.342883] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 9: ae00000000801136
Jul 19 15:50:00 T800 kernel: [    0.342884] mce: [Hardware Error]: TSC 0 ADDR 8b51c300 MISC 3040000086 
Jul 19 15:50:00 T800 kernel: [    0.342886] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173781 SOCKET 0 APIC 0 microcode d6
Jul 19 15:50:00 T800 kernel: [    0.342888] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 10: ae00000000801136
Jul 19 15:50:00 T800 kernel: [    0.342889] mce: [Hardware Error]: TSC 0 ADDR 8b51c340 MISC 43040000086 
Jul 19 15:50:00 T800 kernel: [    0.342891] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173781 SOCKET 0 APIC 0 microcode d6
Jul 19 15:50:00 T800 kernel: [    0.342892] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 11: ae00000000801136
Jul 19 15:50:00 T800 kernel: [    0.342893] mce: [Hardware Error]: TSC 0 ADDR 8b445100 MISC 47040000086 
Jul 19 15:50:00 T800 kernel: [    0.342895] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173781 SOCKET 0 APIC 0 microcode d6
Jul 19 15:50:00 T800 kernel: [    1.174133] mce: Using 12 MCE banks
Jul 19 15:53:07 T800 kernel: [    0.321404] mce: [Hardware Error]: Machine check events logged
Jul 19 15:53:07 T800 kernel: [    0.321406] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 6: ae00000000801136
Jul 19 15:53:07 T800 kernel: [    0.321408] mce: [Hardware Error]: TSC 0 ADDR 8b445140 MISC 3040000086 
Jul 19 15:53:07 T800 kernel: [    0.321410] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173968 SOCKET 0 APIC 0 microcode b4
Jul 19 15:53:07 T800 kernel: [    0.321412] mce: [Hardware Error]: Machine check events logged
Jul 19 15:53:07 T800 kernel: [    0.321413] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 11: ae00000000801136
Jul 19 15:53:07 T800 kernel: [    0.321414] mce: [Hardware Error]: TSC 0 ADDR 8b445100 MISC 43040000086 
Jul 19 15:53:07 T800 kernel: [    0.321416] mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1595173968 SOCKET 0 APIC 0 microcode b4
Jul 19 15:53:07 T800 kernel: [    1.096968] mce: Using 12 MCE banks
Ich hatte intel-microcode installiert. Jetzt habe ich es deinstalliert.
Nimmt sich nix, die Meldung kommt immer.

Jemand eine Idee, was das genau zu sagen hat?

CPU ist eine Intel Xeon E-2146G, also recht neu für Debian Verhältnisse würde ich sagen(?)

slu
Beiträge: 2145
Registriert: 23.02.2005 23:58:47

Re: mce: [Hardware Error]

Beitrag von slu » 19.07.2020 17:17:51

Wir haben inzwischen drei neue System mit dieser Ausgabe [1], bis heute laufen die Rechner aber ohne Probleme.
Mit einem neueren Kernel kommt die Meldung gar nicht oder viel seltener.
[1] viewtopic.php?f=13&t=176217
Gruß
slu

Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.

Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER

refused

Re: mce: [Hardware Error]

Beitrag von refused » 19.07.2020 17:38:33

Joa funktionieren tut bei mir auch alles. :D

Okay, dann werde ich wohl einfach mal abwarten. :lol:

KP97
Beiträge: 3428
Registriert: 01.02.2013 15:07:36

Re: mce: [Hardware Error]

Beitrag von KP97 » 19.07.2020 18:57:28

Du kannst in die Kernelzeile ein mce=0 setzen, dann werden die Einträge nicht mehr geloggt. Wenn ich mich recht erinnere, ist das nur eine Warnung. Wenn keine Fehler auftreten, braucht man den machine check nicht. Du kannst aber auch mal in der Doku auf kernel.org nachlesen, falls es Dich beruhigt.

Antworten