ich habe hier ein Problem an dem ich schon seit Monaten herumbastele, aber dessen Ursache ich nicht finden kann. Ich kann noch nicht einmal sagen, ob es sich hier um ein Soft- oder ein Hardwareproblem handelt. Das herauszufinden wäre der erste Schritt. Worum geht es:
- Ich habe eine Maschine aufgesetzt, die vorrangig einen tvheadend Server betreiben soll (daher mein Post unter "Multimedia und Spiele"), der Sendungen von einem SAT-IP Server aufnehmen und abspielen soll.
- Hierzu habe ich ein vorhandenes Asus M4A89GTD-PRO/USB3 mit einem AMD Phenom(tm) II X6 1055T Prozessor und 4GB RAM genommen, was noch in der Schublade lag und früher unter Windows problemlos seinen Dienst verrichtet hat.
- Das Board wurde zusammen mit einer SSD zum Starten und zwei Platten für Aufnahmen, Videos, etc. in ein be quiet Gehäuse verpflanzt.
- Es ist ansonsten keine zusätzliche Hardware verbaut, keinerlei Steckkarten, USB-Geräte, o.ä.
- Ich habe auf der Maschine ein debian als headless Server installiert und dort dann tvheadend installiert. Als Abspieler dient u. a. ein Raspi mit xbian/Kodi.
- Die Zeit in der die Maschine bis zum nächsten Freeze läuft ist variabel, es kann sein, dass der nächste Freeze nach einer Stunde kommt, oder auch erst nach zwei Tagen.
- Ich habe tvheadend zwischenzeitlich als Debug installliert und lasse alles loggen. Oft (aber nicht immer) ist das letzte was ich im Log sehe ein "arm Channel timer" Eintrag: "2018-11-09 14:06:23.774 [ DEBUG]:epg: arm channel timer @ 2018-11-09;14:55:00(+0100) for WDR HD Köln"
- Unmittelbar hinter dem "arm channel timer"-Eintrag kommt als allerletzes immer mal wieder (aber längst nicht bei jedem Freeze) eine Reihe von Punkten im Log:
2018-11-09 14:06:22.475 [ DEBUG]:epg: arm channel timer @ 2018-11-09;14:55:00(+0100) for WDR HD Köln
2018-11-09 14:06:23.774 [ DEBUG]:epg: arm channel timer @ 2018-11-09;14:55:00(+0100) for WDR HD Köln
................................................................................................................................................................................................................................................................ <- Diese Punkte sind Bestandteil des Logs!
Die Punkte sind null Bytes, wenn man sich das Logfile mit einem Hexeditor ansieht. - Auf der Konsole (testweise angeschlossener VGA Monitor) ist *keine* Kernel Panic Meldung zu sehen, sondern meist schlicht und ergreifend gar nichts mehr (obwohl in grub die Option "consoleblank=0" gesetzt ist)
- Das System reagiert auch sonst nicht mehr, nicht über ssh und auch nicht auf eine lokal angeschlossene Tastatur. Es ist auch nicht mehr pingbar, die Karre steht tatsächlich komplett.
- Memtest laufen lassen (mehrere Tage lag), die Maschine lief dabei 100% stabil durch und es wurden keine RAM Fehler gefunden. Man konnte am Hochdrehen des CPU-Lüfters auch gut erkennen, dass die Lüfterregelung korrekt funktioniert.
- Netzteil und Versorgungsspannungen kontrolliert
- Aktuellstes BIOS und Firmware für HDD'Ss installiert
- Alle nicht benöigten Treiber temporär deaktiviert
- Power Management deaktiviert
- Konservative BIOS-Einstellungen geladen
- Den EPG-Grabber von tvheadend deaktiviert
- Versucht alle Cores bis auf einen zu deaktivieren. Das funktionierte jedoch nicht, offenbar beherrscht das BIOS das Abschalten der Cores nicht sauber, Nach dem Abschalten wollte das Board gar nicht mehr mit dem POST beginnen, ich musste das CMOS löschen(!) um den Rechner wieder starten zu können.
- Den Developer Branch von tvheadend installiert
System hängt, drücke Reset und starte neu. Ein paar Stunden später hängt das System erneut, Reset drücken und neu starten. Jetzt fährt das System neu hoch und läuft auf einmal unerklärlicherweise stabil, ich hatte schon Uptimes von ~150 Tagen. Irgendwann muss der Server dann doch mal neu gestartet werden, und damit geht das Einfrierproblem von neuem los. Was habe ich gemacht außer Reset zu drücken? Absolut gar nichts!
Die Tatsache, dass die Freezes so undeterministisch sind lässt mich immer noch ein Hardwaredefekt in Betracht ziehen, aber was kann ich noch tun um irgendetwas zu testen? Bevor ich das Board schrotte und ein neues kaufe würde ich gerne sicherstellen, dass auch tatsächlich ein Hardwaredefekt auf dem Board vorliegt. Was also kann ich noch weiter tun um den Auslöser für die Freezes einzugrenzen??`Bin für jede Hilfe und Idee dankbar!
THX
Don