PC stürzt mit "XIO: fatal IO errror 11" ab

KDE, Gnome, Windowmanager, X11, Grafiktreiber und alles was dazu notwendig ist. Schau auch in den "Tipps und Tricks"-Bereich.
NAB
Beiträge: 5502
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von NAB » 16.01.2018 17:02:16

Ich hab da noch ein Fünftens: deine Grub-Kommandozeile sieht etwas wirr aus:

Code: Alles auswählen

reboot=bios quiet radeon.audio=1 i915.disable_power_well=0 intel_iommu=on,igfx_off video=HDMI-1:e nmi_watchdog=0 acpi=off apm=off
Ich seh da zwar nichts Schädliches (glaube ich) aber das meiste kommt mir überflüssig vor.

dmesg -w bringt nur über ssh etwas, und auch nur, wenn der Rechner abstürzt oder einfriert. Ansonsten ist das Ergebnis das gleiche wie bei "dmesg". Ich seh da am Ende, dass drei USB-Geräte verschwinden. Wenn sie das von selber tun, ist das nicht gut.

Wenn ich wüsste, warum dein X-Server abstürzt, würde ich es dir sofort verraten. Dein neustes Problem scheint aber zu sein, dass der X-Server mit dem falschen Treiber läuft - warum auch immer.

Und sicherlich sollte der X-Server nicht abstürzen. Wenn dazu aber noch der ganze Kernel abstürzt (falls er das tut), dann hast du ein anderes Problem. Ohne Kernel kein X-Server - logisch :)

Die schreiben längst nicht alle BIOS-Änderungen in das Protokoll. Da sitzt ein genervter Techniker und denkt sich "Was schreib ich denn nun ins Formular? Ah ... was mit SSDs!".
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 16.01.2018 18:36:47

Diesmal ist er schneller wieder abgestürzt oder runtergefahren. JEdenfalls war er aus.
Ich habe das BIOS noch nicht aktualisiert, weil ich zwar das BIOD runtergeladen habe, aber noch nicht rausgefunden habe, wie ich einen USB-Stick passend erstelle, um zu flashen.
Da bin ich noch dran.

hier jedenfalls die Ausgabe von Xorg.0.log.old

http://nopaste.debianforum.de/40131

Und hier dmesg Ausgabe aber erst nach dem Reboot.
Liebe Grüße
Wuppi

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 16.01.2018 18:37:15

Liebe Grüße
Wuppi

NAB
Beiträge: 5502
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von NAB » 16.01.2018 19:14:22

wuppi, ich glaube, du hast dir da ein völlig neues Problem gebastelt.

Schau mal auf dein erstes Xorg.log:
pastebin/?mode=view&s=40123
Hier läuft der "modeset"-Treiber und der X-Server beendet sich ordnungsgemäß. Genau wie es sein sollte.

Und dein neustes Xorg.log:
pastebin/?mode=view&s=40131
Hier läuft der VESA-Treiber und der X-Server stürzt mit einem Segmentation fault ab.

Der VESA-Treiber ist so oder so falsch, egal ob er abstürzt. Das ist ein uraltes Ding, das dir in Notfällen irgendwie ein Bild auf den Schirm machen soll. Damit hast du gar keine Hardware-Beschleunigung.

Deine gesamte Intel-Grafik scheint verschwunden zu sein. Und ich habe keine Ahnung wieso.

Die einzige Änderung, die du hier mitgeteilt hast, ist das "acpi=off". Das sollte zwar keine Grafikkarte verschwinden lassen, aber wer weiß, wie das BIOS reagiert, wenn man seine ACPI-Einstellungen ignoriert.
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 17.01.2018 07:06:59

OK, dann werde ich jetzt mal den Rechner zunächst auf mein Backup von Debian 8 zurücksetzen und schauen, ob das weiter stabil läuft.
Nicht, dass wir hier ein Hardwareproblem haben, denn dann können wir in der Installation und Setup von Debian 9 lange vergeblich suchen.

Erst, wenn das stabil über ein, zwei Tage läuft mit ein- und ausschalten, dann werde ich den Upgrade nach Stretch nochmals anlaufen lassen.
Und wenn ich wieder in eine Sackgasse laufe, werde ich versuchen, das System mit einem frischen Stretch nochmals aufzusetzen, aber das würde ich
natürlich gerne vermeiden.

Ich werde berichten.

Warum übrigens drei USB-Geräte sich abmelden, ist mir auch unklar. Wenn ich den Monitor ausschalte, dürfte sich eigentlich nur der Touch-Screen, also ein USB-Gerät,
ausschalten.
Liebe Grüße
Wuppi

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 17.01.2018 10:17:48

Ich habe den Rechner jetzt auf die letzte bekannt funktionierende Debian 8 Version zurückgesetzt (Backup eingespielt).
Interessanterweise (jedenfalls für mich als Laien) ist nun in Xorg.0.log von einem Intel-Treiber die Rede, was nach dem Upgrade zu Stretch nicht mehr der Fall war (siehe erster Xorg.0.log).

Hier das aktuelle Log nach dem Downgrade zu Jessie und Firmware - Upgrade auf Version F5.

http://nopaste.debianforum.de/40133

Ich lassen den Rechner jetzt mal 1-2 Tage laufen und versuche, den Fehler zu provozieren. Dann werde ich erst die GRUB-Kommandos anhängen und wenn das auch läuft, werde ich nochmals an den Upgrade zu Stretch gehen.

Andere Ideen sind mir natürlich auch willkommen
Liebe Grüße
Wuppi

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 17.01.2018 12:03:42

Es gibt neue Erkenntnisse!
Auch mit der bislang einwandfrei funktionierenden Konfiguration stürzt das System nach einer Weile ab.
Ich hatte per SSH auf den Rechner zum Zeitpunkt des Absturzes dmesg -w laufen und hier ist der Log

http://nopaste.debianforum.de/40135

Da dieses Image auf bisher allen von mir verwendeten baugleichen Geräten ohne Abstürze funktionierte, gehe ich nunmehr von einem Hardware-Problem aus.

Ich kann allerdings nicht erkennen, in welcher Komponente das sein könnte.

Wie könnte ich so etwas herausfinden?
Liebe Grüße
Wuppi

NAB
Beiträge: 5502
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von NAB » 17.01.2018 17:51:28

wuppi hat geschrieben: ↑ zum Beitrag ↑
17.01.2018 07:06:59
Warum übrigens drei USB-Geräte sich abmelden, ist mir auch unklar. Wenn ich den Monitor ausschalte, dürfte sich eigentlich nur der Touch-Screen, also ein USB-Gerät,ausschalten.
Das wäre möglich ... der Screen könnte einen USB-Hub mit "Touch" und einem weiteren Gerät enthalten.
wuppi hat geschrieben: ↑ zum Beitrag ↑
17.01.2018 10:17:48
Ich habe den Rechner jetzt auf die letzte bekannt funktionierende Debian 8 Version zurückgesetzt (Backup eingespielt).
Interessanterweise (jedenfalls für mich als Laien) ist nun in Xorg.0.log von einem Intel-Treiber die Rede, was nach dem Upgrade zu Stretch nicht mehr der Fall war (siehe erster Xorg.0.log).
Das ist richtig so. Jessie hat den "intel"-Treiber verwendet. Der wurde und wird von Intel-Mitarbeitern entwickelt. Parallel dazu haben andere Kernel-Entwickler den "modeset"-Treiber entwickelt, der irgendwann mal alle Grafikkarten einheitlich ansprechen soll. Debian hat mit Stretch auf den "modeset"-Treiber gewechselt. Ich war da auch erst etwas misstrauisch, aber bisher habe ich keine Probleme mit "modeset" gesehen oder gehört. Den "intel"-Treiber sollte man trotzdem im Hinterkopf behalten, falls sich dein Problem auf die Grafik einkreisen lässt.

In deinem Log von Jessie findet sich auch eine interessante Meldung:

Code: Alles auswählen

[    33.566] (WW) intel(0): Unknown chipset
Der Treiber (und Kernel) von Jessie ist eigentlich zu alt für deine "brandneue" Intel-Grafik. Laufen tut's trotzdem, aber du hattest unter Jessie keine 3D-Beschleunigung, auch nicht beim Video-Abspielen. Scheint dich nicht gestört zu haben.
wuppi hat geschrieben: ↑ zum Beitrag ↑
17.01.2018 12:03:42
Da dieses Image auf bisher allen von mir verwendeten baugleichen Geräten ohne Abstürze funktionierte, gehe ich nunmehr von einem Hardware-Problem aus.
Moooment! Hast du mit Jessie Updates eingespielt?
Wir haben da nämlich grad ne kleine Sicherheitskatastrophe in der Computerwelt, "Meltdown" und "Spectre" gingen durch die Presse, sämtliche Intel-Prozessoren sind betroffen, Debian hat auch für Jessie einen neuen Kernel herausgegeben mit grundlegenden Änderungen in der Speicherverwaltung. Man hofft zwar, dass diese Änderungen keine Fehler verursachen, aber die übliche lange Testphase, die man an "Debian Stable " sonst schätzt, musste leider ausfallen.

In deinem dmesg -w sieht man leider überhaupt nichts. Der Kernel bootet bis Sekunde 16 normal hoch und die drei "perf"-Meldungen danach sind völlig belanglos.
wuppi hat geschrieben: ↑ zum Beitrag ↑
17.01.2018 12:03:42
Ich kann allerdings nicht erkennen, in welcher Komponente das sein könnte.

Wie könnte ich so etwas herausfinden?
Was sollte das bringen? Die Festplatte wird vermutlich heil sein. Die einzige weitere austauschbare Komponente ist der Speicher.
Ich lasse bei neuen Systemen bzw. neuem Speicher grundsätzlich 24 Stunden "memtest86+" laufen - für UEFI-Systeme musst du es dir als ISO beim Hersteller herunterladen.
Sonst könntest du eh nichts "reparieren".

Wenn das System sich plötzlich komplett ausschaltet, würde ich zuerst auf die Stromversorgung tippen. Aber Macken in der Stromversorgung schlagen eher unter Hochlast zu und nicht beim "Nichtstun". Da bist du sonst wieder in dieser erwähnten Grauzone aus Stromsparmechanismen, die man eventuell auch ausschalten oder dem Kernel die Nutzung untersagen kann.

Der einfachste Ansatz wäre, dir den nächsten BRACE zu schnappen und zu schauen, ob der beim Upgrade auf Stretch auch Probleme macht (Backup ist vorhanden?). Wenn der nächste reibungslos läuft, dann weißt du, dass mit dem ersten irgendwas nicht stimmt.

Oh, und auf groben Verdacht hin: trenne den betroffenen BRACE mal vom Stromnetz, drück dann (ohne Strom!) den Ein-Schalter, lass ihn noch ein paar Minuten stehen, und schau dann, ob der Fehler unter Jessie immer noch auftritt.
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 17.01.2018 18:07:45

Das Image ist vom 14.12.2017 und danach wurde kein apt-get update gemacht. Da gab es Spectre und Meltdown noch nicht bzw waren noch nicht bekannt.
Also kann der Kernel eigentlich noch nicht aktualisiert worden sein.
Irgenwie meckert das Log ja auch etwas rum vom ACPI Treiber. Was das allerdings sagen soll, ist mir unklar.
Ich habe mehrere 99% gleiche Systeme im Zulauf (anderer Speicher und andere HD). Wenn die da sind, kann ich testen.
Das mit dem Ein-/Ausschalter kann ich gerne probieren.
Ich werde berichten.
Liebe Grüße
Wuppi

NAB
Beiträge: 5502
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von NAB » 17.01.2018 18:46:01

wuppi hat geschrieben: ↑ zum Beitrag ↑
17.01.2018 18:07:45
Also kann der Kernel eigentlich noch nicht aktualisiert worden sein.
Stimmt! Solange er nicht "heimlich" Updates einspielt. Hat er aber nicht, siehe unten.
wuppi hat geschrieben: ↑ zum Beitrag ↑
17.01.2018 18:07:45
Irgenwie meckert das Log ja auch etwas rum vom ACPI Treiber. Was das allerdings sagen soll, ist mir unklar.
Das ist harmlos. Da geht es um irgendeinen Mainboard-Sensor (Temperatur oder Lüfterdrehzahl oder so). Da gibt's die "alten" Treiber und die neuen ACPI-Treiber. Für einen deiner Sensoren gibt es nur einen alten Treiber und der Kernel warnt dich, dass er diesem alten Treiber den Zugriff auf die ACPI-Tabellen untersagt (was man ändern könnte). Das ist nur relevant, wenn du Temperatur und Lüfter überwachen willst und dir dafür ein Wert fehlt. Mysteriöse Abstürze werden so nicht verursacht.

Aber mir fällt erst jetzt auf: dein Jessie sieht auch etwas verbastelt aus.
Das läuft mit einem 4.6er Kernel aus den Backports. Das ist nicht "schlecht" aber den musst du da mal per Hand reingebastelt haben. Und der 4.6er wird seit langem nicht mehr gepflegt, ist also keine Dauerlösung (Meltdown etc.).
Und deine Kernelzeile sieht auch wieder komisch aus: "reboot=bios quiet radeon.audio=1 i915.disable_power_well=0 intel_iommu=on,igfx_off video=HDMI-1:e"
Das ist auch Handarbeit und meiner Meinung nach ziemlich sinnlos. Sind die anderen Rechner genau gleich konfiguriert?
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 18.01.2018 07:47:11

Ja, der Kernel wurde vor einiger Zeit von mir manuell eingespielt, damals experimentell, weil ich Probleme hatte mit einer Komponente, ich glaube, LAN oder WLAN oder Audio, das weiß ich nicht mehr genau. Die verbastelte GRUB-Zeile ist auch darauf zurückzuführen und natürlich mit dem Upgrade zu Stretch erhalten geblieben. Ein Problem des PC besteht in einem sporadisch auftretenden "Watchdog did not stop" error bei einem Reboot, das ich nicht in den Griff bekommen habe und hoffe, durch die von mir in Stretch damals eingebaute Ergänzung der GRUB-Zeile mit nmi_watchdog=0 in den Griff zu bekommen (Ist damit jetzt natürlich wieder raus, da ich das Jessie Backup eingespielt habe).

Ja, die baugleichen Geräte arbeiten mit diesem Image oder einem "Vorgänger", aber alle auf Jessie.

Da die Geräte keine Spiele spielen sondern nur hinter einem Fernseher verbaut eine fest HTML-Seite anzeigen, sind Grafikbeschleunigungen etc. eher unwichtig und Spectre und Meltdown werden aus gleichem Grund hier in diesem nicht wirklich eine Bedrohung.

Ich habe das Thema "Netztrennung" "Ein-/Ausschalter drücken" und nach einigen Minuten wieder hochfahren, gestern abend gemacht. Zumindest heute Morgen lief der Rechner noch. Ich werde das heute über Tag weiter beobachten.

:?: Was wäre denn passiert, wenn sich damit der "grobe Verdacht" bestätigen würde und was müsste ich systematisch tun, um es zu vermeiden?

Nein, ein Backup des upgegradeten Systems zu Stretch habe ich nicht mehr, aber das ist ja nicht so aufwändig wieder nachzuziehen, wenn das vermeintliche Hardware-Problem gelöst ist.
Liebe Grüße
Wuppi

NAB
Beiträge: 5502
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von NAB » 18.01.2018 14:29:53

wuppi hat geschrieben: ↑ zum Beitrag ↑
18.01.2018 07:47:11
Ich habe das Thema "Netztrennung" "Ein-/Ausschalter drücken" und nach einigen Minuten wieder hochfahren, gestern abend gemacht. Zumindest heute Morgen lief der Rechner noch. Ich werde das heute über Tag weiter beobachten.

:?: Was wäre denn passiert, wenn sich damit der "grobe Verdacht" bestätigen würde und was müsste ich systematisch tun, um es zu vermeiden?
Da "Aus" im Leben dieser Geräte anscheinend nicht vorkommt, war mein Verdacht, dass sich noch "irgendwas" aus dem Stretch-Betrieb im Speicher des Gerätes befindet, obwohl längst Jessie läuft. Dieses "irgendwas" könnte eine Firmware sein, oder eine flüchtige UEFI-Einstellung.

Das komische Manöver mit "Stecker ziehen, dann Ein-Schalter drücken" kommt übrigens daher, dass zumindest Desktop-Netzteile über mächtige Kondensatoren verfügen, die das Mainboard noch für Minuten unter Spannung halten können. Beim Einschalten leeren sich diese Kondensatoren.

Der Gedanke ist zu diffus um konkrete Rückschlüsse zu ziehen. Aber man sollte ihn im Hinterkopf behalten. Eine Firmware sollten zumindest deine Realtek-Netzwerkkarte, deine Intel WLan-Karte und deine Intel-Grafik benötigen.

Apropos ... deine Braswell-CPU wurde doch damals mit Skylake-Grafik angepriesen und wenn ich mich recht entsinne, braucht Debian Stretch ab Skylake das Paket "firmware-misc-nonfree" für Intel-Grafikkarten. Ich habe in deinen Logs aber nirgendwo einen Hinweis auf eine fehlende oder geladene Skylake-Firmware gesehen ... vielleicht habe ich es auch überlesen.

Ich würd die Sache jetzt erst mal weiter beobachten, ob es unter Jessie wirklich keine Auffälligkeiten mehr gibt. Deine Probleme treten ja eher zufällig auf.

Hat der Parameter "reboot=bios" irgendeinen Sinn gemacht? Sonst würde ich ihn rausnehmen.
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

wuppi
Beiträge: 40
Registriert: 09.01.2018 08:37:23

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von wuppi » 18.01.2018 14:47:39

Noch läuft der PC seit gestern abend weiter brav unter Jessie, ohne abzustürzen.
Nein, ich hatte den Treiber firmware-misc-nonfree unter Stretch nicht eingespielt, weil ich es schlicht nicht wusste.
Der Parameter "reboot=bios" war der damalige Versuch, das Problem, dass bei einem Reboot vereinzelt, gerade bei längerer Betriebsdauer,
auf den Geräten das System mit einem Fehler
"watchdog did not stop"
hängen blieb, in den Griff zu bekommen. Hatte ich in einem Forum gelesen.
Das war allerdings nur bedingt hilfreich und habe ich unter Stretch versucht, mit dem Grub-Parameter
nmi_watchdog=0
in den Griff zu kriegen.
Ich werde bis morgen abwarten und die Stabilität prüfen.
Wenn es bis dahin stabil läuft, dann werde ich den nächsten Anlauf mit Upgrade zu Stretch machen und dabei das Paket firmware-misc-nonfree mit einspielen.

Oder könnten meine "neuen" GRUB-Parameter, die ich im Zuge des Stretch-Upgrades eingebaut habe, acpi=off apm=off
irgendwie die Ursache für die Abbrüche/Stops sein?
Liebe Grüße
Wuppi

KP97
Beiträge: 1440
Registriert: 01.02.2013 15:07:36

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von KP97 » 18.01.2018 16:12:47

Den Parameter acpi=off sollte man besser nicht verwenden
acpi=off sollte ganz zuletzt und nur zur Installation genutzt werden. Das komplette ACPI wird deaktiviert, d.h. auch wichtige Teile wie z.B. die Lüftersteuerung werden abgeschaltet, und es kann zur Überhitzung und im schlimmsten Fall zu bleibenden Hardwareschäden kommen.
Quelle: https://wiki.ubuntuusers.de/Bootoptionen/
Da kann man dann eher die installierten ACPI-Pakete überprüfen und evtl. deinstallieren.

MSfree
Beiträge: 3475
Registriert: 25.09.2007 19:59:30

Re: PC stürzt mit "XIO: fatal IO errror 11" ab

Beitrag von MSfree » 18.01.2018 16:19:58

KP97 hat geschrieben: ↑ zum Beitrag ↑
18.01.2018 16:12:47
Das komplette ACPI wird deaktiviert, d.h. auch wichtige Teile wie z.B. die Lüftersteuerung werden abgeschaltet, und es kann zur Überhitzung und im schlimmsten Fall zu bleibenden Hardwareschäden kommen.
Abschalten der Lüftersteuerung hat zur Folge, daß die Lüfter mit maximaler Drehzahl betrieben werden. Das einzige, was dann Schaden nehmen kann, ist der Lüfter selbst durch die zu hohen Drehzahlen..

Antworten