Bildschirm freeze, amdgpu der Übeltäter?

KDE, Gnome, Windowmanager, X11, Grafiktreiber und alles was dazu notwendig ist. Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 09.04.2018 22:42:23

Hallo,

ich schreibe gerade von einem HP Notebook mit einem Dualcore A6 Prozessor, das eine integrierte Radeon R4 GPU hat. In Xorg.0.log wird "radeon" und "amdgpu" als Treiber genannt. Nun ist mir bei Youtube-schauen der Bildschirm eingefroren, ich konnte auch nicht mehr in die Konsole. Beim starten kommt eine ganze Batterie an Fehlermeldungen im Zusammenhang mit "amdgpu", aber eine auch mit "CPU 0":

Code: Alles auswählen

lspci:
00:01.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Device 98e4 (rev ea

Xorg.0.log (Ausschnitt)
[    17.775]    X.Org ANSI C Emulation: 0.4
[    17.775]    X.Org Video Driver: 23.0
[    17.775]    X.Org XInput driver : 24.1
[    17.776]    X.Org Server Extension : 10.0
[    17.777] (++) using VT number 7

[    17.777] (II) systemd-logind: logind integration requires -keeptty and -keeptty was not provided, disabling logind integration
[    17.778] (II) xfree86: Adding drm device (/dev/dri/card0)
[    17.781] (--) PCI:*(0:0:1:0) 1002:98e4:103c:8345 rev 234, Mem @ 0xe8000000/134217728, 0xf0000000/8388608, 0xf0c00000/262144, I/O @ 0x00004000/256, BIOS @$
[    17.782] (II) LoadModule: "glx"
[    17.797] (II) Loading /usr/lib/xorg/modules/extensions/libglx.so
[    17.963] (II) Module glx: vendor="X.Org Foundation"
[    17.963]    compiled for 1.19.2, module version = 1.0.0
[    17.963]    ABI class: X.Org Server Extension, version 10.0
[    17.963] (II) Applying OutputClass "AMDgpu" to /dev/dri/card0
[    17.963]    loading driver: amdgpu
[    17.963] (==) Matched amdgpu as autoconfigured driver 0
[    17.963] (==) Matched ati as autoconfigured driver 1
[    17.963] (==) Matched ati as autoconfigured driver 2
[    17.963] (==) Matched modesetting as autoconfigured driver 3
[    17.963] (==) Matched fbdev as autoconfigured driver 4
[    17.963] (==) Matched vesa as autoconfigured driver 5
[    17.963] (==) Assigned the driver to the xf86ConfigLayout
[    17.963] (II) LoadModule: "amdgpu"
[    17.985] (II) Loading /usr/lib/xorg/modules/drivers/amdgpu_drv.so
[    18.099] (II) Module amdgpu: vendor="X.Org Foundation"
[    18.099]    compiled for 1.19.0, module version = 1.2.0

Code: Alles auswählen

nano /var/log/messages:
Apr  9 22:33:10 Debian0022 kernel: [ 1403.401225] pp_dpm_get_temperature was not implemented.
Letztere Zeile ist die letzte Meldung, sie taucht mindestens 50 mal übereinander auf. Könnte sich der CPU überhitzt haben? Die Fehlermeldungen zur amdgpu habe ich leider in /var/log/messages nicht wiedergefunden.

Edit: hier noch weitere Ausschnitte aus /var/log/messages:

Code: Alles auswählen

amdgpu 0000:00:01.0: Direct firmware load for amdgpu/stoney_pfp.bin failed with error -2
amdgpu: probe of 0000:00:01.0 failed with error -2
Hier ein Ausschnitt zur Zeit des Absturzes:

Code: Alles auswählen

IO_PAGE_FAULT device=00:11.0 domain=0x0007 address=0x00000000fff80000 flags=0x0050]
 WARNING: CPU: 0 PID: 0 at /build/linux-YDazDa/linux-4.9.82/drivers/iommu/amd_iommu.c:1250 __domain_flush_pa$
Modules linked in: bnep rc_pinnacle_pctv_hd em28xx_rc rc_core si2157 si2168 i2c_mux em28xx_dvb dvb_core snd$
ecb mbcache sr_mod cdrom sd_mod crc32c_intel aesni_intel aes_x86_64 glue_helper lrw gf128mul ablk_helper c$
CPU: 0 PID: 0 Comm: swapper/0 Not tainted 4.9.0-6-amd64 #1 Debian 4.9.82-1+deb9u3
Hardware name: HP HP Laptop 17-ak0xx/8345, BIOS F.06 11/02/2017

NAB
Beiträge: 5501
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von NAB » 09.04.2018 23:25:48

Die erste Meldung in deinem Edit besagt, dass deine Grafik die Firmware nicht laden kann. Das könnte daran liegen, dass sie nicht installiert ist. Das wäre dieses Paket:
https://packages.debian.org/stretch/fir ... d-graphics

Aus der zweiten Meldung werde ich nicht schlau. Da stürzt der IOMMU-Treiber ab. Das könnte ein merkwürdiger Folgefehler sein. Die Funktion heißt bei AMD "AMD-Vi". Machst du irgendwas mit Virtuellen Maschinen? Sonst kannst du es vielleicht im BIOS abschalten.
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 10.04.2018 04:25:37

Ich habe die Virtualisierung tatsächlich im Bios angeschaltet, aber noch keine Virtuelle Maschine eingerichtet. Ich habe es jetzt wieder deaktiviert, mal sehen wie es läuft. Danke für den Tipp. Die amdgpu-firmware habe ich bereits installiert gehabt.

NAB
Beiträge: 5501
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von NAB » 10.04.2018 06:28:31

rwkraemer hat geschrieben: ↑ zum Beitrag ↑
10.04.2018 04:25:37
Ich habe die Virtualisierung tatsächlich im Bios angeschaltet, aber noch keine Virtuelle Maschine eingerichtet. Ich habe es jetzt wieder deaktiviert, mal sehen wie es läuft. Danke für den Tipp.
Falls dein BIOS schlau genug ist:
Die Funktion zum Virtualisieren nennt sich "AMD V" - die brauchst du.
Was da fehlschlägt ist "AMD Vi". Wenn du die getrennt abschalten kannst, dann klappt's auch mit der VM.
rwkraemer hat geschrieben: ↑ zum Beitrag ↑
10.04.2018 04:25:37
Die amdgpu-firmware habe ich bereits installiert gehabt.
Ja ... und ist die Datei da?

Code: Alles auswählen

ls -la /lib/firmware/amdgpu/stoney_pfp.bin
Falls ja, müsstest du mal in der Ausgabe von "dmesg" wühlen, ob du rund um das
Direct firmware load for amdgpu/stoney_pfp.bin failed with error -2
eine Erklärung findest, warum es nicht geht (falsche Version, Festplattenfehler, Grafikkarte wehrt sich, etc).
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 10.04.2018 18:00:46

Die firmware scheint installiert zu sein. Allerdings wurde bei dem Absturz das root-Dateisystem beschädigt, ich musste fsck manuell laufen lassen, und ziemlich vielen Änderungen zustimmen. Dummerweise habe ich nicht geschaut, ob die firmware-Fehlermeldung vor oder nach dem Absturz kam. Hier die Ausgabe der firmware:

Code: Alles auswählen

ls -la /lib/firmware/amdgpu/stoney_pfp.bin
-rw-r--r-- 1 root root 17024 Jun  6  2017 /lib/firmware/amdgpu/stoney_pfp.bin
Ich werde noch suchen, allerdings ist die Ausgabe sehr groß.

Edit: Hier dmesg-Meldungen:

Code: Alles auswählen

amdgpu 0000:00:01.0: firmware: direct-loading firmware amdgpu/stoney_pfp.bin
[    6.752471] amdgpu 0000:00:01.0: firmware: direct-loading firmware amdgpu/stoney_me.bin
[    6.752672] amdgpu 0000:00:01.0: firmware: direct-loading firmware amdgpu/stoney_ce.bin
[    6.752871] amdgpu 0000:00:01.0: firmware: direct-loading firmware amdgpu/stoney_rlc.bin
[    6.771639] amdgpu 0000:00:01.0: firmware: direct-loading firmware amdgpu/stoney_mec.bin

[   10.070171] [drm:amdgpu_vce_ring_test_ib [amdgpu]] *ERROR* amdgpu: IB test timed out.
[   10.070301] [drm:amdgpu_ib_ring_tests [amdgpu]] *ERROR* amdgpu: failed testing IB on ring 11 (-110).
[   10.070413] [drm:amdgpu_device_init [amdgpu]] *ERROR* ib ring test failed (-110).

[   56.516191] pp_dpm_get_temperature was not implemented.
[   56.517097] pp_dpm_get_temperature was not implemented.
Letzeres füllt fast die gesamte Ausgabe von dmesg, so dass ich auch nicht mit "shift" und "Bild hoch" nicht zum Anfang komme.
Zuletzt geändert von rwkraemer am 10.04.2018 18:13:42, insgesamt 1-mal geändert.

NAB
Beiträge: 5501
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von NAB » 10.04.2018 18:11:55

Die Größe der Datei ist die gleiche wie bei mir.

Code: Alles auswählen

$ md5sum /lib/firmware/amdgpu/stoney_pfp.bin
8278317f87f365f0a32ceececb690d32  /lib/firmware/amdgpu/stoney_pfp.bin
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 10.04.2018 18:14:52

Hallo NAB,

mein editieren hat sich mit deiner Antwort überschnitten.

NAB
Beiträge: 5501
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von NAB » 10.04.2018 18:37:35

Jetzt sehe ich kein
Direct firmware load for amdgpu/stoney_pfp.bin failed with error -2
mehr. Er scheint die Firmware auf einmal zu laden.

Zu dem
[drm:amdgpu_vce_ring_test_ib [amdgpu]] *ERROR* amdgpu: IB test timed out.
spuckt Google mir nichts Eindeutiges aus. Zig Treffer aus den letzten Jahren, alle klingen eher harmlos. Teils soll neuere Firmware helfen (gäbe es in den Backports), teils ein neuerer Kernel. Ob man sich über die Meldung wirklich Gedanken machen muss, weiß ich nicht. Läuft die Grafik denn sonst rund?
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 10.04.2018 18:52:06

Die Grafik läuft seit dem Freeze gestern ohne Probleme. Glxgears spuckt folgendes aus:

Code: Alles auswählen

316 frames in 5.0 seconds = 63.074 FPS
301 frames in 5.0 seconds = 60.016 FPS
301 frames in 5.0 seconds = 60.016 FPS
Videos habe ich seitdem Freeze glaube ich nur eines angesehen. Die CPU-Last ist beim Video anschauen (html5) meist bei 50 %, manchmal bei 100 %.

rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 10.04.2018 19:45:10

Ich habe etwas wichtiges vergessen. Ich benutze den Vivaldi-Browser, habe aber zum Video-schauen kein Flash installiert und benutze html5. Da können aber nicht alle Videos abgespielt werden, so dass ich mit Hilfe eines Skriptes libffmpeg.so (aus dem Ubuntu Paket chromium-codecs-ffmpeg-extra extrahiert) installiert habe. Als ich jetzt die Youtube-Seite aufgerufen habe, ohne Videos zu sehen, ist die Maus eingeforen, alles andere ging. Ich bin dann auf die Konsole gewechselt (das ging diesmal) und es kamen reihenweise Fehlermeldungen die offenbar wieder mit Virtualisierung zu tun hatten (obwohl ich die Funtkion im Bios abgestellt habe). Mit "strg", "alt" und "entf" konnte ich dann neustarten. Ich habe jetzt den Browsercache geleert.

NAB
Beiträge: 5501
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von NAB » 10.04.2018 20:52:38

Wenn ein Laptop längere Zeit mit 100% CPU-Auslastung läuft, dann könnte er durchaus Hitzeprobleme entwickeln. Gibt es Hinweise darauf, dass der Lüfter noch lebt?

Betreffen diese "Virtualisierungs"-Fehler immer "device=00:11.0", wie in deinem ersten Posting? Welches Gerät mag das sein? ("lspci" könnte helfen)

(Bei vivaldi und Ubuntu-Hacks muss ich leider passen, das sollte aber mMn nicht den ganzen Rechner in den Abgrund ziehen)
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 10.04.2018 21:39:40

Hallo,

ich habe jetzt alle versteckten Ordner im home-Benutzerverzeichnis gelöscht und Debian-Buster frisch installiert. Falls das Problem noch einmal auftaucht, melde ich mich. Das Notebook (HP 17-ak062ng) scheint eine merkwürdige Mischung aus alten und neuen Komponenten zu haben. Ich möchte mich für die Hilfe bedanken.

Edit: Bei Buster ist der Nummer der Sata-Controller zugeordnet:

Code: Alles auswählen

00:11.0 SATA controller: Advanced Micro Devices, Inc. [AMD] FCH SATA Controller [AHCI mode] (rev 4b)
Soll das Thema geschlossen werden? Ich kann ja für Buster einen neuen Thread aufmachen, falls das Problem weiterbesteht.

NAB
Beiträge: 5501
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von NAB » 10.04.2018 22:06:11

Fehlermeldungen des Sata-Controllers, Abstürze, korruptes Dateisystem ... ich würd "dmesg --follow" misstrauisch im Auge behalten ...
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

rwkraemer
Beiträge: 398
Registriert: 14.08.2005 23:23:40

Re: Bildschirm freeze, amdgpu der Übeltäter?

Beitrag von rwkraemer » 10.04.2018 22:11:09

Ich hatte vorher ja Stretch installiert. Ich dachte, es würde laufen, weil bei der Hardware des Notebooks eine A6 CPU und eine Radeon R4 Grafikkarte angegeben war. Aber da habe ich mich wohl getäuscht.

Edit: Ich habe ein paar Videos angesehen und im Netz gesurft, aber bis jetzt ist nichts passiert. Die CPU-Last kommt auch nur noch selten an die 100%.
Edit2: dmesg sieht jetzt auch sehr viel besser aus, ich kann mir jetzt auch die ganze Ausgabe ansehen.

Antworten