Ist mir jetzt innerhalb von 2 Tagen passiert.
Rechner fährt hoch, der Xfce Desktop erscheint und 'FREZZE'.
Reboot über Magic SysRQ. Ansonsten scheint der Rechner stabil.
Ich hänge hier mal den Auszug aus dem system.journal als screenshot an.
gallery/image/2187
Bevor ich jetzt in Aktionismus verfalle, wäre ich über eine Einschätzung dankbar.
Die Nvidia ist 3 Monate alt, also noch unter Garantie.
Gruß KH
Freeze beim Hochfahren 2x
Re: Freeze beim Hochfahren 2x
Laut deinem Screenshot* verabschiedet sich deine GPU da gerade vom Bus. Das könnte temporärer Schluckauf sein, oder der Anfang eines ernsten Problems. Zieh mal die Karte raus und steck sie neu ein!
Falls das Problem bestehen bleibt und du eine andere Karte hast, die mit dem gleichen Treiber funktioniert, könnte sich ein Test mit dieser Karte lohnen.
*) Textausgaben bitte zukünftig als Text, nicht als Bild!
Falls das Problem bestehen bleibt und du eine andere Karte hast, die mit dem gleichen Treiber funktioniert, könnte sich ein Test mit dieser Karte lohnen.
*) Textausgaben bitte zukünftig als Text, nicht als Bild!
Re: Freeze beim Hochfahren 2x
Sorry, hier noch mal in Textform
Karte hab ich noch mal neu gesteckt. Ersatzkarte hab ich leider nicht. Was mich unsicher macht, sind halt die vorlaufenden Meldungen 'AER: Device recovery failed ....'
cu KH
Code: Alles auswählen
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=000031c0/00006000
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: [ 6] BadTLP
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: [ 7] BadDLLP
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: [ 8] Rollover
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: [12] Timeout
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Uncorrected (Non-Fatal) error received: 0000:00:00.0
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Uncorrected (Non-Fatal), type=Transaction Layer, (Receiver ID)
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=00200000/04400000
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: [21] ACSViol (First)
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: broadcast error_detected message
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: AER: Device recovery failed
Jul 14 07:35:08 nostromo kernel: NVRM: GPU at PCI:0000:09:00: GPU-9fde5c24-afc6-3b5d-8574-f62e511ae4f1
Jul 14 07:35:08 nostromo kernel: NVRM: GPU Board Serial Number:
Jul 14 07:35:08 nostromo kernel: NVRM: Xid (PCI:0000:09:00): 79, GPU has fallen off the bus.
Jul 14 07:35:08 nostromo kernel: NVRM: GPU at 00000000:09:00.0 has fallen off the bus.
Jul 14 07:35:08 nostromo kernel: NVRM: GPU is on Board .
Jul 14 07:35:08 nostromo kernel: NVRM: A GPU crash dump has been created. If possible, please run
NVRM: nvidia-bug-report.sh as root to collect this data before
NVRM: the NVIDIA kernel module is unloaded.
Jul 14 07:35:16 nostromo systemd[1]: systemd-fsckd.service: Succeeded.
Jul 14 07:35:17 nostromo systemd-timesyncd[756]: Synchronized to time server for the first time 129.70.132.37:123 (2.debian.pool.ntp.org).
Jul 14 07:35:18 nostromo systemd[1]: systemd-hostnamed.service: Succeeded.
Jul 14 07:35:54 nostromo kernel: sysrq: SysRq : This sysrq operation is disabled.
Jul 14 07:35:57 nostromo kernel: sysrq: SysRq : Emergency Remount R/O
Code: Alles auswählen
und
[code]Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=00001080/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 7] BadDLLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [12] Timeout
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=000011c0/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 6] BadTLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 7] BadDLLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 8] Rollover
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [12] Timeout
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=000011c0/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 6] BadTLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 7] BadDLLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 8] Rollover
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [12] Timeout
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=00001080/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 7] BadDLLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [12] Timeout
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=000031c0/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 6] BadTLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 7] BadDLLP
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [ 8] Rollover
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [12] Timeout
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Uncorrected (Non-Fatal) error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Uncorrected (Non-Fatal), type=Transaction Layer, (Receiver ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: device [1022:1453] error status/mask=00200000/04400000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: [21] ACSViol (First)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: broadcast error_detected message
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Device recovery failed
Jul 15 07:08:13 nostromo kernel: NVRM: GPU at PCI:0000:09:00: GPU-9fde5c24-afc6-3b5d-8574-f62e511ae4f1
Jul 15 07:08:13 nostromo kernel: NVRM: GPU Board Serial Number:
Jul 15 07:08:13 nostromo kernel: NVRM: Xid (PCI:0000:09:00): 79, GPU has fallen off the bus.
Jul 15 07:08:13 nostromo kernel: NVRM: GPU at 00000000:09:00.0 has fallen off the bus.
Karte hab ich noch mal neu gesteckt. Ersatzkarte hab ich leider nicht. Was mich unsicher macht, sind halt die vorlaufenden Meldungen 'AER: Device recovery failed ....'
cu KH
Re: Freeze beim Hochfahren 2x
So, hab mir eine Nvidia 710 besorgt. Für alle Fälle
Gruß KH
Gruß KH
Re: Freeze beim Hochfahren 2x
Zwischenzeitlich ist die Karte noch einige mal beim Hochfahren ausgestiegen. Nur in der Woche schon 2x und heute morgen konnte ich das hier sehen.
gallery/image/2279
So, die Karte ist auf dem Weg zurück zum Händler ....
cu KH
gallery/image/2279
So, die Karte ist auf dem Weg zurück zum Händler ....
cu KH