Freeze beim Hochfahren 2x

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
Benutzeravatar
kalle123
Beiträge: 2710
Registriert: 28.03.2015 12:27:47
Wohnort: Mönchengladbach

Freeze beim Hochfahren 2x

Beitrag von kalle123 » 15.07.2019 08:43:10

Ist mir jetzt innerhalb von 2 Tagen passiert.
Rechner fährt hoch, der Xfce Desktop erscheint und 'FREZZE'.
Reboot über Magic SysRQ. Ansonsten scheint der Rechner stabil.

Ich hänge hier mal den Auszug aus dem system.journal als screenshot an.

gallery/image/2187

Bevor ich jetzt in Aktionismus verfalle, wäre ich über eine Einschätzung dankbar.

Die Nvidia ist 3 Monate alt, also noch unter Garantie.

Gruß KH

Benutzeravatar
hikaru
Moderator
Beiträge: 13585
Registriert: 09.04.2008 12:48:59

Re: Freeze beim Hochfahren 2x

Beitrag von hikaru » 15.07.2019 08:56:42

Laut deinem Screenshot* verabschiedet sich deine GPU da gerade vom Bus. Das könnte temporärer Schluckauf sein, oder der Anfang eines ernsten Problems. Zieh mal die Karte raus und steck sie neu ein!
Falls das Problem bestehen bleibt und du eine andere Karte hast, die mit dem gleichen Treiber funktioniert, könnte sich ein Test mit dieser Karte lohnen.

*) Textausgaben bitte zukünftig als Text, nicht als Bild!

Benutzeravatar
kalle123
Beiträge: 2710
Registriert: 28.03.2015 12:27:47
Wohnort: Mönchengladbach

Re: Freeze beim Hochfahren 2x

Beitrag von kalle123 » 15.07.2019 11:08:19

Sorry, hier noch mal in Textform

Code: Alles auswählen

Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=000031c0/00006000
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1:    [ 6] BadTLP                
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1:    [ 7] BadDLLP               
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1:    [ 8] Rollover              
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1:    [12] Timeout               
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Uncorrected (Non-Fatal) error received: 0000:00:00.0
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Uncorrected (Non-Fatal), type=Transaction Layer, (Receiver ID)
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=00200000/04400000
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1:    [21] ACSViol                (First)
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: broadcast error_detected message
Jul 14 07:35:07 nostromo kernel: pcieport 0000:00:03.1: AER: Device recovery failed
Jul 14 07:35:08 nostromo kernel: NVRM: GPU at PCI:0000:09:00: GPU-9fde5c24-afc6-3b5d-8574-f62e511ae4f1
Jul 14 07:35:08 nostromo kernel: NVRM: GPU Board Serial Number: 
Jul 14 07:35:08 nostromo kernel: NVRM: Xid (PCI:0000:09:00): 79, GPU has fallen off the bus.
Jul 14 07:35:08 nostromo kernel: NVRM: GPU at 00000000:09:00.0 has fallen off the bus.
Jul 14 07:35:08 nostromo kernel: NVRM: GPU is on Board .
Jul 14 07:35:08 nostromo kernel: NVRM: A GPU crash dump has been created. If possible, please run
                                 NVRM: nvidia-bug-report.sh as root to collect this data before
                                 NVRM: the NVIDIA kernel module is unloaded.
Jul 14 07:35:16 nostromo systemd[1]: systemd-fsckd.service: Succeeded.
Jul 14 07:35:17 nostromo systemd-timesyncd[756]: Synchronized to time server for the first time 129.70.132.37:123 (2.debian.pool.ntp.org).
Jul 14 07:35:18 nostromo systemd[1]: systemd-hostnamed.service: Succeeded.
Jul 14 07:35:54 nostromo kernel: sysrq: SysRq : This sysrq operation is disabled.
Jul 14 07:35:57 nostromo kernel: sysrq: SysRq : Emergency Remount R/O

Code: Alles auswählen

und 

[code]Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=00001080/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 7] BadDLLP               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [12] Timeout               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=000011c0/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 6] BadTLP                
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 7] BadDLLP               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 8] Rollover              
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [12] Timeout               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=000011c0/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 6] BadTLP                
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 7] BadDLLP               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 8] Rollover              
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [12] Timeout               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=00001080/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 7] BadDLLP               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [12] Timeout               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Multiple Corrected error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, (Transmitter ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=000031c0/00006000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 6] BadTLP                
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 7] BadDLLP               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [ 8] Rollover              
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [12] Timeout               
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Uncorrected (Non-Fatal) error received: 0000:00:00.0
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: PCIe Bus Error: severity=Uncorrected (Non-Fatal), type=Transaction Layer, (Receiver ID)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:   device [1022:1453] error status/mask=00200000/04400000
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1:    [21] ACSViol                (First)
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: broadcast error_detected message
Jul 15 07:08:12 nostromo kernel: pcieport 0000:00:03.1: AER: Device recovery failed
Jul 15 07:08:13 nostromo kernel: NVRM: GPU at PCI:0000:09:00: GPU-9fde5c24-afc6-3b5d-8574-f62e511ae4f1
Jul 15 07:08:13 nostromo kernel: NVRM: GPU Board Serial Number: 
Jul 15 07:08:13 nostromo kernel: NVRM: Xid (PCI:0000:09:00): 79, GPU has fallen off the bus.
Jul 15 07:08:13 nostromo kernel: NVRM: GPU at 00000000:09:00.0 has fallen off the bus.

Karte hab ich noch mal neu gesteckt. Ersatzkarte hab ich leider nicht. Was mich unsicher macht, sind halt die vorlaufenden Meldungen 'AER: Device recovery failed ....'

cu KH

Benutzeravatar
kalle123
Beiträge: 2710
Registriert: 28.03.2015 12:27:47
Wohnort: Mönchengladbach

Re: Freeze beim Hochfahren 2x

Beitrag von kalle123 » 15.07.2019 16:26:03

So, hab mir eine Nvidia 710 besorgt. Für alle Fälle :wink:

Gruß KH

Benutzeravatar
kalle123
Beiträge: 2710
Registriert: 28.03.2015 12:27:47
Wohnort: Mönchengladbach

Re: Freeze beim Hochfahren 2x

Beitrag von kalle123 » 06.09.2019 12:56:51

Zwischenzeitlich ist die Karte noch einige mal beim Hochfahren ausgestiegen. Nur in der Woche schon 2x und heute morgen konnte ich das hier sehen. :cry:

gallery/image/2279

So, die Karte ist auf dem Weg zurück zum Händler ....

cu KH

Antworten