mit Schrecken habe ich gerade festgestellt, dass dmesg voll mit diesen Meldungen ist und mit voll meine wirklich voll, der Kernel-Ringpuffer fängt mit so einer Meldung an und hört mit so einer Meldung auf, unterbrochen nur von einer cron-Meldung:
Code: Alles auswählen
[ 304.262847] pcieport 0000:00:1d.0: AER: Corrected error received: 0000:03:00.0
[ 304.262853] nvme 0000:03:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[ 304.262855] nvme 0000:03:00.0: device [144d:a808] error status/mask=00000001/0000e000
[ 304.262856] nvme 0000:03:00.0: [ 0] RxErr
...
[ 308.813047] pcieport 0000:00:1d.0: AER: Multiple Corrected error received: 0000:03:00.0
[ 308.813111] nvme 0000:03:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[ 308.813113] nvme 0000:03:00.0: device [144d:a808] error status/mask=00000001/0000e000
[ 308.813114] nvme 0000:03:00.0: [ 0] RxErr
Ungefähr zu der Zeit, habe ich mit rsync einige Daten synchronisiert ohne dass rsync einen Fehler gemeldet hätte. Auch von Dateisystemfehlern oä ist nichts im Log zu finden.
Das Dateisystem ist übrigens btrfs und ich habe auch schon btrfs scrub ausgeführt, ohne jeden Fehler.
Code: Alles auswählen
Scrub device /dev/nvme0n1p2 (id 1) done
Scrub started: Tue Mar 30 14:49:20 2021
Status: finished
Duration: 0:02:13
Total to scrub: 406.01GiB
Rate: 3.04GiB/s
Error summary: no errors found
Damit ich nichts übersehe, habe ich auch
Code: Alles auswählen
journalctl -b0 | grep PCIe | grep -v "severity=Corrected"
Code: Alles auswählen
# nvme smart-log /dev/nvme0n1
Smart Log for NVME device:nvme0n1 namespace-id:ffffffff
critical_warning : 0
temperature : 45 C
available_spare : 100%
available_spare_threshold : 10%
percentage_used : 0%
endurance group critical warning summary: 0
data_units_read : 3441166
data_units_written : 1613333
host_read_commands : 4657739
host_write_commands : 2257034
controller_busy_time : 37
power_cycles : 126
power_on_hours : 6
unsafe_shutdowns : 14
media_errors : 0
num_err_log_entries : 0
Warning Temperature Time : 0
Critical Composite Temperature Time : 0
Temperature Sensor 1 : 45 C
Temperature Sensor 2 : 44 C
Thermal Management T1 Trans Count : 0
Thermal Management T2 Trans Count : 0
Thermal Management T1 Total Time : 0
Thermal Management T2 Total Time : 0