mdadm clean, resyncing

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
tuxedo
Beiträge: 58
Registriert: 26.11.2014 17:03:45
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: CH

mdadm clean, resyncing

Beitrag von tuxedo » 05.08.2018 10:02:00

Hallo zusammen

Ausgangslage ist ein System mit Debian buster/sid, Kernel

Code: Alles auswählen

Linux $HOSTNAME 4.17.0-1-amd64 #1 SMP Debian 4.17.8-1 (2018-07-20) x86_64 GNU/Linux
Das System ist mit drei Platten ausgestattet, alle über SATA Port angeschlossen:
  • sda: SSD (System)
  • sdb/sdc: klassische HDD, 2TB (Daten, bzw. /home/)
Zustand gemäss SMART von allen Platten i.O, auch keine Hänger im Betrieb zu erkennen.

Über sdb1/sdc1 ist ein RAID1 angelegt.

Ab und an (genauers bin ich noch am tracken, vermutlich aber nach einem Reboot) wechselt das RAID in den Zustand

Code: Alles auswählen

State : clean, resyncing 
Ich habe die Vermutung dass folgender syslog Eintrag damit zusammenhängen könnte:

Code: Alles auswählen

Jul 23 17:35:28 $HOSTNAME kernel: [    1.549878] md/raid1:md0: not clean -- starting background reconstruction
Jul 23 17:35:28 $HOSTNAME kernel: [    1.549879] md/raid1:md0: active with 2 out of 2 mirrors
Jul 23 17:35:28 $HOSTNAME kernel: [    1.549979] md0: bitmap file is out of date (49886 < 49887) -- forcing full recovery
Jul 23 17:35:28 $HOSTNAME kernel: [    1.549995] md0: bitmap file is out of date, doing full recovery
Was ich bereits versucht habe:
  • SATA Ports neu gesteckt
  • Komplettes RAID neu gebaut, neu jetzt mit Version 1.2, das alte war noch 0.x
Nach dem Rebuild ist wieder alles i.O, das Raid läuft und macht auch keine Macken bis halt zum nächsten Vorfall.

Folgende Vermutungen habe ich, aber weiss nicht wo ich ansetzten soll:
  • Was periodisches was diesen resync anstösst, nur was triggert den? Ich hatte erst checkarray (via) cron in Verdacht, aber wenn der läuft ist der Status auf "Check Status : xx% complete" und nicht auf resyncing und es gibt entsprechende Logeinträge die ich aber nirgends finde in der Vergangenheit ($HOSTNAME kernel: [ 4562.911095] md: data-check of RAID array md0)
  • Probleme beim Herunterfahren dass das RAID dann zu diesem "bitmap file is out of date" bringt. Nur wie grenzt man sowas ein?
Das Problem verfolgt mich nun schon seit einiger Zeit, leider brachten Suchen im Internet keine Ergebnisse was ähnliche Fälle betrifft.

Gerne nehme ich Ideen und Anregungen entgegen :)

Vielen Dank & Grüsse

tuxedo
Beiträge: 58
Registriert: 26.11.2014 17:03:45
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: CH

Re: mdadm clean, resyncing

Beitrag von tuxedo » 10.08.2018 10:02:44

Hallo zusammen

Heute war es mal wieder soweit:

Code: Alles auswählen

$ cat /proc/mdstat

md0 : active raid1 sdb1[0] sdc1[2]
      1953382464 blocks super 1.2 [2/2] [UU]
      [>....................]  resync =  0.4% (8135104/1953382464) finish=248.6min speed=130394K/sec
      bitmap: 15/15 pages [60KB], 65536KB chunk

Code: Alles auswählen

# /sbin/mdadm -D /dev/md0

/dev/md0:
           Version : 1.2
     Creation Time : Wed May 16 00:35:33 2018
        Raid Level : raid1
        Array Size : 1953382464 (1862.89 GiB 2000.26 GB)
     Used Dev Size : 1953382464 (1862.89 GiB 2000.26 GB)
      Raid Devices : 2
     Total Devices : 2
       Persistence : Superblock is persistent

     Intent Bitmap : Internal

       Update Time : Fri Aug 10 10:00:47 2018
             State : clean, resyncing 
    Active Devices : 2
   Working Devices : 2
    Failed Devices : 0
     Spare Devices : 0

Consistency Policy : bitmap

     Resync Status : 2% complete

              Name : $HOSTNAME:0  (local to host $HOSTNAME)
              UUID : xyzxyzxy:xyzxyzxy:xyzxyzxy:xyzxyzxy
            Events : 65777

    Number   Major   Minor   RaidDevice State
       0       8       17        0      active sync   /dev/sdb1
       2       8       33        1      active sync   /dev/sdc1
Gestern Abend noch am Rechner gearbeitet und normal heruntergefahren.
Im syslog von heute steht wieder:

Code: Alles auswählen

Aug 10 09:53:54 $HOSTNAME kernel: [    1.588649] md0: bitmap file is out of date (65496 < 65497) -- forcing full recovery
Aug 10 09:53:54 $HOSTNAME kernel: [    1.588690] md0: bitmap file is out of date, doing full recovery
Ich bin ratlos :roll:

Danke & Grüsse

Antworten