Hohe CPU Auslastung durch mdadm RAID

Probleme mit Samba, NFS, FTP und Co.
Antworten
przemy
Beiträge: 8
Registriert: 14.02.2018 09:32:11

Hohe CPU Auslastung durch mdadm RAID

Beitrag von przemy » 14.02.2018 09:45:10

Hallo,
Ich habe Debian Stretch auf einem RAID1 array aus 2 SSDs installiert. Nun habe ich das Problem, dass wenn ich den Computer starte mdadm die ganze Zeit mit 100% CPU Auslastung läuft und zusätzlich kommt alle 24h ein weiterer mdadm Prozess dazu, welcher dann auch ununterbrochen mit 100% CPU Auslastung läuft. Wenn ich den Server neustarte, dann geht das ganze von vorne los.
Warum ist dies so und lässt sich dies irgendwie sinnvoll unterbinden?

Hier sind noch ein paar Informationen:

Code: Alles auswählen

cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md123 : inactive super external:/md127/1

md124 : inactive super external:/md127/0

md125 : inactive super external:/md127/1

md126 : inactive super external:/md127/0

md127 : inactive sdc[1](S) sdd[0](S)
      2354608 blocks super external:ddf

md0 : active raid1 sda2[0] sdb2[1]
      249427968 blocks super 1.2 [2/2] [UU]
      bitmap: 1/2 pages [4KB], 65536KB chunk

unused devices: <none>
Das md127 RAID1 ist von einer alten Installation und momentan nicht in Verwendung.

Code: Alles auswählen

ps aux | grep mdadm
root       478 99.9  0.0   8168  2984 ?        Rs   Feb08 8090:27 /sbin/mdadm --monitor --scan
root      3246 99.9  0.0   8168  3112 ?        R    Feb09 7391:16 /sbin/mdadm --monitor --scan --oneshot
root      7257 99.8  0.0   8168  3232 ?        R    Feb10 5951:35 /sbin/mdadm --monitor --scan --oneshot
root     10918 99.8  0.0   8168  3108 ?        R    Feb11 4511:55 /sbin/mdadm --monitor --scan --oneshot
root     14536 99.7  0.0   8168  3244 ?        R    Feb12 3072:17 /sbin/mdadm --monitor --scan --oneshot
root     19186 99.8  0.0   8168  3016 ?        R    Feb13 1635:20 /sbin/mdadm --monitor --scan --oneshot
root     22805 99.8  0.0   8168  3176 ?        R    06:25 198:09 /sbin/mdadm --monitor --scan --oneshot

Code: Alles auswählen

top

top - 09:50:06 up 5 days, 15:05,  1 user,  load average: 7,02, 7,06, 7,05
Tasks: 188 total,   8 running, 180 sleeping,   0 stopped,   0 zombie
%Cpu(s):  7,9 us, 79,7 sy,  0,0 ni, 12,3 id,  0,1 wa,  0,0 hi,  0,0 si,  0,0 st
KiB Mem : 24403228 total,   223820 free,   293392 used, 23886016 buff/cache
KiB Swap:        0 total,        0 free,        0 used. 23716728 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
 3246 root      20   0    8168   3112   1812 R 100,0  0,0   7397:52 mdadm
 7257 root      20   0    8168   3232   1932 R 100,0  0,0   5958:11 mdadm
10918 root      20   0    8168   3108   1808 R 100,0  0,0   4518:31 mdadm
19186 root      20   0    8168   3016   1716 R 100,0  0,0   1641:56 mdadm
  478 root      20   0    8168   2984   1684 R  99,4  0,0   8097:03 mdadm
14536 root      20   0    8168   3244   1940 R  99,4  0,0   3078:53 mdadm
22805 root      20   0    8168   3176   1872 R  98,8  0,0 204:44.96 mdadm
...

rendegast
Beiträge: 14938
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: Hohe CPU Auslastung durch mdadm RAID

Beitrag von rendegast » 14.02.2018 14:34:56

Wenn Du md123 - md127 erstmal in /etc/mdadm/*.conf auskommentierst?
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

przemy
Beiträge: 8
Registriert: 14.02.2018 09:32:11

Re: Hohe CPU Auslastung durch mdadm RAID

Beitrag von przemy » 14.02.2018 14:53:21

Danke, leider ist mir nicht ganz klar welche Zeilen ich raus kommentieren muss.

Code: Alles auswählen

cat /etc/mdadm/mdadm.conf
# mdadm.conf
#
# Please refer to mdadm.conf(5) for information about this file.
#

# by default (built-in), scan all partitions (/proc/partitions) and all
# containers for MD superblocks. alternatively, specify devices to scan, using
# wildcards if desired.
#DEVICE partitions containers

# automatically tag new arrays as belonging to the local system
HOMEHOST <system>

# instruct the monitoring daemon where to send mail alerts
MAILADDR root

# definitions of existing MD arrays
ARRAY metadata=ddf UUID=6d43b700:39743594:0e582805:1120f48d
   spares=2
ARRAY container=6d43b700:39743594:0e582805:1120f48d member=0 UUID=aaec0a36:1f9efee0:28dbca98:87d0a1b7
ARRAY container=6d43b700:39743594:0e582805:1120f48d member=1 UUID=dc852846:21f5876c:f123d34d:de4ead26
ARRAY container=6d43b700:39743594:0e582805:1120f48d member=2 UUID=b695ed5c:5d6713fb:d4f7c0b4:ea77f1a8
ARRAY container=6d43b700:39743594:0e582805:1120f48d member=3 UUID=69a9c290:44c118e1:5d905b85:4737b815

ARRAY /dev/md/1  metadata=1.2 UUID=3944c24e:e4aa6044:85da7888:5822e6bf name=dam:1
ARRAY /dev/md/0  metadata=1.2 UUID=cd016809:67c037a4:44d4f499:9090f68e name=dam:0

# This configuration was auto-generated on Fri, 02 Feb 2018 11:40:12 +0100 by mkconf

Code: Alles auswählen

sudo blkid -o list -w /dev/null

device                                                                           fs_type         label            mount point                                                                          UUID
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
/dev/sdc                                                                                                 ddf_raid_member                              (in use)                                                                                                     LSI     ▒▒)%
/dev/sda1                                                                                                vfat                                         /boot/efi                                                                                                    64C5-15C2
/dev/sda2                                                                                                linux_raid_member     dam:0                  (in use)                                                                                                     cd016809-67c0-37a4-44d4-f4999090f68e
/dev/sdb1                                                                                                vfat                                         (not mounted)                                                                                                64C5-8B1A
/dev/sdb2                                                                                                linux_raid_member     dam:0                  (in use)                                                                                                     cd016809-67c0-37a4-44d4-f4999090f68e
/dev/sdd                                                                                                 ddf_raid_member                              (in use)                                                                                                     LSI     ▒▒)%
/dev/md0                                                                                                 ext4                                         /                                                                                                            5048b0c2-1a4b-455f-ae93-fa477dcabd33

rendegast
Beiträge: 14938
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: Hohe CPU Auslastung durch mdadm RAID

Beitrag von rendegast » 14.02.2018 15:15:23

(mdadm.conf wird eigentlich automatisch erstellt und korrigiert)

ddf scheint zu laufen, der Vermerk in mdstat (md127) ist aber seltsam,
daher vielleicht den Eintrag "ddf" und seine Container-Member (wohl md123 - md126) für einen reboot auskommentieren.

Eintrag /dev/md/1 scheint kein reales Gegenstück zu haben,
daher den mal auskommentieren.

Dann reboot und System beobachten.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

przemy
Beiträge: 8
Registriert: 14.02.2018 09:32:11

Re: Hohe CPU Auslastung durch mdadm RAID

Beitrag von przemy » 14.02.2018 16:24:51

Leider kann ich den Server erst heute Nacht neustarten, aber ich habe schonmal die Zeilen auskommentiert und für md123-md127 den folgenden Befehl ausgeführt:

Code: Alles auswählen

sudo mdadm --stop /dev/md127
Seitdem wird nur noch ein mdadm Prozess ausgeführt und dieser beansprucht die CPU so gut wie gar nicht mehr. Vielen Dank für die Hilfe!

Auf dem Server war mal davor ein Fake RAID mit Win Server 2012 in Betrieb, die Platten sda,sdb sind aber neu, nur die Platten sdc und sdd waren davor schon angeschlossen, jedoch habe ich vor der Debian Installation das Mainboard RAID im BIOS abgeschalten (auf AHCI umgeschalten) und auf denPlatten sdc,sdd ebenfalls ein Software Raid1 während der Installation eingerichtet. Kann es nun trotzdem sein, dass die Einträge md123-md127 noch von dem früheren fake RAID kommen, da laut Internet ddf für fake RAIDs zustädnig ist?

NAB
Beiträge: 5501
Registriert: 06.03.2011 16:02:23
Lizenz eigener Beiträge: MIT Lizenz

Re: Hohe CPU Auslastung durch mdadm RAID

Beitrag von NAB » 14.02.2018 17:24:49

Also auf sdc und sdd hast du eindeutig kein normales mdadm Raid sondern eben dieses DDF Dingens. Also ... genauer gesagt ... aus sdc und sdd hat dir mdadm ein DDF Raid zusammengesetzt und das läuft "inactive".

Wenn ich mir dann deine mdadm.conf angucke ...
Da setzt du "ARRAY metadata=ddf" zusammen, das wird dann wohl md127 aus sdc und sdd sein.
Da setzt du auch vier Container zusammen, 0 bis 3, die liegen im DDF Array. Das sind dann wohl md123 bis md126, auf sdc und sdd.

Ganz unten setzt du md1 und md0 zusammen.
md0 läuft und belegt sda2 und sdb2.
Woraus soll denn deiner Meinung nach md1 bestehen?

Ja, DDF Header und mdadm 1.2 Superblocks können koexistieren. Die ersten liegen ganz am Ende der Platte:
https://www.snia.org/sites/default/file ... n_v2.0.pdf
die zweiten ganz am Anfang:
https://raid.wiki.kernel.org/index.php/ ... ck_formats
Never change a broken system. It could be worse afterwards.

"No computer system can be absolutely secure." Intel Document Number: 336983-001

przemy
Beiträge: 8
Registriert: 14.02.2018 09:32:11

Re: Hohe CPU Auslastung durch mdadm RAID

Beitrag von przemy » 14.02.2018 17:55:18

Die mdadm.conf wurde automatisch erstellt, ich habe nichts an ihr geändert.

przemy
Beiträge: 8
Registriert: 14.02.2018 09:32:11

Re: Hohe CPU Auslastung durch mdadm RAID

Beitrag von przemy » 25.05.2018 13:44:47

Leider habe ich das Problem mit der hohen CPU Auslastung immer noch nach einem Neustart, erst wenn ich

Code: Alles auswählen

mdadm --stop /dev/md123
für md123-md127 ausführe, ist alles wieder in Ordnung.
Lässt sich das ganze auch irgendwie dauerhaft beheben?
Meine mdadm.conf sieht momentan so aus:

Code: Alles auswählen

cat /etc/mdadm/mdadm.conf
# mdadm.conf
#
# Please refer to mdadm.conf(5) for information about this file.
#

# by default (built-in), scan all partitions (/proc/partitions) and all
# containers for MD superblocks. alternatively, specify devices to scan, using
# wildcards if desired.
#DEVICE partitions containers

# automatically tag new arrays as belonging to the local system
HOMEHOST <system>

# instruct the monitoring daemon where to send mail alerts
MAILADDR root

# definitions of existing MD arrays
# ARRAY metadata=ddf UUID=6d43b700:39743594:0e582805:1120f48d
#   spares=2
# ARRAY container=6d43b700:39743594:0e582805:1120f48d member=0 UUID=aaec0a36:1f9efee0:28dbca98:87d0a1b7
# ARRAY container=6d43b700:39743594:0e582805:1120f48d member=1 UUID=dc852846:21f5876c:f123d34d:de4ead26
# ARRAY container=6d43b700:39743594:0e582805:1120f48d member=2 UUID=b695ed5c:5d6713fb:d4f7c0b4:ea77f1a8
# ARRAY container=6d43b700:39743594:0e582805:1120f48d member=3 UUID=69a9c290:44c118e1:5d905b85:4737b815

# ARRAY /dev/md/1  metadata=1.2 UUID=3944c24e:e4aa6044:85da7888:5822e6bf name=dam:1
ARRAY /dev/md/0  metadata=1.2 UUID=cd016809:67c037a4:44d4f499:9090f68e name=dam:0

# This configuration was auto-generated on Fri, 02 Feb 2018 11:40:12 +0100 by mkconf
Nach einem Neustart habe ich immer:

Code: Alles auswählen

cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md123 : inactive super external:/md127/1

md124 : inactive super external:/md127/0

md125 : inactive super external:/md127/1

md126 : inactive super external:/md127/0

md127 : inactive sdc[1](S) sdd[0](S)
      2354608 blocks super external:ddf

md0 : active raid1 sda2[0] sdb2[1]
      249427968 blocks super 1.2 [2/2] [UU]
      bitmap: 1/2 pages [4KB], 65536KB chunk

unused devices: <none>

Antworten