U.A. auch mein Anliegen ( Vorgeschichte ):
Moin - "Never touch a running system" geht irgendwann nicht mehr, spätestens wenn die Software zu alt oder die Hardware nicht performant genug ist. Bei mir fing es mit der Software an, da Debian 10 bald keinen Support mehr hat und ich somit Debian 12 auf meinem HP Microserver Gen 8 installiert habe. Damit ging der Horror los !
Nach der Installation von Debian 12 bekam ich mir noch nichts sagende Fehlermeldungen, BIOS defekt, DMAR / DMA Fehler etc. Das Schlimmste war allerdings, das keine 64 Bit VM mehr lief und somit alle WEB/LAN Dienste (Webseiten/VDR etc) nicht mehr aktiv waren. Das war Hölle 1 ... (viewtopic.php?p=1335722#p1335722) - nach knapp 10 Tagen habe ich dann den Fehler gefunden, der mir bis heute suspekt ist. Bei der Installation von Debian 12 wurde im Server BIOS VT-d/VT-X deaktiviert. Wie auch immer, ob durch Autoconfig vom BIOS, Heinzelmännchen oder über Debian selbst ( wie auch immer das funktionieren sollte ). Jedenfalls war VT-D/X im Bios als aktiv eingestellt, im OS wurde das Flag ( cat /proc/cpuinfo ) auch angezeigt (vmd) und unter Virtualbox kam auch keine Fehlermeldung, dass VT-D/X nicht aktiv ist. Nachdem ich dann einfach mal JEDE Bioskonfiguration ausprobiert habe - u.a alle Multifunktionen abgestellt ( VT-D/X, Hyperthreadding etc ) und wieder angestellt hatte - liefen dann endlich die VMs wieder und alles sah gut aus - dachte ich ....
Ein paar Tage später hing der Server und es half nur noch ein Powerreset über ILO. Das ging ziemlich nach hinten los => 2 TB weg aufgrund ext4 Korrekturen. Damit war die Überzeugung mit dem Gen8 Server sicher vor Datenverlust zu sein Geschichte ( das System lief seit 10 Jahren ohne Probleme und Datenverlust ).
Danach habe ich dann BIOS und ILO aktualisiert und bin damit dann gleich eine weitere Etage in die IT-Hölle hinabgestiegen Jetzt hieß es lt. ILO Health der NanD Speicher sei defekt und sollte formatiert werden. Nach 5-6 Verschiedenen Ansätzen habe ich es dann endlich hinbekommen den NanD zu formatieren. Jetzt hieß es dann im ILO das BIOS sei defekt und ich habe zwischen aktuellen BIOS und altem Backup BIOS gewechselt - ohne Erfolg. Ein BIOS Reset hat dann scheinbar dazu geführt das nun endlich - zumindest bei ILO Ruhe ist - unter Debian 12 wird nach wie vor die Warnung eines defekten BIOS angezeigt:
Code: Alles auswählen
[0.071122] DMAR: [Firmware Bug]: No firmware reserved region can cover this RMRR [0x00000000000e8000-0x00000000000e8fff], contact BIOS vendor for fixes
[0.071188] DMAR: [Firmware Bug]: Your BIOS is broken; bad RMRR [0x00000000000e8000-0x00000000000e8fff]
Allerdings funktioniert die ILO HTML Konsole nur noch wenige Minuten nach dem Serverstart, die Eingabe ist extrem langsam und die Bildwiederholrate bei ca. 1 Sekunde. Boote ich Debian 10 ( das alte System ) macht ILO keine Probleme.
Nach zwei weiteren Wochen Recherche und immer seltsameren Fehlern kam ich dem Grund näher - Es scheint mit neueren Kerneln und der HP Implementation der Speichermanager Probleme zu geben. Nachdem "VM CVE" wurde mit "iommr" eine sichere Speicherverwaltung implementiert, die allerdings in o.g Fall dazu führt, dass sich das System nach wenigen Stunden bis Tagen, je nach Speicherauslastung komplett aufhängt. Wenn ich das Richtig verstanden habe werden getrennte Speicherbereiche (für VMS z.B.) aufgrund o.g. Implementierungsfehler doppelt Beschrieben, bzw nicht schnell genug wieder freigeben.
Es gab dazu mehrere Lösungen, wie z.B. die betreffenden Funktionen abzuschalten. Entweder im BIOS, durch drücken von CTRL + A sieht man ein Spezialmenupunkt ( https://community.hpe.com/t5/image/serv ... 2x496?v=v2 ), oder durch Deaktivieren von Kernelparametern mittels Grub /etc/default/grub Einträge). Geholfen hat nur das Deaktivieren der "Share Memory Configurtion" über den versteckten Menüpunkt im Server BIOS. Die letzten 48 Stunden scheint der Server nun ohne Zicken zu laufen. Es kommt mir auch vor, als ob die VMs schneller reagieren, gerade was Speicher, Cache, Latenz etc angeht.
Lösung => viewtopic.php?p=1340010#p1340010
Neue Hardware
Da der HP Microserver nur max. 16 GB RAM verwalten kann und etwas mehr Platz im Gehäuse und mehr RAM auch nicht schlecht wäre überlege ich folgendes:
Einen HP Microserver Gen 8 kaufen und mit CPU ( Xeon E3 1265L) und RAM (16GB) aus dem Microserver aufrüsten. Kostet ca 120 € in der Bucht
- ODER -
Neueres HP Server Model Gen 9 CPU müsste da ggf aufrüsten, denn der Alte E1265L (4c/8t) ist schneller und sparsamer als der 1220 v3 ( 4c/4t).
Wenn ich Pech habe und bei HP bleibe tritt o.g. Fehler u.U. allerdings wieder auf. Daher habe ich mich auch bei Lenovo umgeschaut und dort auch einige Modelle gefunden.
Hier könnte ich den RAM wiederverwenden : https://www.kleinanzeigen.de/s-anzeige/ ... 3-228-1907
- ODER -
Lieber gleich etwas Neueres kaufen ? ( https://www.kleinanzeigen.de/s-anzeige/ ... 3-278-7531 ). Können die Netzteile ggf. gegen eins mit größerem Lüfter getauscht werden, hat jmd mal so ein Model gehabt oder hat es noch ? Die 40 mm Lüfter scheinen mir recht laut zu sein.
Am liebsten würde ich den Microserver Gen 8 behalten und nochmal 32 GB RAM dazu packen. Das wäre perfekt - geht aber nicht und vllt ist der Server auch hin - zumindest das BIOS ( das werde ich den nächsten Tagen sehen ob ILO noch herumeckert ). Die Kleinen Server verbrauchen im Schnitt auch weniger Strom und sind nicht laut die großen Kisten ( https://www.ebay.de/itm/386131192045 )
Hauptpräferenz ist der Stromverbrauch und Lautstärke sowie ein separates ManagementInterface ( ILO, iDRAC, IPMC etc ). Bekommt man die Großen Server wie z.B. einen ]hpe-proliant-ml350-gen-9-server auf einen ähnlich niedrigen Verbrauch wie die kleineren o.g. Server ( vergleichbare CPU/RAM/HDD Bestückung )
Was würdet Ihr machen/kaufen ?