Agent bring bei Systemd zig Fehler - Debian, Ubuntu

Hallo Leute,

seit einiger Zeit kam es sporadisch vor das der checkmk-agent mit “failed” bei Systemd drinnen stand. Nun ist es leider bei sämtlichen Server (Ubuntu, Debian) ein Dauerzustand geworden. Und das lässt sich im Betrieb auch nicht fixen. Dabei ist der Agent oft 20-30 mal in Systemd als failed zu sehen. Das ganze sieht dann z.B. so aus:

check_mk@243-192.168.44.57:6556-192.168.44.254:59154, ...

Von den Einträgen gibt es zig, und das verteilt auf 100 Maschinen Plus, da sieht man dann in CheckMK genau nichts mehr.
Ein Reboot einer solchen Maschine behebt das Problem manchmal, manchmal auch nicht. Starten oder Restarten kann man die genannten Services leider nur selten. Oft existieren diese gar nicht.

Wir benutzen hier CheckMK in der Version 1.6.0p8 auf Ubuntu 18.04LTS.

glg
Boospy

Hi Boospy,

wirklich check_mk@? Ich würde “check-mk-agent@…” erwarten. Kannst du auf einem betroffenen System mal “systemctl list-units |grep check” ausführen und den Output hier posten?

Mit “systemctl reset-failed check-mk-agent@*” bekommst Du den Fehler übrigens erstmal weg, dazu braucht es keinen Reboot.

This issue will be fixed in master/1.6.0 by #10710. It is currently in review and will be merged later.

1 Like

Ok, waiting for the fix. Thank you.

Ja. Das steht definitiv check_mk.

1 Like

Hi,
habe das gleiche Problem mit CheckMK 1.6.0p13. gibt es hierfür schon eine Lösung?
Hier die Meldung:
CRIT - 120 services in total, 5 static services failed (check_mk@17046-10.15.10.7:6556-10.15.18.10:41198, check_mk@17047-10.15.10.7:6556-10.15.18.10:41514, check_mk@17048-10.15.10.7:6556-10.15.18.10:41846, check_mk@17049-10.15.10.7:6556-10.15.18.10:42158, check_mk@17051-10.15.10.7:6556-10.15.18.10:42778)CRIT, Service ‘check_mk@17174-10.15.10.7:6556-10.15.18.10:53332’ activating for: 0.00 s, 10 disabled services