tosch
(Tobias Schönau)
December 30, 2021, 1:23pm
9
Seems like it’s a problem persisting between all versions and no final fix available. You can work around by running systemctl reset-failed check-mk-agent@*
. But’s only a temporary fix if one of the agents fails.
Reason behind this issue is a not properly ended agent process and systemd keeps the unit active but failed.
Related posts i found (partially in german):
Dear CheckMK community,
I don’t know exactly why, but the systemd CheckMK Agent fails regularly on many of our different servers.
Every day when I get into work and open up CheckMK Monitoring, there’s at the very least 1 host who says “no connection to CheckMK agent”.
When I log into these servers, I see something like this:
systemctl --failed
UNIT LOAD ACTIVE SUB DESCRIPTION
● check-mk-agent@1674-172.16.14.34:…
Hallo Leute,
seit einiger Zeit kam es sporadisch vor das der checkmk-agent mit “failed” bei Systemd drinnen stand. Nun ist es leider bei sämtlichen Server (Ubuntu, Debian) ein Dauerzustand geworden. Und das lässt sich im Betrieb auch nicht fixen. Dabei ist der Agent oft 20-30 mal in Systemd als failed zu sehen. Das ganze sieht dann z.B. so aus:
check_mk@243-192.168.44.57:6556-192.168.44.254:59154, ...
Von den Einträgen gibt es zig, und das verteilt auf 100 Maschinen Plus, da sieht man dann in…
Hallo,
ich habe hier eine check-mk-Meldung die sich auf den Agent bezieht.
Ich finde auf dem betreffenden Host aber keinen Hinweis auf ein Problem.
Kann mir jemand einen Tip geben.
Gefunden habe ich
Aktuelle Beta 4 ist im Einsatz.
[grafik]
6805ca2fed5e CRIT - Total: 150, Disabled: 23, Failed: 6, 6 static services failed (check-mk-agent@2877-192.168.243.226:6556-192.168.241.90:54270, check-mk-agent@2879-192.168.243.226:6556-192.168.241.90:57122, check-mk-agent@2929-192.168.243.226:655…