Hallo zusammen,
ich habe gestern nach einem Kernel Update einen Site Server neu gestartet.
Nach dem Reboot waren einige ESXi Hosts über den Special Agent nicht mehr erreichbar.
cmk -v -d xxx
[special_vsphere] Execute data source
[special_vsphere] ERROR: Agent exited with code 1: Error while processing received data
[piggyback] Execute data source
No piggyback files for 'xxx'. Skip processing.
No piggyback files for 'xxx'. Skip processing.
ERROR [special_vsphere]: Agent exited with code 1: Error while processing received data
Analyse auf dem ESXi hat ergeben das der User “checkmk” wegen 0 Fehlversuchen für 900 Sekunden gelockt wurde. Ja, richtig gelesen.
Also habe ich versucht ob der Special Agent mit dem user “root” funktioniert. Ja, geht einwandfrei.
Kaum erfolgt ein mal ein Login als root, funktioniert auch der checkmk user wieder.
omd stop / start löst diese Problem nicht aus.
Nur ein Reboot macht diese Probleme. Daher vermute ich das es an der ~/tmp Ramdisk liegt.
Hat das so schon mal jemand erlebt?
Jörg
Debian 10
CEE 1.6.0p16