Hallo alle zusammen,
wir haben bei uns seit einigen Versionen das Problem, dass sich ab und zu der CMC verabschiedet. Aktuell setzen wir Version 1.6.0p18 ein. Da wir nicht jede Version gleich installieren, kann ich nicht genau sagen, seit wann das Problem auftritt, aber bestimmt seit 3-4 Monaten.
omd status liefert dann immer stopped für cmc, alle anderen Dienste laufen.
Im cmc.log findet sich dann die Zeile
[core 14838] Terminated due to unexpected signal 11. Restarting.
Die Zeilen vorher sind mehrere Minuten älter. Daher habe ich sie hier nicht aufgeführt.
Hat jemand eine Idee wo ich da suchen soll oder woran das liegen könnte?
Hallo,
Hardware und insbesondere Ram mal getestet.
Wir hatten hier crashs mit einer appliance und haben dann irgendwann neu installiert und die Sites übertragen.
Gruß
verschiebe bitte folgende
Dateien (~/var/check_mk/core/{history,archive} )temporär in /tmp. Anschließend solltest du diese Dateien/ Verzeichnisse aus ~/var/check_mk/core löschen. Bitte behalte aber ein Backup der Dateien, da ansonsten alle historischen Daten verloren gehen.
Anschließend bitte noch einen restart der Site durchführen.
Bitte beobachte, ob der CMC sich weiterhin verabschiedet.
Ok, ich habe die Dateien weggeräumt und die Site neu gestartet. Wir werden sehen…
Da das Problem nicht regelmäßig auftritt, sondern nur alle paar Tage, wird es also möglicherweise etwas dauern bis ich mich wieder melde. Insbesondere natürlich, wenn es funktioniert hat
Aber falls es funktioniert hat, werde ich das hier auf jeden Fall 2, 3 Wochen posten.
Nun sind mittlerweile 3 Wochen vergangen ohne dass einer der Dienste beendet wurde. Der Vorschlag von athomaidis oben scheint geholfen zu haben.
Ich habe inzwischen sogar ein Shell Skript geschrieben, welches die omd Dienste überwacht und ggf. sofort eine Telegram Nachricht verschickt, sodass man es auch sofort mitbekommt.
Vielen Dank für die Hilfe und allen geruhsame Festtage.
This topic was automatically closed 365 days after the last reply. New replies are no longer allowed. Contact @fayepal if you think this should be re-opened.