CMC Terminated due to unexpected signal 11

Hallo alle zusammen,
wir haben bei uns seit einigen Versionen das Problem, dass sich ab und zu der CMC verabschiedet. Aktuell setzen wir Version 1.6.0p18 ein. Da wir nicht jede Version gleich installieren, kann ich nicht genau sagen, seit wann das Problem auftritt, aber bestimmt seit 3-4 Monaten.

omd status liefert dann immer stopped für cmc, alle anderen Dienste laufen.

Im cmc.log findet sich dann die Zeile

[core 14838] Terminated due to unexpected signal 11. Restarting.

Die Zeilen vorher sind mehrere Minuten älter. Daher habe ich sie hier nicht aufgeführt.

Hat jemand eine Idee wo ich da suchen soll oder woran das liegen könnte?

Da das die Enterprise Edition ist, solltest Du über Euren Support-Vertrag ein Debugging starten lassen.

Hallo,
Hardware und insbesondere Ram mal getestet.
Wir hatten hier crashs mit einer appliance und haben dann irgendwann neu installiert und die Sites übertragen.
Gruß

Hi Wolfgang,

kannst du bitte folgendes probieren:

  • verschiebe bitte folgende
    Dateien (~/var/check_mk/core/{history,archive} )temporär in /tmp. Anschließend solltest du diese Dateien/ Verzeichnisse aus ~/var/check_mk/core löschen. Bitte behalte aber ein Backup der Dateien, da ansonsten alle historischen Daten verloren gehen.

Anschließend bitte noch einen restart der Site durchführen.

Bitte beobachte, ob der CMC sich weiterhin verabschiedet.

Gruß

Anastasios

Ok, ich habe die Dateien weggeräumt und die Site neu gestartet. Wir werden sehen…

Da das Problem nicht regelmäßig auftritt, sondern nur alle paar Tage, wird es also möglicherweise etwas dauern bis ich mich wieder melde. Insbesondere natürlich, wenn es funktioniert hat :wink:
Aber falls es funktioniert hat, werde ich das hier auf jeden Fall 2, 3 Wochen posten.

1 Like

Hallo Wolfgang,

alles klar. Ich warte gespannt auf deine Rückmeldung.

Gruß

Anastasios

Hallo Wolfgang,

wenn der cmc durch den Workaround nicht mehr abgestürzt ist, liegt das Problem am Log Parsing bzw. Parsing des Cachefiles durch den cmc.

Das haben unsere Entwickler gefixt. In der p20 ist der Fix dann enthalten. Siehe https://checkmk.com/check_mk-werks.php?werk_id=10130

Gruß
Anastasios

[core 119697] Terminated due to unexpected signal 11. Restarting

I am having the same issue. I am using Enterprise 1.6.0p19. I couldn’t find 1.6.0p20. where to find download link for that version?

I can’t find it here as well.

On the werks overview page, if you switch to the 1.6 branch, you can see: “Version 1.6.0p20 (Not yet released)”

Thank you @martin.schwarz Will wait for its release.

Nun sind mittlerweile 3 Wochen vergangen ohne dass einer der Dienste beendet wurde. Der Vorschlag von athomaidis oben scheint geholfen zu haben.

Ich habe inzwischen sogar ein Shell Skript geschrieben, welches die omd Dienste überwacht und ggf. sofort eine Telegram Nachricht verschickt, sodass man es auch sofort mitbekommt.

Vielen Dank für die Hilfe und allen geruhsame Festtage.

1 Like

Hallo Wolfgang,
wie schon oben erwähnt, wird sich das Problem mit der p20 erledigen. Dann kannst du auch alle historischen Daten wieder nutzen.

Gruß
Anastasios