Checkmk Healthcheck per api?

Hallo zusammen,
kurze Frage, gibt es eine Möglichkeit, im Idealfall über die checkmk API, den Zustand der checkmk-Anwendung abzufragen?
Also wir möchten gerne den Zustand von checkmk selbst überwachen, mit Hilfe eines externen tools. Eine Variante wäre vermutlich das regelmäßige Ausführen von “omd status”. Aber gibt es so eine Möglichkeit auch über die API?
Wie überwacht ihr den Zustand eurer checkmk Umgebung?
Es geht hier primär um den Fall, dass checkmk ausfällt und selber keine Meldungen mehr verschicken kann.

Danke vorab!

VG
Christian

Wir setzen üblicherweise ein verteiltes Monitoring ein, in dem ja ohnehin defaultmäßig jede Site autark ihr eigenes Alerting macht. Und haben dann eben einen Server mit der zentralen Site für Anzeige und Konfiguration sowie (mindestens) einen zweiten Monitoring-Server, der die restlichen Systeme überwacht. Die Display-/Config Site hat die übrigen Sites per Livestatus eingebunden und überwacht diese (was auch schon wg. dem Status-Host sinnvoll ist) und wird selbst wiederum von einer der Worker-Sites überwacht.

Wenn man befürchtet, dass die gesamte drunterliegende Virtualisierungs-Plattform (oder das ganze Rack, Datacenter, …) auf einmal stirbt, dann muss eben eine der Sites noch auf echtes Blech (bzw. in ein anderes Rack, RZ, …) ausgelagert werden. Ebenso natürlich single-points-of-failure beim Alerting vermeiden, z.B. durch separate SMS-Gateways usw.

Je nach Bedarf kann man da beliebig viel Aufwand treiben :wink:

3 Likes

Hallo zusammen,

kann das hier nur bestätigen. Es kommt auf den Aufwand an, den du da rein stecken möchtest im Zusammenhang mit der Ausfall-Sicherheit.
Sofern dir ein einfaches Skript reicht, was regelmäßig “omd status” und die Ports überprüft, ist das OK,
aber für eine ausführliche, sichere Überwachung wäre hier nur ein sekundärer Server zu empfehlen,
der den Server überwacht, bzw. die sich gegenseitig überwachen.

1 Like

Alternativ bieten hier auch die Alarmierungsgeräte wie

  • sms Gateway
  • Alarmierungsserver
  • etc

Die Möglichkeit eines Heartbeates

1 Like

Hi Chris,

du kannst dir eine View mit den benötigten Service bauen und diese mittels Web Abfrage an das Überwachenden System als JSON oder CSV Output senden.

Viele Grüße,
Christian

2 Likes

Hi, danke für die Ideen!

https://checkmk.de/check_mk-werks.php?werk_id=10709

mit dem nächsten update erledigt

1 Like

HI @BH2005,
das klingt sehr gut. Kann man von diesen Sites dann auch Infos per API abfragen? Z.B. state of site processes etc?

VG
Christian