Verhalten von checkmk bei gecachtem local check wenn das Skript hängt

Hallo zusammen,

wir haben in checkmk 1.6.0p21 folgendes Verhalten:
Wenn das Skript von einem local check hängt der auch gecacht ist (z.B. im Unterverzeichnis lib/local/120 liegt) wird das Skript zum einen mehrmals gestartet (kann man im local check behandeln) zum anderen wird der Service in der checkmk UI weder Unknown noch Stale.
Hier ein Beispiel:


Das cache interval ist 120 Sekunden, der letzte Cache ist aber 33 Minuten alt.

Über die Regel “Settings for local checks” kann ja nur das Cluster-Verhalten angepasst werden.

Kennt jemand eine Möglichkeit in der UI anzuzeigen das der Cache zu alt ist und den Service auf UNKNOWN oder Stale zu setzen?
Idealerweise brauchen wir in solch einem Fall eine Notification.

Viele Grüße
Thomas

Da hast glaube ich keine Chance.
Das Problem ist hier, der Cache wird trotzdem übermittelt deshalb auch nicht stale da ja Daten kommen.

Wäre hier eher schon fast ein Bug, dass er das Cache Interval nur anzeigt und nicht verwirft. Dies müsste der Local Check im CMK machen.

Im Endeffekt hast zur Zeit nur die Option dein Local Check Script so zu bauen, dass es immer einen Output liefert halt mit ordentlicher Fehlerbehandlung usw.

1 Like

Ich empfehle, in einem solchen Fall ins Script waitmax oder timeout einzubauen, damit langlaufende Prozesse irgendwann abgebrochen werden. Und dann entsprechend einen Fehler ausgeben.

2 Likes