Service-Status bei unerreichbaren Hosts

Hallo zusammen,

mittlerweile finde ich mich in Checkmk recht gut zurecht. Mir ist jedoch noch ein Unterschied zu unserem alten Nagios aufgefallen, zu dem ich eine Frage habe:

Im Nagios springen Services auf Hosts, die down oder unreachable sind, auf unknown. Im Checkmk bleiben sie jedoch auf ok stehen. Kann man das irgendwie anpassen?

Klar, die Services werden nach einer Weile als stale angezeigt, aber es ist zum Beispiel in Views dennoch offensichtlicher, wenn die Checks auf unknown springen.

Danke. :slight_smile:

Das muss nicht so sein. Das hing eher davon ab wie die Services im klassischen Nagios konfiguriert waren.
Im CMK geht erstmal nur der Check_MK Service in den Zustand critical, da dieser der einzige aktive Check ist auf einem CMK Host. Dies ändert sich erst wenn noch andere aktive Checks konfiguriert wurden. Diese können sich dann so verhalten wie früher alle Nagios Checks.

Dies wäre aber eine Falschmeldung. :wink:

Stimmt, die aktiven Checks gehen auf critical.

Als Falschmeldung würde ich das nicht bezeichnen. Das Ergebnis kann ja nicht abgefragt/interpretiert werden. Ich finde das ok verwirrend, denn das kann ja gar nicht sein, wenn der Host nicht erreichbar ist.

Aber ok, dann geht das wohl nicht. Ich danke Dir.

Andere Anregung - in den Dashboards einfach erstmal alle Services von Down Hosts ausblenden und mehr Fokus auf die Down Hosts lenken.
Vor allem wenn dies wichtiger sein sollte.

1 Like

Ich versuche in meinem ersten Dashboard (mit einer View) gerade, den Fokus auf Hosts mit Problemen zu legen, indem ich Hosts, bei denen alle Services, die im Dashboard angezeigt werden, ok sind, rausgefiltert werden. Aus irgendeinem Grund klappt das aber nicht, und ich sehe auch Hosts, bei denen alle Services ok sind.

Ich weiß leider noch nicht, woran das liegt. Für den Host habe ich eine Spalte mit dem Host State eingefügt. Damit ist der Status dann auch sichtbar.

Wenn der Host down ist, kann der Agent nicht abgefragt werden. Dann geht der CheckMK-Check auf CRIT, wie @andreas-doehler schon geschrieben hat.
Jetzt kommen also gar keine Agentendaten mehr in die Check-Engine rein, die ganzen davon abhängigen Checks laufen gar nicht und können gar keinen anderen als ihren letzten Zustand haben. Das einzige, was der Monitoring-Kern mitbekommt, ist die Tatsache, dass sie schon länger als anderthalb mal das Normal heck Interval keinen Zustand gemeldet haben, sie ergo “stale” werden. Das ist aber kein Zustandswechsel im Sinne der Notifications.