Flapping notification trotz scheduled downtime

Guten Morgen! Ich hatte eben eine Netzwerkwartung, deretwegen ich alle Hosts für 5min auf scheduled downtime setzte. Zum einen fiel mir auf, dass diese downtime nicht automatisch getriggert wird, obwohl die Hosts kruz kritisch als nicht erreichbar angezeigt wurden. Zum anderen wurden drei der Hosts als “started flapping” angezeigt und eine notification gesendet.

Meine Fragen:
Wäre der Host korrekt in downtime, käme keine notification für start/stop flapping, korrekt?
Weshalb wird eine downtime nicht (immer) “sofort” getriggert, wenn der Host im gesetzten Zeitfenster kurz unerreichbar wird?

Danke & lg!

Hi madman,

wenn ein Host in Downtime ist, dann erhälst du zwei Benachrichtigungen. Eine wenn die Downtime beginnt und eine, wenn die Downtime endet. Während der Downtime werden keine Alarme/Benachrichtigungen erzeugt.

Ich denke, dass du in deinem Fall die Option flexible with max. duration benötigst. Damit sagst du, dass du nicht weißt wann der Host DOWN/UNREACH geht, aber wenn er einige Minuten in einem der beiden Stati ist, dann ist der Host für x Minuten in Downtime.

Probier das mal aus. Im Handbuc wird diese Regel genau erklärt: https://checkmk.de/cms_basics_downtimes.html

Viele Grüße

Anastasios

Vielleicht wurde die Downtime versehentlich auf die Services statt auf den Host gesetzt? Das kann schnell mal passieren, wenn man sich der Problematik nicht bewusst ist. Host aufrufen - man landet im Service View, Action Menu, Downtime, fertig (aber leider falsch).

Es gibt dort zwar ein entsprechendes Häkchen “Schedule downtimes on the affected hosts instead of on the individual services”, aber das wird schon auch mal übersehen.

2 Likes

Guten Morgen, danke ihr beiden. Alle Hosts waren mit flexible downtime gescheduled - nicht die Services, die Hosts. Etwa 11-12 Server wurden ganz kurz als down angezeigt, da die Netzwerkunterbrechung nur wenige Sekunden dauerte. Kein Host triggerte daraufhin eine “scheduled downtime”. Drei weitere hingegen waren auf “Flapping”. Der Rest einfach wieder OK.
lg