der Service “Check_MK Discovery” rennt ständig in einen timeout.
Er übernimmt den Wert nicht in “~/etc/nagios/nagios.d/tuning.cfg”, wenn ich ihn in
“~/etc/nagios/nagios.cfg” ändere.
Hab schon die Site neugestartet und den ganzen Server. Problem ist, dass immer der Service [Check_MK Discovery] und [Check_MK] abraucht und somit auch alle anderen Services abrauchen. Wie stelle ich das Time-Out am besten ein für diesen Fall?
Von mir aus soll er auch alle 20 Sekunden schauen, ob er den Server erreichen kann und nicht alle 30 Minuten (bei einem Ausfall sind 30 Min. ja extrem viel).
Wir nutzen leider auch nur die CRE. Spontan eine Idee?
Leider nein … der Service “[Check_MK]” läuft rund, generell aber wird der ganze Server als DOWN angezeigt, obwohl wenn man draufklick alles auf “grün” steht. …
Wenn dein Host/Service nicht alle 60 Sekunden Daten liefert, kannst du das Check Interval unter WATO -> Host und Service Parameters -> Monitoring Configuration anpassen.
Dafür gibt es zwei Regeln:
Für die Hosts: Normal Check Interval for host Checks
Für die Services: Normal Check Interval for Service Checks
Um im CRE den globalen Timeout zu ändern muss die Nagios Config Datei angepasst werden.
Deshalb kann im Gegensatz zur Enterprise Edition dieser Timeout auch nur global geändert werden.
Dieser Timeout steht im Normalfall bei 60 Sekunden.
Im WATO muss der Checkintervall für die betroffenen Geräte auf mindestens diesen Timeout dann geändert werden sonst gibt es schöne Race Conditions.
Einfach in den Nagios cfg Dateien nach - service_check_timeout - suchen.