Ich habe eine Remoteside mittels filebasierten Livedump an meiner Centralside angebunden.
Da der Filetransfer des Livedump einige Minuten braucht, wird bei allen Checks der Status stale angezeigt. Da dies nicht weiter stört, habe ich den Staleness value auch nicht verändert.
Nun habe ich aber das Problem, dass ich nicht erkenne wenn der Filetransfer des Livedump nicht funktioniert, da alle Checks weiterhin im Status stale bleiben und sich nur das Alter der Werte erhöht.
Gibt es eine Möglichkeit in der Centralside zu alarmieren sobald ein gewisses Alter dieser Messwerte aus dem Livedump überschritten wurde?
Als Alternative wäre natürlich das letzte -zur Verfügung stehende- Livedump File auf sein Alter zu prüfen.
Bevor ich aber dies implementiere, wollte ich mich erkundigen ob ein anderer Weg (wie oben beschrieben) möglich ist?
Nein - bei meinen Systemen mit Livedump hab ich das wie folgt gelöst.
Bei der “Produktion” des livedump/cmcdump Config Files wird der “check_interval” für die einzelnen Checks durch einen Wert ersetzt welcher meinem Übertragungsinterval der Daten entspricht.
Damit wird das nur stale wenn wirklich die Daten nicht in Time ankommen.
Besten Dank, werde ich mal ausprobieren.
Kann dann in der Centralside der Statuswechsel auf stale für einen Alarmtrigger (Critical, Warning) verwendet werden, welche beispielsweise in einer BI Aggregationen terminiert?
Mein Ziel wäre somit auch die Fileübertragung des Livedump mit zu überwachen.
Das ist kein Statuswechsel - deshalb kannst auch nix dran binden. Stale ist einzig und allein eine Anzeige im WebGUI.
Es gibt aber auch im Livestatus eine Spalte welche den Staleness Wert anzeigt. Darüber könnte man per Script Abfrage bestimmt was bauen.
Ok
Ich versuche mal den Weg über das Alter des letzten Livedumpfile in der Centralside zu gehen.
Dies lässt sich vermutlich mittels mk-filestats oder fileinfo einfacher umsetzten.