Status der Cisco HSRP Group Service Checks

Hallo zusammen,

Ich würde gerne wissen, wie man am besten mit Services wie den untenstehenden umgeht. Bisher handelt es sich immer um Services von Redundanzgruppen auf Cisco-Switches. Einmal im Fehlerstatus verbleiben sie dort, bis ich manuell einen neuen Service-Inventory starte.
Gibt es dafür auch eine andere Lösung? Wie handelt ihr diese Serviceprobleme ab?

Ich kommuniziere immer den Grundsatz an meine Kollegen: WARN und CRIT Fehler müssen behoben werden und nur im false-positiv Fall werden Regeln der Servicechecks angepasst. Acknowledgement dient lediglich dazu, zu signalisieren, dass an der Fehlerbehebung gearbeitet wird. Das Prinzip dieser Service Checks ist leider ein anderer.

This check monitors the the status of the redundant unit of Cisco devices which support the CISCO-RF-MIB.
At discovery the unit ID, unit state, peer ID, peer state and duplex mode are saved as parameters. At check period if the parameters are still the same the check is OK. If they have changed the service status will turn into WARN if unit or peer state is ‘disabled’, ‘standby hot’ or ‘active’, or CRIT otherwise. In these cases the reason for the last switch of activity will be reported. Independently if the peer state is ‘not known’ the state will be CRIT.

Oder:

The check returns OK if the HSRP status is a good one (“active”, “standby”) and the same as during inventory. If the states flip from “active” to “standby” or vice-versa, the check goes to WARN, assuming that HSRP is doing it’s job.

Gruß
Tobias