[Check_mk (deutsch)] Service Stale und die Rule Check intervals for SNMP checks

David_Ecker · February 24, 2017, 12:10pm

Hi Andreas,

das scheint zu klappen. Das Problem kommt anscheinend von den beiden verschiedenen Regel Arten.

"Access to Agents/Check intervals for SNMP checks" überschreibt nicht "Monitoring Configuration/Normal check interval for service checks". Da beide Regeln für einen SNMP Service Check gegriffen haben, wurden beide Werte in die Nagios Config geschrieben und Nagios hat einfach den letzten definierten Wert genommen, also die 2 Minuten.

Ist zwar trotzdem nicht sauber, aber so reicht mir das. Optimalerweise hätte die spezifischer Regel den allgemeineren Fall überlagern müssen.

Danke,
David

···

Am 24.02.2017 um 12:56 schrieb Andreas Döhler:

Hallo David,

da ist genau das Problem welches ich schon gemeint hab. Deine SNMP Checks haben explizit 2 Minuten als Check Interval durch eine Regel gesetzt und nochmal 60 Minuten durch die zweite. Habe das mal bei mir probiert und dort steht nur ein Wert drin bei allen SNMP Checks, und dies ist der Wert welcher durch die SNMP Regel gesetzt ist.

Wenn ich bei mir explizit ein Check Interval setze dann habe ich das Verhalten wie bei dir. Also Achtung keine expliziten Check Interval Regeln für Services welche über die SNMP Check Intervale konfiguriert werden sollen.

Gruß
Andreas

David Ecker <david@ecker-software.de <mailto:david@ecker-software.de>> schrieb am Fr., 24. Feb. 2017 um 12:31 Uhr:

    Hi Andreas,

    hab den Fehler gefunden. Nur keine Ahnung, wie ich den beheben kann.

    In der check_mk_objects.cfg (von WATO erzeugte Nagios Config)
    finde ich unter anderem folgende Einträge:

    define service {
      use check_mk_passive_perf
      host_name MyHostname
      service_description Filesystem /
      check_interval 60
      check_interval 2.0
      check_command check_mk-hr_fs
    }

    define service {
      use check_mk_passive
      host_name MyHostname
      service_description Velocloud Edge HA
      check_interval 2
      flap_detection_enabled 0
      check_interval 2.0
      check_command check_mk-velocloud_ha
    }

    Wunderbar zu erkenne. Wie aktuell konfiguriert läuft der Edge HA
    Service mit 2 Minuten. Beim SNMP Check wurd aber beide Einträge
    gemacht (60 Minuten und 2 Minuten), der normale und der SNMP Check
    -> Fehler in der dynamisch erzeugten Nagios Konfiguration.

    TabulaRasa bei dem Inventorize bringt auch nix, Werte bleiben
    gleich. Ist also wirklich ein Bug.

    @Andreas: Danke dir für deine Hilfe.

    bis dann

    David

    Am 24.02.2017 um 12:04 schrieb Andreas Döhler:

    Kann nur sagen in allen meinen Instanzen gibt es da keine Probleme.
    Teste das doch mal in einer sauberen neuen Instanz vielleicht
    wurde da bisl was selber umgebaut in deiner Instanz was nun nicht
    mehr funktioniert.

    Gruß

    David Ecker <david@ecker-software.de
    <mailto:david@ecker-software.de>> schrieb am Fr., 24. Feb. 2017 >> um 12:02 Uhr:

        Das ist ja genau mein Problem. Beide Regeln greifen ja auch.
        Die Abfragen werden auch (SNMP mit 3600s und Piggybag Daten
        mit 120s) mit den richtigen Intervallen ausfgeführt. D.h. die
        Regeln greifen, nur eben nicht bei der Berechnung von Stale.
        Der SNMP Service müsste erst nach (3600*1.5 )s ausgegraut werden.

        bis dann

        David

        Am 24.02.2017 um 11:58 schrieb Andreas Döhler:

        Noch kurz als Nachtrag.
        Dort wo bei dir nun im Normal Check Interval 120s drin steht
        muss eigentlich die von dir eingestellten 3600s drin stehen.
        Das klappt bei mir auch ohne Probleme.

        Gruß
        Andreas

            Am 24.02.2017 um 11:34 schrieb David Ecker:

            Hi,

            nee, muss er nicht. Der Host bekommt die Piggybag Daten
            zugeordnet. Der andere Host, welcher die Piggybag Daten
            besorgt hat kein SNMP. Da ist auch kein Problem.

            Du hat Recht, ich habe für "Normal check interval for
            service checks" keine Regel definiert, also 60
            Sekunden. Es gibt aber die spezielle Regel "Check
            intervals for SNMP checks", die ist auf 60 Minuten
            definiert und soll unabhängig von der "Normal check
            interval for service checks" Regel die SNMP Abfragen
            speziell Regeln.

            Die Piggybag Daten werden, geregelt durch die "Normal
            check interval for service checks" Regel (bei mir
            default), alle 60 Sekunden "angezeigt" und die SNMP
            Daten eben alle 60 Minuten. Soweit alles OK.

            Es bleibt dass die Berechnung für Stale für SNMP Daten
            anscheinend nicht die Regel "Check intervals for SNMP
            checks" beachtet. Damit sind die SNMP Services als
            Stale markiert.

            Ich kann Dir auch gerne ein paar Screenshots schicken,
            geht nur nicht über die Maillingliste.

            bis dann
            David

            Am 24.02.2017 um 11:23 schrieb Andreas Döhler:

            ? Kann da grad nicht ganz folgen.
            Der Host müsste doch eigentlich ein Dual Check sein
            falls Piggyback (Agent Daten) verarbeitet werden.
            Falls keine Regeln unter "Normal check interval for
            service checks" definiert ist so ist der Interval 60
            Sekunden.

            Was wird den bei dir unter den SNMP Checks angezeigt
            als "Service normal/retry check interval"?

            Gruß
            Andreas

            David Ecker <david@ecker-software.de
            <mailto:david@ecker-software.de>> schrieb am Fr., 24. >>>>> Feb. 2017 um 10:19 Uhr:

                Hi Andreas,

                anhand eines Hosts:
                - Der Host hat als Agent Type SNMP konfiguriert
                - Unter Parameter:
                  - Check intervals for SNMP checks (Rule 1 in
                ...) All SNMP Checks, 60 Minutes

                Zu den normalen Service Check Intervallen finde
                ich in WATO nix direkt unter den Host Parametern

                Schaue ich unter Service Details der Piggybag
                Daten sehe ich das "Service normal interval" bei 60s.

                Sieht also eigentlich von der Config alles OK aus.

                bis dann

                David

                Am 24.02.2017 um 09:34 schrieb Andreas Döhler:

                Hallo David,

                funktioniert bei mir auch in einer 1.2.8 Version
                mit Nagios Core ohne Probleme. Es werden alle
                Services ordentlich mit dem konfigurierten
                "Service normal/retry check interval" angezeigt.
                In meinem Beispiel hab ich mal 5 Minuten genommen
                und es wird ordentlich 300s/60s ausgegeben. Und
                auch in diesem Interval gecheckt.

                Es scheint wirklich wie von mir vermutet zu sein,
                dass deine Regel gar nicht angewendet wird. Wie
                schaut die den genau aus?

                Gruß
                Andreas

                David Ecker <david@ecker-software.de
                <mailto:david@ecker-software.de>> schrieb am Fr., >>>>>> 24. Feb. 2017 um 08:37 Uhr:

                    Hi Andreas,

                    wenn die "Checked" Information im Servcie
                    Status der Hosts stimmen, sind alle
                    Nicht-SNMP Checks immer irgendwo unter 60
                    Sekunden. Die SNMP Checks zeigen in Rot dann
                    eine Zeit bis zu 60 Minuten an.

                    Also davon ausgehend scheint das zu passen, aber:
                    In den Service Details zu einem SNMP Check
                    steht: Service normal/retry check interval
                    60s/60s. Die gleiche Information wie in einem
                    Nicht-SNMP Check.

                    Im Nagios Log und im RRD Cache finde ich auch
                    nur einen Wert pro Stunde für SNMP, der
                    Abfrage Zyklus speziell für SNMP scheint also
                    zu funktionieren.

                    Irgendwas passt nicht zusammen.
                    Ach so, ich Frage selber immer nach und
                    vergesse es dann : CMK Raw 1.2.8p16

                    bis dann

                    David

                    Am 24.02.2017 um 07:58 schrieb Andreas Döhler:

                    Hallo David,

                    bist du dir sicher das deine SNMP Checks
                    über die Regel auch das längere
                    Checkinterval erhalten? Was wird für diese
                    Checks in der Service Detailansicht angezeigt?
                    Bei mir erhalten die ausgewählten SNMP Check
                    Types auch ordentlich das größer
                    konfigurierte Interval.
                    Es ist auch unerheblich ob ich einzelne
                    Check Typen auswähle oder alle. Die Agent
                    based Checks werden auf den Dualcheck Hosts
                    weiterhin im 60 Sekunden Interval abgefragt.

                    Gruß
                    Andreas

                    David Ecker <david@ecker-software.de
                    <mailto:david@ecker-software.de>> schrieb am
                    Fr., 24. Feb. 2017 um 07:25 Uhr:

                        Hi,

                        ich überwache ein System wo die
                        aktuellen Informationen zu den einzelnen
                        Standorten aus dem Management System von
                        Velocloud kommen. Zusätzlich
                        frage ich SNMP Daten von den Standorten
                        ab. Die Piggyback Daten vom
                        Management werden den einzelnen
                        Standorten zugeordnet.

                        Mein Problem ist, dass ich die SNMP
                        Abfragen mittels der Regel "Check
                        intervals for SNMP checks" auf alle 60
                        Minuten begrenzt habe. Die
                        Piggyback Daten aber jede Minute
                        kontrolliert werden. Damit gehen in der
                        Anzeige alle SNMP Services nach 90
                        Sekunden auf Stale (bzw. Rot).

                        Ist das ein Fehler in CheckMK oder habe
                        ich was vergessen?

                        bis dann
                        David
                        _______________________________________________
                        checkmk-de mailing list
                        checkmk-de@lists.mathias-kettner.de
                        <mailto:checkmk-de@lists.mathias-kettner.de>
                        http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de

            _______________________________________________
            checkmk-de mailing list
            checkmk-de@lists.mathias-kettner.de
            <mailto:checkmk-de@lists.mathias-kettner.de>
            http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de