Special Agent RabbitMQ monitoring 1.0 mit 1.6.0p11.cee "Check_MK" wird stale

Ich habe mit 1.6.0p11.cee so wie auch mit der 1.6.0-2020.05.14.cee
das Problem, dass der RabbitMQ Special Agent anscheinend nicht periodisch ausgeführt wird und “Check_MK” wird stale.

Auf der Kommandozeile funktionieren aber cmk -vpn <host>
oder cmk -D <host> oder cmk -v -II <host>

Es geht um diesen Special agent https://exchange.checkmk.com/p/agent-rabbitmq

Setup

Ich habe ein RabbitMQ Cluster bestehend aus 3 Nodes.
Davor steht ein HAProxy TCP Loadbalancer.
Nun möchte ich die RabbitMQ Queues überwachen.

Da wir mehrere hundert queues haben und ich die nicht
dreifach monitoren möchte, lege ich einfach die HAProxy LoadBalancer
Adresse im CheckMK an.

                    RabbitMQ Cluster

                          +------------------+
                          | node1.domain.tld |
  HAproxy                 +------------------+
                        /
                      /
+----------------------+   +------------------+
|lb-rabbitmq.domain.tld|---| node2.domain.tld |
+----------------------+   +------------------+
                      \
                        \ +------------------+
                          | node1.domain.tld |
                          +------------------+

Ich lege mir einen Folder “RabbitMQ” an mit folgenden Folder properties:

DATA SOURCE
  Check_MK Agent
    No Checkmk agent, all configured special agents

  Piggyback
    Never use piggyback data

Used rulesets
  Datasource Programs
    Check state of RabbitMQ
    ...

Ich kann nun den Host inventarisieren:

  OMD[poc]:~$ cmk -v -II lb-rabbitmq.domain.tld 
  Discovering services on: lb-rabbitmq.domain.tld
  lb-rabbitmq.domain.tld:
  + FETCHING DATA
   [special_rabbitmq] Execute data source
  + EXECUTING DISCOVERY PLUGINS (1)
  842 rabbitmq_queues
  SUCCESS - Found 842 services, no host labels

Und er liefert auch ohne Probleme Daten:

  OMD[poc]:~$ cmk -vpn lb-rabbitmq.domain.tld | wc -l
  451

Der Dump sieht so aus:

  OMD[poc]:~$ cmk -D lb-rabbitmq.domain.tld
  lb-rabbitmq.domain.tld
  Addresses:              172.21.146.187
  Tags:                   [address_family:ip-v4-only], [agent:special-agents], [criticality:prod], [ip-v4:ip-v4], [networking:lan], [piggyback:no-piggyback], [site:poc], [snmp_ds:no-snmp], [tcp:tcp]
  Labels:                 
  Host groups:            check_mk
  Contact groups:         all
  Agent mode:             No Checkmk agent, all configured special agents
  Type of agent:          Program: /omd/sites/poc/local/share/check_mk/agents/special/agent_rabbitmq '-P' 'http' '-m' 'queues' '-u' 'monitor' '-s' 'geheim' '-p' 15672 '--hostname' 'lb-rabbitmq.domain.tld'
  Services:
  ....

Aber, der Check “Check_MK” wird stale.

Er ist grau mit STATE PEND.

STATUS DETAIL ist leer, AGE ist - und CHECKED ist ebenfalls -

Für den Service Check_MK: Service normal/retry check interval 60 s / 60 s
Für den Host: Normal/retry check interval 6.00 s / 6.00 s

Beim “Reschedule Check” auf dem Check_MK passiert nichts.

Ich bin ratlos.

Hi,

wie lange dauert denn das Kommando, wenn Du es auf der Konsole ausführst?

Hi @_rb, ich bin froh das du Dir das angeguckt hast.
Du bist der Author der RabbitMQ checks, oder ?

Also wenn ich das agent_rabbitmq Kommando als site user eingebe, ist es echt flott,
so ca 0.5 bis 1 Sekunden. Output sieht auch nach schönen check_mk sektionen mit JSON aus.

ein cmk -vp servername braucht ca 3 sekunden.

Interessant finde ich auch folgendes: Der Check_MK check wird ja grau, also “PEND”. Aber ich kann einen vernünftig aussehenden Agent Output runterladen.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.