Ich habe mit 1.6.0p11.cee so wie auch mit der 1.6.0-2020.05.14.cee
das Problem, dass der RabbitMQ Special Agent anscheinend nicht periodisch ausgeführt wird und “Check_MK” wird stale.
Auf der Kommandozeile funktionieren aber cmk -vpn <host>
oder cmk -D <host> oder cmk -v -II <host>
Es geht um diesen Special agent https://exchange.checkmk.com/p/agent-rabbitmq
Setup
Ich habe ein RabbitMQ Cluster bestehend aus 3 Nodes.
Davor steht ein HAProxy TCP Loadbalancer.
Nun möchte ich die RabbitMQ Queues überwachen.
Da wir mehrere hundert queues haben und ich die nicht
dreifach monitoren möchte, lege ich einfach die HAProxy LoadBalancer
Adresse im CheckMK an.
RabbitMQ Cluster
+------------------+
| node1.domain.tld |
HAproxy +------------------+
/
/
+----------------------+ +------------------+
|lb-rabbitmq.domain.tld|---| node2.domain.tld |
+----------------------+ +------------------+
\
\ +------------------+
| node1.domain.tld |
+------------------+
Ich lege mir einen Folder “RabbitMQ” an mit folgenden Folder properties:
DATA SOURCE
Check_MK Agent
No Checkmk agent, all configured special agents
Piggyback
Never use piggyback data
Used rulesets
Datasource Programs
Check state of RabbitMQ
...
Ich kann nun den Host inventarisieren:
OMD[poc]:~$ cmk -v -II lb-rabbitmq.domain.tld
Discovering services on: lb-rabbitmq.domain.tld
lb-rabbitmq.domain.tld:
+ FETCHING DATA
[special_rabbitmq] Execute data source
+ EXECUTING DISCOVERY PLUGINS (1)
842 rabbitmq_queues
SUCCESS - Found 842 services, no host labels
Und er liefert auch ohne Probleme Daten:
OMD[poc]:~$ cmk -vpn lb-rabbitmq.domain.tld | wc -l
451
Der Dump sieht so aus:
OMD[poc]:~$ cmk -D lb-rabbitmq.domain.tld
lb-rabbitmq.domain.tld
Addresses: 172.21.146.187
Tags: [address_family:ip-v4-only], [agent:special-agents], [criticality:prod], [ip-v4:ip-v4], [networking:lan], [piggyback:no-piggyback], [site:poc], [snmp_ds:no-snmp], [tcp:tcp]
Labels:
Host groups: check_mk
Contact groups: all
Agent mode: No Checkmk agent, all configured special agents
Type of agent: Program: /omd/sites/poc/local/share/check_mk/agents/special/agent_rabbitmq '-P' 'http' '-m' 'queues' '-u' 'monitor' '-s' 'geheim' '-p' 15672 '--hostname' 'lb-rabbitmq.domain.tld'
Services:
....
Aber, der Check “Check_MK” wird stale.
Er ist grau mit STATE PEND.
STATUS DETAIL ist leer, AGE ist - und CHECKED ist ebenfalls -
Für den Service Check_MK: Service normal/retry check interval 60 s / 60 s
Für den Host: Normal/retry check interval 6.00 s / 6.00 s
Beim “Reschedule Check” auf dem Check_MK passiert nichts.
Ich bin ratlos.