Hallo Community,
in unserem Betrieb betreiben wir ein abgesetztes Monitoring bei dem die Verbindung zum Master immer von der abgesetzten Instanz aufgebaut wird.
Statusdaten werden über den cmcdump übertragen und der Notifications Spooler leitet die Nachrichten an die Zentrale weiter. Das ganze Konstrukt hat so bis jetzt ohne Probleme funktioniert.
Nun war ich 4 Wochen im Urlaub und merke nun, das der Notification Spooler keine Nachrichten mehr an die Zentrale weiterleitet.
Nach durchsuchen der Logs bin ich auf folgendes gestoßen:
Auszug aus mknotifyd.state
# mknotifyd - current state
Version: 2.1.0p8
Updated: 1663664008 (2022-09-20 10:53:28)
Started: 1663663987 (2022-09-20 10:53:07, 21 sec ago)
Configuration: 1663663987 (2022-09-20 10:53:07, 21 sec ago)
Listening FD: None
Spool: New
Count: 0
Oldest: -
Youngest: -
Spool: Deferred
Count: 0
Oldest: -
Youngest: -
Spool: Corrupted
Count: 0
Oldest: -
Youngest: -
Site: unknown site (192.168.1.1:6555)
Connection: 192.168.1.1:6555
Type: outgoing
State: cooldown
Status Message: Error reading data: [Errno 104] Connection reset by peer
Since: 1663664008 (2022-09-20 10:53:28, 0 sec ago)
Connect Time: 0.000 sec
Notifications Sent: 0
Notifications Received: 0
Pending Acknowledgements: -
Socket FD:
Encryption: encrypted
HB. Interval: 10 sec
HB. Timeout: 3 sec
LastIncomingData: 1663664007 (2022-09-20 10:53:27, 1 sec ago)
LastHeartbeat: -1 (1970-01-01 00:59:59, 1663664009 sec ago)
InputBuffer: 0 Bytes
OutputBuffer: 0 Bytes
Hier noch auffällig, das die Verbindung für kurze Zeit nach Neustart des Dienstes mknotifyd steht, aber nach 2-3 Sekunden abbricht. Ebenso der letzte Heartbeat im Jahr 1970.
Auszug aus mknotifyd.log
2022-09-20 13:06:55,404 [40] [cmk.mknotifyd.outgoing(192.168.1.1:6555)] Error reading data:
Traceback (most recent call last):
File "/omd/sites/cmk_pascal/lib/python3/cmk/cee/mknotifyd/connection.py", line 144, in process_incoming_data
chunk = sock.recv(32 * 4096)
ConnectionResetError: [Errno 104] Connection reset by peer
Aktuell bin ich ein wenig überfordert, welche Maßnahmen man noch durchführen kann damit der Spooler wieder ordnungsgemäß seine Verbindung aufbaut.
Grüße
Andreas