Check_mk agent Windows os error 10054

Hallo zusammen,

kann jemand bei nachfolgendem Fehler behilflich sein? Der Service Check_MK wird ca. alle 10 Minuten als CRIT gemeldet.

CMK version: Checkmk Enterprise Edition 2.1.0p15
Host OS version: Microsoft Windows Server 2019 Standard (Version: 10.0.17763)

Error message in checkmk:

[agent] MKTimeout('Fetcher for host "winserver2019" timed out after 120 seconds')

Logs from monitored host:

2022-11-14 22:57:22.097 [srv 9060] [Trace] Provider 'plugins' is about to be started, id '2343736906331300' port [mail:\\.\mailslot\Global\WinAgent_0]
2022-11-14 22:57:22.098 [srv 9060] [Trace] Sending data 'plugins' id is [2343736906331300] length [3620]
2022-11-14 22:57:22.099 [srv 9060] perf: Section 'plugins' took [0] milliseconds
2022-11-14 22:57:22.127 [srv 9060] Received [3748] bytes from 'plugins'
2022-11-14 22:57:22.128 [srv 9060] perf: Answer is ready in [7683] milliseconds
2022-11-14 22:57:22.381 [srv 9060] Send [42147] bytes of data
2022-11-14 22:57:22.382 [srv 9060] [Warn ] destroy connection
2022-11-14 22:57:32.378 [ctl:8484] [cmk_agent_ctl::modes::pull][DEBUG] processed task!
2022-11-14 22:57:32.409 [ctl:8484] [cmk_agent_ctl::modes::pull][WARN] [::ffff:10.0.0.7]:48120: Request failed. (Eine vorhandene Verbindung wurde vom Remotehost geschlossen. (os error 10054))
2022-11-14 23:00:13.596 [ctl:8484] [cmk_agent_ctl::modes::pull][INFO] [::ffff:10.0.0.7]:39636: Handling pull request.
2022-11-14 23:00:13.628 [ctl:8484] [cmk_agent_ctl::modes::pull][DEBUG] [::ffff:10.0.0.7]:39636: Handling pull request DONE (Task detached).
2022-11-14 23:00:13.659 [ctl:8484] [cmk_agent_ctl::modes::pull][DEBUG] handle_request starts
2022-11-14 23:00:13.690 [ctl:8484] [cmk_agent_ctl::monitoring_data][DEBUG] connect to localhost:28250
2022-11-14 23:00:13.721 [ctl:8484] [rustls::server::hs][DEBUG] decided upon suite TLS13_AES_256_GCM_SHA384
2022-11-14 23:00:14.614 [srv 9060] Connected from '127.0.0.1:63413' ipv6 :false -> queue
2022-11-14 23:00:14.615 [srv 9060] Peer/local  46583 remote  23150 state ESTABLISHED from pid   8484
2022-11-14 23:00:14.617 [srv 9060] Connected from '127.0.0.1' ipv6:false port: 63413 <- queue
2022-11-14 23:00:14.628 [srv 9060] Get ip = ::ffff:10.0.0.7
2022-11-14 23:00:14.629 [srv 9060] [Warn ] OHM file 'C:\ProgramData\checkmk\agent\bin\OpenHardwareMonitorCLI.exe' is not found
2022-11-14 23:00:14.631 [srv 9060] Allowed Extensions: [checkmk.py,py,exe,bat,vbs,cmd,ps1]
2022-11-14 23:00:14.632 [srv 9060] [Trace] Left [44] files to execute

Kennt jemand diese Fehler und weiß wie man Ihn beheben kann?

Vielen Dank im Voraus!

Grüße
n3m0

Im Log sieht man nur, dass angeblich der remote Host (Monitoringserver) die Verbindung beendet hat. Zwischen der Meldung und dem letzten Eintrag des Agents liegen aber auch nochmal 10 Sekunden wo nix im Log steht. Sieht komisch aus.
Die letzten Zeilen des Agent Prozesses sehen eigentlich gut aus soweit.

Nur scheint dann der Controller die Verbindung nicht richtig zu schliesen.
Was passiert bei einem “cmk -d [hostname]” vom Monitoringserver aus?
Bleibt dann die Verbindung hängen oder kommt da ne sinnvolle Fehlermeldung?

Was hier vielleicht auch noch weiter helfen kann ist die Agent Configuration selbst.
Wäre nicht schlecht den Output von einem “check_mk_agent.exe showconfig” zu sehen.
Das kann aber denke ich nur helfen falls die eigentliche Agent Laufzeit zu lang ist.

Hi Andreas,

der Host hat schon immer dieses Problem. Habe auch schon eine neue Installation des Agents vorzunehmen, hat jedoch keine Besserung gebracht.
Wenn ich cmk -d host ausführe, gibt er mir alle Daten den Agent aus. Auch wenn ich den Befehl mehrere Male hintereinander ausführe erscheint auf dem Monitoringserver kein Fehler.

Edit: Nachdem ich nun den Befehl minütlich für 10 Minuten ausgeführt habe, erscheint auch kein Fehler im Monitoring, dass der Service Check_MK auf CRIT wechselt.

Edit2: Nach wieder 10 Minuten, in denen ich den Befehl nicht ausgeführt habe, meldet das Monitoring wieder Service Check_MK von OK auf CRIT. Nach einer Minute wieder die Entwarnung: CRIT → OK.

Hast Du noch eine Idee was ich prüfen kann?

Danke & Grüße
n3m0

This topic was automatically closed 365 days after the last reply. New replies are no longer allowed. Contact an admin if you think this should be re-opened.