Winperf-Services verschwinden auf Windows-Server

Hallo zusammen,

wir überwachen mit der Checkmk Managed Service Edition v1.6.0p18 unter anderem einen Windows Server (W2K16 Datacenter, virtuelle Maschine). Darauf läuft ein “gebackener” Checkmk-Agent ohne besondere PlugIns oder ähnliches. An Services sind die üblichen aktiviert wie z.B. Filesystem, Memory and Pagefile, CPU Utilization, Netzwerk-Adapter oder System Time.

Wir erleben jedoch das Phänomen, daß wenige Stunden nach einer frischen Agent-Installation und Aufnahme aller gefundenen Services einige der Services plötzlich nicht mehr gefunden werden und als vanished services (durch eine Custom Rule) aus der Überwachung entfernt werden.

Der Check_MK-Service meldet “Missing agent sections winperf_if, winperf_phydisk, winperf_processor…”. Der Service Check_MK_Agent erhält den Status UNKNOWN - Item not found in agent output.
Die genannten Sections tauchen auch tatsächlich nicht mehr im Agent-Output auf.
Was ist hier passiert?

Zum entsprechenden Zeitpunkt sehe ich folgende Meldung im Agent-Logfile, kann damit aber leider nichts anfangen:

2021-02-02 10:19:51.619 [Err ] c:\workspace\cmk_160\nightly_build_containerized\agents\wnx\src\engine\service_processor.h:440: no full answer: awaited [13], received [12]
df dotnet_clrmemory local mem mrpe plugins ps services spool uptime wmi_cpuload wmi_webservices

Die Config des Agenten sieht ok aus:
.\check_mk_agent.exe showconfig winperf
Environment Variables:
MK_LOCALDIR=“C:\ProgramData\checkmk\agent\local”
MK_STATEDIR=“C:\ProgramData\checkmk\agent\state”
MK_PLUGINSDIR=“C:\ProgramData\checkmk\agent\plugins”
MK_TEMPDIR=“C:\ProgramData\checkmk\agent\tmp”
MK_LOGDIR=“C:\ProgramData\checkmk\agent\log”
MK_CONFDIR=“C:\ProgramData\checkmk\agent\config”
MK_SPOOLDIR=“C:\ProgramData\checkmk\agent\spool”
MK_INSTALLDIR=“C:\ProgramData\checkmk\agent\install”
MK_MSI_PATH=“C:\ProgramData\checkmk\agent\update”
Loaded Config Files:
system: ‘C:\Program Files (x86)\checkmk\service\check_mk.yml’
bakery: ‘C:\ProgramData\checkmk\agent\bakery’
user : ‘C:\ProgramData\checkmk\agent\check_mk.user.yml’
winperf

enabled: yes
exe: agent
prefix: winperf
timeout: 10
counters:

234: phydisk
510: if
238: processor

Auch ein lokaler Abfragetest des Agenten auf die winperf-Sections gibt Ergebnisse aus:

.\check_mk_agent.exe section winperf
<<<winperf_phydisk>>>
1612420953.59 234 2143402
3 instances: 0_C: 1_E: _Total
-36 0 0 0 rawcount
-34 70295085803 676046923778 373171004790 type(20570500)
-34 132568945535801656 132568945535801656 132568945535801656 type(40030500)
1166 70295085803 676046923778 746342009581 type(550500)

Aber leider bleiben die Services im Checkmk verschwunden und lassen sich durch keinen Scan oder Rediscovery zurückholen.

Was könnte dafür die Ursache sein?
Ich bin für jeden Hinweis oder Tip dankbar.

Viele Grüße,
Antje

Mmmmh das sieht schon recht seltsam aus :wink:
Normal würde ich hier sagen Server neu installieren da es hier ein tieferes Problem im System mit den Performance Countern zu geben scheint. Wenn deine Beobachtungen soweit zutreffen sollten die Services auch temporär wieder auftauchen wenn der Agent Service neu gestartet wird. Es scheint hier so zu sein, dass nach einer Laufzeit X einfach keine Daten mehr aus ausgegeben werden können.

Bevor ich hier größere Versuche machen würde, würde ich einfach mal einen alten 1.5er Agenten nehmen und schauen wie der sich verhält. Dieser muss ja nicht gebacken sein. Reicht ja zum Test einfach mal den 1.6er deinstallieren und 1.5 installieren. Diesen ohne extra Plugins nur der blanke Agent. Wenn es ein System Problem ist müsste dieser ein ähnliches Verhalten nach Zeit X zeigen.

Hallo Andreas,

diesen Gedanken hatten wir auch schon.
Sobald es möglich ist, installiere ich mal einen alten 1.4er-Agenten auf dem System und warte ab, wie es sich entwickelt.

Danke und viele Grüße,
Antje

Hallo,

also auf dem betroffenen Windows-Server läuft seit mehreren Tagen ein alter 1.4er Agent und hat offensichtlich keine Probleme mit der Abfrage der winperf-Dienste. Die Services sind noch da und liefern Werte.
Das heißt, wir haben hier ein Problem mit dem 1.6er Agenten und WMI Performance Countern. Kann ich das dem tribe29-Support melden? Oder hat noch jemand eine Idee für einen Workaround.
Ich möchte natürlich auf Dauer den aktuellen Agent in einer gebackenen Variante einsetzen…

Vielen Dank und viele Grüße,
Antje

Könnte nach Werk #10187: Windows agent: Resolved problem with message UNKN – Item not found) klingen…

Danke für den Tip. Aber wir hatten vorher den Agent in der Version 1.6.0p18 im Einsatz. Damit sollte der genannte Bug ja schon gelöst sein… :frowning: Es klingt daher wie ein neuer Bug…

This topic was automatically closed 365 days after the last reply. New replies are no longer allowed. Contact @fayepal if you think this should be re-opened.