Kryptische Zeichen zerstören den Output

Hallo zusammen,

folgendes Problem. s. Bild:
image

Diese kryptischen Zeichen am Anfang vom Agent Output zerstören das Handling komplett und bringen alle Service vom Host durcheinander, vor allem aber glaub der Check_MK-Service das er keine gültigen Daten bekommen hätte, obwohl der Rest einwandfrei da ist.

Nach einer Neuinstallation ist das Problem zwar wieder verschwunden, aber Sie tauchen ab und zu immer wieder auf. Eine Idee woran das liegen könnte? Unsere erste Vermutung war “DotNet”, aber nach der Deaktivierung war das Problem teils immer noch vorhanden. Aktuell sind knapp 70 Server betroffen =/

Ich bin dankbar für jeden Tipp :wink:
Kruzgoth

Handelt es sich bei den problematischen Hosts alles um Windows-Agenten?

@tosch, dies kann ich vorerst nur bestätigen.
Einen Unix-Host habe ich noch nicht mit diesem Problem gefunden, allerdings wissen wir aktuell
auch nicht woran es bei den Windows-Hosts liegt.

Schade, bei Unix hätte ich dir vielleicht helfen können, Windows ist leider das falsche Betriebssystem für mich.
Aber es gibt hier einige, die im großen Umfang Windows-Agenten im Einsatz haben und etwas dazu sagen können.

@tosch, du kannst ja dennoch einmal verraten, was bei dir die Lösung des Problems war.
Vielleicht kann ich daraus irgendwas zurück schließen auf Windows.

Okay, habe mich falsch ausgedrückt. Ich hatte das Problem noch nicht, aber ich hätte es mit dir nachvollziehen und suchen können. Da in deinem Output noch mehr Zeichen nicht richtig angezeigt werden, könnte ich auf Zeichensatz tippen. Kannst du dir die Ausagebe des Agenten auf einem Linux-System angucken, Notepad könnte an der Stelle zusätzlich noch komische Sachen machen bei der Anzeige.

Sieht denn der Output “normal” aus, wenn du auf dem Server cmk -d $hostname machst? Das zeigt den Agent-Output an der Shell an. Davon abgesehen würde ich natürlich ebenfalls auf ein Zeichensatz-Problem tippen.

Hallo Kruzgoth,

wir haben rund 4000 Windows-Agenten (1.5) im Einsatz und haben das Problem auf allen, immer mal wieder.

Unsere bisherige Analyse:

  • es passiert nur wenn die Encryption an ist
  • es passiert eher wenn der Agent viele Daten sendet (DB-Server, Exchange-Server)
  • es ist der Agent der defekt verschlüsselt, der Server bekommt dann Mist beim decrypten

Wir wissen noch nicht ob das mit dem 1.6er-Agenten gefixed ist, das ist aber die große Hoffnung. Wir machen da nämlich schon 1-2 Jahre mit rum…

In ein paar Wochen kann ich vermutlich mehr sagen wenn wir einige 1.6er-Windows-Agenten haben.

3 Likes

Sieht denn der Output “normal” aus, wenn du auf dem Server cmk -d $hostname machst?

@Dirk Der restliche Output ist “normal”. Die restlichen Zeichen die du meinst sind ein reines Anzeigeproblem von “Notepad”.
Via “notepad++”, als auch über Konsole, wird der Rest einwandfrei angezeigt, nur die Anfangs-“Hiroglyphen” sind immer noch identisch.

In ein paar Wochen kann ich vermutlich mehr sagen wenn wir einige 1.6er-Windows-Agenten haben.

@linux_frickler Blöd zu hören, dass Ihr euch ebenfalls damit rumschlagen müsst. Hatte mir durch das Forum hier erhofft, wenigstens den Grund zu erfahren, woran das liegt :smiley:
Meine Vermutung war auch schon, dass es vielleicht an der “wmi”-Komponente liegt, da der Fehler aber nicht explizit reproduzierbar erscheint, zumindestens unseres Wissens nach, ist es schwer das zu kontrollieren.

Wir haben leider aktuell wieder alle Systeme behoben, da wir dies leider auch aufgrund von Richtlinien müssen. D.h. aber auch, dass ich aktuell leider keine Test-Daten mehr zur Verfügung habe =/

Die Dinger tauchen ja immer nur sporadisch auf - man kann die aber im cmc.log ganz gut finden:

grep “An exception occured while processing host” var/log/cmc.log

Da kommen dann lauter solche Stellen bei raus:

2020-03-26 00:06:34 [4] [Check_MK helper 20915] >> An exception occured while processing host "host123.lan"                                                        [0/296]
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >> Traceback (most recent call last):
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >>   File "/omd/sites/site/lib/python/cmk_base/cee/keepalive.py", line 322, in do_keepalive
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >>     status = command_function(command_tuple)
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >>   File "/omd/sites/site/lib/python/cmk_base/cee/keepalive.py", line 559, in _execute_keepalive_command
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >>     return mode_function(hostname, ipaddress)
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >>   File "/omd/sites/site/lib/python/cmk_base/decorator.py", line 93, in wrapped_check_func
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >>     console.verbose(output_txt.encode("utf-8"))
2020-03-26 00:06:34 [4] [Check_MK helper 20915] >> UnicodeDecodeError: 'ascii' codec can't decode byte 0xa2 in position 45: ordinal not in range(128)

Zur Größenordnung: Bei dem Grep kommen gerade bei mir auf einer Site mit 2000 Windows-Agenten etwa 100 Zeilen raus, verteilt über 15 Stunden. Also sprich, das passiert nur ab und zu.

1 Like