Checkmk UI Usability

  • Beim Erzeugen eines neuen Topics steht keine Sprachauswahl zur Verfügung.
  • Wo kann man die eingesetzte Version von Checkmk als User ablesen ?
  • Wieso wird beim Webinar von Raw, Free und kommerzieller Lizenz geschrieben (Denglisch), bei der Enterprise Version von checkmk allerdings nicht von komerzieller Version ? Ist eine kommerzielle Lizenz gleichbedeutend mit Enterprise Version ?
  • Warum werden in Checkmk unter dem Kapital “Das Monitoring” zwar hunderte von Features aufgeführt, jedoch an dieser Stelle KEIN Link angegeben, welche Schritte man konkret ausführen muß, um das offerierte Feature zu erreichen ? Stattdessen müssen sich Anwender durch die Doku quälen, um in endloser Zeitverschwendung und x Versuchen eventuell und mit viel Glück villeicht ein offeriertes Feature umzusetzen ?
1 Like

Hi Feingeist und willkommen im Forum,

danke für deine Rückmeldung!

Beim Erzeugen eines neuen Topics steht keine Sprachauswahl zur Verfügung.

Hier im Forum?

Wo kann man die eingesetzte Version von Checkmk als User ablesen ?

Links oben in der Sidebar. Schaut dann so aus:
grafik
Oben steht immer die Checkmk Edition. Drunter die genaue Version. Hier z.B: wird ein Daily Build der Stable Version 1.6.0 genutzt. Sonst steht dort z.B: 1.6.0p17

Wieso wird beim Webinar von Raw, Free und kommerzieller Lizenz geschrieben (Denglisch), bei der Enterprise Version von checkmk allerdings nicht von komerzieller Version ? Ist eine kommerzielle Lizenz gleichbedeutend mit Enterprise Version ?

Kommerziell ist wahrscheinlich nicht der richtige Begriff, aber wenn man ihn nutzt, würde das folgende wahrscheinlich am ehesten zutreffen:
Die kommerziellen Versionen sind die Checkmk Enterprise Editions. Dort gibt es die, Free Edition, Standard Edition und Managed Services Edition.

Die nicht-kommerzielle Version wäre die Checkmk Raw Edition.

Warum werden in Checkmk unter dem Kapital “Das Monitoring” zwar hunderte von Features

Von welcher Seite sprichst du? Das Handbuch oder die Webseite? Bei der Webseite gibt es ja “Das Monitoring”. Wenn du das meinst, das ist mein Mist. Bin ehrlich gesagt nicht dazu gekommen. Wollte ich irgendwann machen.
Wenn du mit Checkmk startest, dann lies am besten den Intro-Artikel durch:
https://checkmk.de/cms_intro.html
Dort wird jeder Schritt detailliert beschrieben und es gibt immer die Links zu den weiterführenden Themen.

5 Likes

Ergänzend kann auch noch der Checkmk Youtube Channel ganz hilfreich sein, der einige Grundlagen zeigt/erklärt:

Hi Feingeist,

generell ist die Lernkurve bei CheckMK steil. Das ist bei so einem großen Produkt nun einmal so. Das Ganze kann man jedoch langsam angehen und sich dieses Wissen erarbeiten. Ich habe bisher noch keine Sache gesehen die absolut nicht geht, es war immer nur eine Frage des “Wie?”.

Klar, die Doku kann eine Politur gebrauchen aber vielleicht bekommen die Tribes das ja hin.

Dazu vielleicht eine Idee - @martin.hirschvogel - 3 oder 4 User Stories von verschiedenen Kundenumgebungen und wie man sich CheckMK dann nähern kann. Beispiel:

  1. Ich habe 30000 SNMP Geräte und will diese Monitoren
  2. Ich habe 2000 Windows Server in 90 Rechenzentren

Nur als Idee…

4 Likes

Jo, das ist ne gute Idee. Nehme ich mal in den Ideenpool auf :slight_smile:

1 Like

In der User-Dokumentation sind laufend diverse Keywords zu entdecken, jedoch ist kein Link hinterlegt zu einer Stelle im Handbuch oder im Produkt selber.

Als Anwender möchte ich z.B. einfach auf mehrere Hosts eine bestimmten Prozess von seiner Existenz her überwachen. Kapitel 5.1 der Doku: Dort steht dann nur: Weitere Details zur Prozesserkennung finden Sie in der Onlinehilfe dieses Regelsatzes.

Onlinehilfe des Regelsatzes (Nebenbei: Wo können diese Regelsätze angegeben werden ?) sowie den im Kapitel gezeigten Service Discovery Dialog finde ich einfach nicht im Produkt wieder. Was soll dass ?

Der Regelsatz um den es geht steht vor der Abbildung im Text direkt

Folgende Abbildung zeigt eine Regel im Regelsatz Process discovery , welche nach Prozessen sucht,

Die Bezeichnung gibt man dann ma einfachsten im WATO in der Suche für die Regeln ein.
WATO -> Host & Service Parameters -> Searchbox
Wenn der Regelsatz dann geöffnet ist kann man mit dem kleinen Buch Icon rechts oben die Online Hilfe aktivieren.

Hallo Feingeist,
mir hat es bei CheckMK immer geholfen bei einer Fragestellung nachzudenken, wie CheckMK funktioniert. Der Weg zum Ziel hat sich dadurch meist ergeben.
Dein Beispiel der Prozessüberwachung:

  • Ich weiß als CheckMK Admin, dass Prozesse auf Servern die ich überwache mit dem CheckMK Agenten zu mir geschickt werden
  • Ich suche also nach einer Regel, die bei agentenbasierter Überwachung genutzt werden kann, diese Information nutzbar zu machen
  • WATO -> Host & Service Parameters
  • Suche benutzen: process
  • Unter “Rules for discovered services” finde ich dann “State and count of processes”

CheckMK hat eine sehr große Fülle an Möglichkeiten, man muss sich diese auf Grund der Komplexität aber ein wenig selbst erarbeiten. Wichtig finde ich, dass das allermeiste von haus aus geht.

In deinem konkreten Fall würde ich den oben beschriebenen Regelsatz dann so konfigurieren, dass er auf alle deine Hosts zutrifft.

Die Schwierigkeit für dich ist nun, wie lässt du den Regelsatz auf alle deine Server zutreffen? Du kannst das an der Namenskonvention, dem WATO Folder oder an Tags festmachen. Welchen Weg du hier wählst kann dir aber keine Dokumentation zu einem einzelnen Regelsatz erklären - das hängt von deinem Setup ab. Für jeden der Wege gibt es vor und Nachteile.

Ich hoffe das hat dir ein wenig geholfen. Über ein Feedback würde ich mich freuen.

1 Like

Hallo zusammen,

ok, habe alles heraus gefunden. Die Prozessüberwachung arbeitet zuverlässig !

Leider scheint die Agent-Bakery nicht zuverlässig zu funktionieren:

Ich habe mehrere einfache Python-Scripte auf unserem Monitoring-Server (dort ist CheckMK installiert) unter OMD/local/share/check_mk/agents/custum/check_my_clients/lib/local/600 bereit gestellt und auch eine Regel erstellt, die genau die Scripte aus check_my_clients übertragen soll. Anschließend Bake-Agents aufgerufen und anschließend Agents signiert. Jedes Python-Script beherbergt einen separaten, getesteten Check mit Ausgabe einer ordentlichen Status-Info.

Auf den Zielhosts (2 Stück) kommt leider nur ab und zu mal ein Script durch, alte local Checks die längst auf dem o.g. Monitoring-Sever gelöscht wurden erscheinen auf dem Zielhost und verschwinden nicht mehr, i.d.R. kann man ewig warten, bis mal ein Local-Check aus meinem Paket check_my_clients überhaupt als entdeckter Check auf den Zielhosts erscheint. Man hat keine Kontrolle darüber.

Habe ich etwas übersehen ?

Hallo,

dein neuer gebackener AGent wird natürlich nur dann ausgerollt, wenn dein Client auch prüft, ob ein neuer Agent vorhanden ist. Das kannst du mit der Regel Agent updater (Linux, Windows) kongurieren, wie häufig das passiert.
Es gibt das Problem, dass wenn nur an den Skripten etwas angepasst wird, die Bakery nicht feststellt, dass sich etwas geändert hat und kein neuer Agent gebacken wird. In dem Fall hilft es, einfach eine Datei mit in das Verzeichnis zu legen, um den Prozess zu triggern.

bei mir war und ist Agent Update per Regel auf 30min eingestellt.

Soweit ich beobachte, ist die Bakery wohl auch nicht in der Lage, Checks in den Zielhostverzeichnissen zu entfernen, nachdem sie auf dem Monitoring-Server im eigenen Verzeichnis z.B. OMD/local/share/check_mk/agents/custum/check_my_clients/lib/local entfernt wurden ?

In meinem Fall befindet sich auf den Zielhosts im Verzeichnis /usr/lib/check_mk_agent/local seit Wochen ein Check, der auf dem Monitoring-Server im Verzeichnis OMD/local/share/check_mk/agents/custom/check_my_clients/lib/local nicht mehr existiert.

Ich verwende zur Zeit Check_MK Enterprise 1.5.0p11

Welches Paketformat der Bakery benutzt du? Weil genau für das entfernen wird ja auf .deb oder .rpm gesetzt.
Kannst du das Verhalten auf mehreren Hosts beobachten, oder nur auf einem?

Es dürfte wohl ein check_mk_agent.rpm sein und auf allen Hosts läuft Linux.

Das mangelhafte Verhalten kann auf allen (beiden) Zielhosts gleichartig beobachtet werden.

Mittlerweile habe ich zu Testzwecken einen neuen Unterordner /900 erstellt mit 1-2 Python basierten Test-Checks. Die Python Scripte enthalten de facto nur noch ein sys.stdout.write(…) gefolgt von exit(…) um eine feste Status-Info rauszugeben. Sie werden von Check_MK per Service Discovery und Diagnosis nicht angenommen, obwohl auf dem Zielhost das Verzeichnis 900 erzeugt wurde. (Kann leider nicht tiefer reinsehen, keine Rechte vorhanden) Für die beiden Zielhosts wird auch nur ein Agent - der Default Agent genutzt, der per Regel “Deploy Custom files with Agent” konfiguriert wurde.

Warum ist in der Doku Kapitel “Kommandos” i.Vgl. zu den anderen Kommandos kein Beispiel für Fake Results angegeben worden, sondern nur leere Eingabe Zeilen ?

Wenn ich hier unter Plugin Output den Wert “Test 1” eingebe, schmiert Check_MK sofort mit einer Fehlermeldung ab: Internal error: ‘ascii’ codec can’t decode byte 0xc3 in position 4: ordinal not in range(128)

Wie muss ein Python-Script unter der Enterprise Version 1.5.0p11 mindestens beschaffen sein, damit es als Alert-Handler fehlerfrei ausgeführt wird und man nicht nur eine Fehlermeldung erhält derart:
“Could not find platform independent libraries \nCould not find platform dependent libraries <exec_prefix>\nConsider setting $PYTHONHOME to [:<exec_prefix>]\nImportError: No module named site”

Hast du mal versucht das rpm aus der Bakery runterzuladen und “per Hand” zu installieren um zu gucken, dass das klappt?

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.