Performanceprobleme und weiss nicht genau wo ansetzen

@HolChecker Vielleicht zur Einordnung bzw. zum Verständnis: Du hast 352 Hosts und 5690 Services. Die müssen innerhalb von einer Minute gecheckt werden. Daher muss man in etwa folgende Checkraten erwarten:

352 Hosts / 60 Sekunden ≈ 6 Hostchecks/s
5690 Services / 60 Sekunden ≈ 95 Servicechecks/s

Wenn Du also z.B. nur 50 Servicechecks/s hättest, dann würde das bedeuten, dass checkmk nur etwa die Hälfte Deiner Services innerhalb einer Minute ausführen kann. Du darfst aber nicht unbedingt nur die 95/s sehen. Es könnte ja auch passieren, dass Dein checkmk-Server alle 5690 Checks in nur 20 Sekunden schafft (285/s) und dann in den restlichen 40 Sekunden nur noch so vereinzelte Checks erledigt, meinetwegen nur noch so 2/s. Im Schnitt mussen es eben 95/s sein.

Zum Service Speed-o-Meter: Mir hat mal ein Teacher in einer Schulung erzählt, das sei so eine “witzige” Idee gewesen, dieses Ding einzubauen, aber eigentlich hätte es nicht so den richtigen Nährwert. Es sieht hübsch aus, aber zumindest die Skala ist irreführend. Man muss es wie folgt lesen: Checkmk rechnet die erwartete Checkrate aus (5690 Services / 60 Sekunden ≈ 95/s; scheduled service check rate) und vergleicht diese 95 mit der tatsächlichen Checkrate (current rate). Wenn dein Server in einem Moment beispielsweise gerade 150 Checks/s schafft, dann zeigt das Instrument 100*(150/95) ≈ 157 % an. Wenn er gerade nur 48 Checks schafft, wird 100*(48/95) ≈ 50 % angezeigt.

Das heißt: Alles was unter 100 % liegt, ist tendenziell schlecht und 100 % und größer sind gut. Je mehr, desto besser. Die Nadel muss also mindestens einmal pro Minute auf 100 % oder höher stehen. Besser wäre, wenn die 100 %-Marke in der Mitte oder im ersten Drittel wäre und die Skala links davon rot und rechts davon grün wäre. Abgesehen davon passt das Instrument nicht in den Checkmk-Skin. Weder in den neuen noch in den alten. Es ist aber trotzdem nett anzuschauen.

… oder ist früher fertig. :wink: Das beobachte ich auf einer meiner Testsites mit wenigen Services. Die Nadel geht für ein paar Sekunden auf 100 % und höher und dümpelt die restlichen 45 Sekunden bei 10-20% rum. Einfach, weil checkmk schon fertig ist.

1 Like