Checkmk 2.0 - Verteiltes Monitoring maximale Anzahl Slaves / Distributed monitoring max slave count

Hallo checkmk-Freunde,

wir überlegen aktuell für 2.0 unserer Monitoring Struktur auf das verteilte Monitoring mit Livestatus umzustellen. Dabei stellt sich uns die Frage mit wie vielen Slaves checkmk 2.0 klar kommt. Bei uns werden es dann so round about 1.000 Slaves sein.

Welche Erfahrungswerte habt ihr hier schon gesammelt?

Gruß
Gino

? 1000 Außenstellen oder ?
Bei so einer großen Installation solltet Ihr Euch am besten direkt Richtung München wenden für Beratungsbedarf.
Mein größtes System waren gut über 100 einzelne Slaves welche aber bei der Größe schon nicht mehr mit einem Master verwaltet wurden. Es gab nur noch einen übergeordneten Master welcher alles angezeigt hat.Es wurden so immer 5-10 Slaves mittels eines lokalen Masters verwaltet.

Zur Zeit hab ich ein System laufen mit so 20-30 aktiven Slaves. Das lässt sich recht entspannt auch noch zentral verwalten. Kommt hier eher auf die Größe der Slave Instanzen an.

1 Like

So kleines Update dazu.
Wir haben einfach den Versuch gewagt und jede Menge Außenstellen in CheckMK 2.0.0p9 über das Distributed Monitoring angebunden.

Bei 344 Slaves mit in Summe ca. 20.000 Hosts und 260.000 Services haben wir abgebrochen.
Bis 300 Slaves war die Performance in Ordnung. Über 300 Slaves hatten mir dann wir dann mit Performance Problemen zu kämpfen, teilweise Totalausfall von Master und allen Slaves (Memory ist komplett vollgelaufen).

Abschließend hatten wir noch Rücksprache direkt mit einem Entwickler. Dieser hat in Aussicht gestellt, dass für Checkmk 2.1 weiter an der Performance vom Distributed Monitoring gearbeitet wird.

2 Likes

This topic was automatically closed 365 days after the last reply. New replies are no longer allowed. Contact an admin if you think this should be re-opened.