Überwachungen von vSwitches

Hallo zusammen,
ich habe die Situation, dass ich die Verfügbarkeit meiner Guests als ICMP-Monitoring festmachen möchte. Die Kunden erhalten Ihre öffentliche IP über einen vSwitch, welcher mit den einzelnen Hostservern verbunden ist.

Im Monitoring habe ich einen Host angelegt mit “No IP”, quasi als Gruppe für den “vSwitch XY”. Nun habe ich alle IP-Adressen einzeln als Service “Check Hosts with PING” über die Option “Die folgenden expliziten Addressen” dem jeweiligen Host “Explizite Hosts” zugeordnet.

Nun habe ich allerdings das Problem, dass der Host selbst permanent als “UP” angezeigt wird, selbst wenn ein einzelner Service (PING Request) als Critical wahrgenommen wird. 2 Fragen hierzu:

  1. Ist es möglich dem Host-Objekt zu sagen, dass es seinen Status mit den Services synchronisiert, im Sinne von “1 Service ist nicht erreichbar, wechsle Host zu WARN, 6 Services sind nicht erreichbar, wechsle Host zu CRIT” ?
  2. Ist es möglich, den Versand der Benachrichtigungen zu verzögern und allenfalls zusammen zu fassen, falls alle Services auf einmal ausfallen? Bspws hat ein vSwitch 64 IP-Adressen, wenn das Gateway ausfällt möchte ich keine 64 einzelne Push-Nachrichten sondern eine Meldung “vSwitch ist CRIT” oder so ähnlich.

Ich habe leider nichts passendes in der Dokumentation gefunden und hoffe, dass ihr mir hierbei weiterhelfen könnt :slight_smile:

Cheers

Hier stellen sich mir einige Fragen.

  • Der vSwitch hält doch nicht die ganzen Adressen diese gehören doch bestimmt zu virtuellen Maschinen?
  • Warum nicht die einzelnen Maschinen anlegen und diese bekommen als Parent Objekt den vSwitch?

Das würde über BI funktionieren macht aber meiner Ansicht nach wie oben beschrieben keinen großen Sinn.

Einfach das Notification Bulking einschalten und eine Zeitspanne X definieren.
Ehrlich gesagt. Wenn ein vSwitch “kaputt” ist dann ist auch alles weg was dran hing. Ausnahme ist wieder wenn die IPs den VMs gehören und der vSwitch nur in der Art kaputt ist, dass ein Host ausgefallen ist.

Richtig, die Adressen gehören zu einzelnen virtuellen Maschinen. Jedoch möchte ich für den Anfang auch noch mit der CEF rumkommen, die nur 25 einzelne Hosts beinhaltet. Deshalb lege ich die einzelnen IP-Checks als Servicechecks an.

Ich stimme dir zu, dass normalerweise in einem vSwitch alles wegbricht. Jedoch ist das in unserem spezifischen Fall nicht die Regel. Wir beziehen die vSwitches bei einem nahmhaften deutschen Provider den ich hier nicht weiter nennen will. Es ist jedoch so, dass gelegentlich ein vSwitch wegbricht und -ohne Angaben von Gründen- nur ein Teil der darin erhaltenen IP-Adressen wieder funktioniert und der rest in Folge mangelhaften Systemdesign nicht mehr erreichbar ist, was zur Folge hat das die vSwitch-Konfigurationen vom Provider erst wieder manuell kopiert werden müssen.

Deshalb muss in diesem Fall eine vernünftige Überwachung hin wo man zum einten den lethalen Zustand des vSwitches, sowie die damit verknüpften einzelnen IP-Adressen sehen kann. Es sind ja auch nicht gerade wenige…

Verstehst du wie ich meine ?

Ich verstehe schon was gemeint ist und es ist so wie ich auch vorher geschrieben hab.
Jede IP als Host anlegen und als Host überwachen.
Die virtuellen Maschinen wenn bekannt nach den Hosts gruppieren auf dehnen diese laufen.
Damit sieht man auch einfach welcher Host ein Problem hat wenn mal eine Störung war.

Wenn ein ordentliches Ergebnis erhalten werden soll führt kein Weg an einzelnen Hosts und Eltern-Kind Beziehungen der Objekte vorbei. Ist halt so.
Wenn man viel Zeit hat kann man auch mit der BI rumspielen in dem Fall und dann nur Benachrichtigungen auf die BI Objekte legen. Halte ich aber hier nicht für die Lösung der Wahl.

Naja die Virtualisierungsinfrastruktur wird also komplett von extern betrieben und fällt öfters aus. Da würde ich mir erstmal nen neuen Provider suchen. :wink:

Wenn ich eine Dienstleistung verkaufe dann kann man sich auch mal für nen Jahr die kleinste Enterprise leisten. Das ist ja was anderes wie wenn ich meine private Infrastruktur überwache wo die CFE locker reichen sollte.

1 Like

Ich kann mir nicht vorstellen, dass sich in einem derart komplexen und durchdachten System ein simpler ICMP Request nur durch anlegen eines einzelnen Hosts überwachen lässt.

Wenn ich einen vSwitch auf einen Hostserver verknüpfe, dieser aber durch den Smart-Ping erreichbar bleibt aber der einzelne vSwitch abschmiert, dann ist der Host weiterhin als “UP” gekenntzeichnet obwohl in der Tatsache der Host eher degraded ist und auf WARN wechseln müsste. Im Prinzip möchte ich das genau so erreichen, mit dem einzelnen Unterschied das der Host keine IP hat (aktuell dauerhaft auf UP steht) und die einzelnen IPs durch hinzufügen der Service ICMP Regel getrackt werden.

In anderen Monitoringsystemen funktioniert das auch, ich kann mir nicht vorstellen, dass dieser Case hier nicht berücksichtigt wird.

Das nicht du kannst wie du ja auch schon getan hast auf ein und dem selben Objekt beliebig viele Ping Checks ansiedeln.

Der logische Denkfehler in deiner Beschreibung ist einfach, der vSwitch selbst hat keine IP und ist auch “nur” ein virtuelles Objekt einzig die dort angebundenen VMs sind IP mäßig erreichbar. Der Host auf welchem die VMs laufen sollte über seine Management IP erreichbar sein und dieser sollte bei einer Abfrage auch den korrekten Status sein Komponenten inklusive vSwitch melden können. Falls dort ein Fehler vorliegt muss der Host dies auch melden und du kannst dies im Monitoring auch als “degraded” oder halt “kaputt” darstellen.

Eine logische Parent-Child Verknüpfung für die VMs ist nur möglich falls der vSwitch selbst eine eigne IP besitzt, was nicht sein muss.

Wie schon in der ersten Antwort geschrieben hab ist deine Variante mit 1 Service hat Fehler dann Warn bei 6 Fehlern dann Crit mittels der vorhandenen Business Intelligence Funktion abbildbar.

Der Host wird nicht als OK angezeigt wenn er wirklich richtig überwacht wird - Ping ist keine richtige Überwachung - damit sind Sachen gemeint wie die ESX Integration.

Wäre interessant wer das so macht - kenne selbst keine - besser gesagt alle die ich kenne verfahren ähnlich oder genau so wie CMK.

Frage zum Ende - schon mal probiert dem vSwitch direkt alle IPs gleich zuzuweisen?
Und dann per Ping “all IPv4” oder “additional IPv4” diese mittels eines Pings abzufragen?
Hier ist es auch möglich zu definieren wie viele dieser Pings ok sein müssen für einen OK State.

Also zum Beispiel 5 von X müssen ok sein.

Dann weißt man diesen Service State einfach als Hoststate zu und hat das von dir gewünschte Ergebnis mit allen Pings auf dem Host und ab X kaputten Pings kein OK mehr.

Sieht dann im Monitoring so aus.

Die IP 127.0.0.1 welche ich dem Test Objekt gegeben hab wird nicht für den Hoststatus benutzt sondern die beiden Additional IPs welche hier konfiguriert sind.
Der Ping Check selbst sieht halt wie ein normaler Ping aus halt nur mit mehreren Adressen.

1 Like

Mit Icinga ist das beispielsweise machbar unter zu Hilfenahme von Plugins.

Deine Variante würde klappen, ist allerdings etwas unübersichtlich.

Ich habe es jetzt so gelöst, dass ich 3 Hosts angelegt habe, darunter jede IP Adresse einzeln als Servicecheck eingerichtet habe und dann mit BI Aggregationen erstellt habe um die Verfügbarkeit damit abzubilden. Das ist zwar sehr aufwändig, hat aber zum gewünschten Effekt geführt.

Jetzt muss ich nur noch rausfinden, wie ich die “DOWN” Benachrichtigungen zusammenfassen kann. Eine entsprechende Option habe ich gefunden, die zählt dann aber für ALLE Benachrichtigungen und ich möchte Sie jeweils nur HOST-Mässig zusammenführen. Da werde ich denke ich sicherlich noch was finden.

Danke für deine Hilfe :slight_smile: