Hallo,
ich habe testweise meine Site kopiert und von Version 1.6.0p24 auf 2.0.0p5 aktualisiert.
Dabei habe ich ein Problem bei Clustern die zwei Nodes haben.
An den Clustern gibt es nur Manual Checks vom Typ State and count of processes.
Ausgabe bei Version 1.6:
clustername
STATE SERVICE ICONS STATUS DETAIL AGE CHECKED PERF-O-METER
OK Check_MK OK - execution time 0.1 sec 2021-05-17 16:10:39 - 23 d 2021-06-09 15:30:38 - 4.32 s
63.0 ms
CRIT Process BlaName CRIT - 0 processes: (ok from 1 to 1)CRIT 2021-06-09 09:29:07 - 6 h 2021-06-09 15:30:38 - 4.33 s
OK Process FaselName OK - 2 processes running on winnode1, winnode2, 784.99 MB virtual, 209.81 MB physical, 0.0% CPU, 1123 process handles, youngest running for: 15 d, oldest running for: 22 d
Bei Version 2.0 kommt die Fehlermeldung „Got no information from host“ beim Check_mk Service. Die Checks sind stale.
CRIT
Check_MK [agent] Version: 1.6.0p24, OS: windows, [piggyback] Valid sources: lxvcenter, winveeamserv, [agent] Version: 1.6.0p24, OS: windows, [piggyback] Valid sources: lxvcenter, winveeamserv, Got no information from host, execution time 9.1 sec
Ich habe schon versucht die Konfiguration zu ändern, sodass ich keine Enforced services mehr habe, also über Discovery rules → Process discovery (aber an den Nodes, nicht dem Cluster) in Kombination mit Service monitoring rules → Clustered services die Informationen an den Nodes sammeln und an den Cluster kleben…
…ABER: dann gilt die Warngrenze nicht mehr auf die Summe der Prozesse aller Nodes im Cluster sondern pro Node. Das Summary ist dann nur noch die Summe der Prozesse über alle Nodes ohne die Detailinformationen auf welcher Node der Prozess läuft.
In meinem Anwendungsfall muss ich aber bei den meisten Prozessen verhindern, dass sie in der Summe mehr als einmal laufen.
Die Frage lautet also: Wurde dieses Feature in der Version 2.0 gestrichen oder handelt es sich um einen Bug?
Vielen Dank schonmal
Wolfgang