Cluster Ressourcen gehen in Stale und werden nicht abgefragt

ChristianM · November 12, 2020, 3:22pm

Hallo zusammen,

ich habe das Problem bei der 1.6.0raw und Enterprise Edition, dass Clustered Services nach einiger Zeit in Stale gehen. Ist das euch auch schon aufgefallen?
Aufbau: zwei Windows Systeme als Cluster; Clustered Ressource => Filesystem; Cluster existiert mit eigener IP Adresse.
Wenn ich cmk -vv MyHost auf dem Cluster ausführe, wird der Service richtig angezeigt.
Es sieht so aus, als würden die Services, wenn sie am Cluster hängen nicht mehr abgefragt und gehen in Stale.
Kann das einer bestätigen?

Viele Grüße,
Christian

joerg.herbel · November 13, 2020, 9:57am

Hi Christian,
ich habe es gerade eben mal ausprobiert, es scheint zumindest kein allgemeines Problem zu sein in der 1.6, bei mir gehen geclusterte Services nicht auf stale.
Eine Frage: Wir haben gerade zufällig genau das Problem, aber in der 2.0. Deshalb wollte ich fragen, ob das wirklich in der 1.6 aufgetreten ist bei dir.
Viele Grüße
Jörg

ChristianM · November 13, 2020, 10:19am

Aktuell tritt das Problem bei einer 1.6.0p17 Raw auf. In der 2.0 hab ich jetzt noch nicht getestet,
Ich habe das auch in einer anderen Umgebung gehabt, dort habe ich mir mit einem Cronjob geholfen.
Es sieht für mich so aus, dass wenn ich einen Cluster abfrage, die Service Informationen für die Notes nicht ermittelt werden.

Viele Grüße,
Christian

ChristianM · November 13, 2020, 11:36am

Ich kann das Verhalten auch auf der 2.0 bestätigen.

andreas-doehler · November 13, 2020, 1:40pm

Ich hatte bisher nur Probleme bei einer bestimmten Agent/SNMP Config der beteiligten Nodes und des Cluster Objektes. @ChristianM wie schaut dies in deinem Fall aus?

ChristianM · November 16, 2020, 2:05pm

Hallo Andreas,

mein Cluster ist ein Testcluster auch zwei Windows Agenten wo testweise Filesyste C: als Cluster Ressource via Rule gewählt wurde.

Viele Grüße,
Christian

andreas-doehler · November 16, 2020, 7:57pm

Die Cluster Resource darf aber nur auf einem Node vorhanden sein.
Filesystem selbst ist glaub ich nicht “Cluster aware” als Check.
Lieber mal einen Dienst ausprobieren welcher nur auf einem Node läuft und auf dem zweiten aus ist.
Der Cluster selbst muss wie die Node auch als CMK Agent konfiguriert sein.

ChristianM · November 17, 2020, 11:46am

Hi Andreas,

das Filesystem ist schon Cluster aware. Die Konfiguration ist auch so gemacht, dass alle beteiligten System den gleichen Agent Typ haben. Es funktioniert ja auch richtig, wenn der Cluster Rescheduled wird oder du cmk aufrufst. Es sieht für mich aus, als würde einfach die Abfrage der Cluster nicht von Core oder den Helpern gemacht.

Viele Grüße,
Christian

andreas-doehler · November 17, 2020, 12:57pm

Mein großes System hier (mit über 30 Windows Clustern) läuft auf P12 und hat bisher keine dieser Probleme/Effekte.
Das sind eigentlich alles Clusters welche per Overlapping Clusters Rule mit Services versorgt werden. Im Windows gibts ja nix anderes wie Overlapping Clusters in der Regel.

ChristianM · November 17, 2020, 1:04pm

Hab das Phänomen bei beiden Arten von Clustern und Versionen > P12. Muss wohl weiter rätseln.

andreas-doehler · November 17, 2020, 1:30pm

Immerhin für mein 2.0er Testsystem mit build vom 11.11. kann ich den Fehler bestätigen.
Hab auch mal das typische Filesystem Q: (Quorum) geclustert und der Check erhält Daten für das Filesystem C: ist sehr sportlich die Annahme
Hier geht auch nix mit manuell checken da ja falsche Daten geliefert werden für den Cluster Check.

ChristianM · November 17, 2020, 1:47pm

Na wenigstens bin och nich alleine. Das muss irgendwie zwischen 1.6.0p12 und 2.0 hinein gekommen sein. Es mach auch keinen Unterschied zwischen RAW oder EE.

mana · November 19, 2020, 12:55pm

Hallo zusammen,
ich weiß nicht, ob euch die Info hilft, habe das gleiche Verhalten auch mit der 1.6.0p18 Raw festgestellt.
Ebenfalls im Zusammenhang mit Windows File Server Cluster-Diensten.

system · November 19, 2021, 12:55pm

This topic was automatically closed 365 days after the last reply. New replies are no longer allowed.