Hallo Check_mk Freunde,
heute muss ich mich mal wieder an euch wenden.
Wir setzen ein Distributed Monitoring aus physischer Appliance und virtueller Appliance auf VMware ohne UEFI ein.
Die Virtuelle Appliance wollen wir nun gern von VMware nach Proxmox umziehen.
Dazu haben wir uns dem integrierten Backup and Restore der virtuellen Appliance und Site bedient.
Wir haben auf Proxmox eine neue VM mit UEFI gemacht wie in der Dokumentation beschrieben und diese wiederhergestellt.
Der Prozess schlägt fehl. Die Appliance läuft bekommt dann eine neue Ethernet Schnittstelle, aber die Site kommt nicht hoch und bleibt am stunnel service start hängen. Aus dem Log der Appliance sieht man aber nicht wo es klemmt.
Nun haben wir weil wir nicht gleich weiter wussten in der Site ein Site-Backup gemacht und auf einer laufenden virtuellen Appliance einfach ein Site Restore gemacht. Der Restore ist erfolgreich und grün aber die Site kommt trotzdem nicht hoch und hängt wieder beim stunnel service start.
Nun haben wir probeweise die Site auf der physikalischen Appliance wiederhergestellt und das ging schnell und tadellos und danach läuft die Site sofort.
Version der Appliance 1.7.10
Version der Sites 2.4.0p5
Jemand eine Idee wo es klemmen könnte und was wir prüfen sollten? Eine Site müsste ja eigentlich auf jeder beliebigen Appliance wiederhergestellt werden können oder? Dort ist ja die zugrunde liegende Maschine egal.
generell würde ich empfehlen die Backups der Site auf der CLI mit omd zu machen. Mit der GUI haben wir da schlechte Erfahrung gemacht.
Wenn nur der STUNNEL nicht hoch kommt kannst Du in /omd/sites//etc/stunnel/server.conf mal debug = auf 6 stellen und dann nach einem Startversuch in ~/var/log/stunnel nachsehen ob da was steht.
Das ganze gibts auch noch spezifisch für den livestatus service in /omd/sites//etc/stunnel/conf.d/01-livestatus.conf
Danke für die Antwort.
Ich hab das gleich mal mit der Console gemacht.
Also sprich ein omd backup und omd restore bei angehaltener Site.
Es passiert genau das gleiche.
Was ich aber nicht richtig geschaut hatte war der Dienst.
Der Start geht bis zum rabbitmq und dort bleibt der dann stehen.
Gib mal bitte auf der CLI ‘omd status’ ein.
Der GUI kann man nicht trauen
Dem screenshot zufolge läuft alles ausser stunnel, piggyback, xinetd und crontab. Schau auch mal in deren log files ob da was zu sehen ist.
Ich würde mal wie oben den debug mode von stunnel aktivieren und dann stunnel mit ‘omd start stunnel’ starten, Danach mal einen Click ins log file werfen.
Notfalls in dem config file von stunnel foreground=yes hinzufügen und stunnel auf der cli starten:
stunnel /omd/sites//etc/stunnel/server.conf
Evtl. gibts da was zu sehen.
Nach dem Muster würde ich die anderen services die nicht starten auch behandeln insofern sich das Problem nicht schon behoben hat.
Zumindest bis zur 2.3 hatte ich nie Probleme mit dem Backup und ich benutze das gleiche Backup auf unterschiedlichen Plattformen erfolgreich.