Linux Upgrade mit Problem (2.1.0p18.cre)

CMK version: 2.1.0p18
OS version: openSUSE Leap 15.4

Error message: Return code of 126 is out of bounds - plugin may be missing

Hallo zusammen,

ich habe ein System

von openSUSE Leap 15.2 und check-mk-raw-2.1.0p18-sles15sp2

nach den Tipps aus der checkmk DOKUMENTATION > 3.3 Updates > Update auf Version 2.1.0 > 2.2. Linux-Distributionsversionen

auf

openSUSE Leap 15.4 und check-mk-raw-2.1.0p18-sles15sp4““

geupgraded.

Da die Seite nicht gleich erreichbar war, musste der Apache neu gestartet werden:

service apache2 restart

Es haben drei Hosts den Status „DOWN“ und alle anderen den Status „UNREACH“.

Im Summary von allen steht: „(Return code of 126 is out of bounds - plugin may be missing)“.

Die Services werden durch Rescan oder Tabula Rasa erfolgreich gefunden.

Die Hosts antworten auf ping.

Ältere Beiträge empfehlen als Lösung das Setzen des SUID-Bits für

/omd/versions/default/lib/nagios/plugins/check_icmp

Das wundert mich, denn ich habe parallel eine Instanz laufen, die nicht durch OS-Update, sondern frisch aufgesetzt wurde und auf dem gleichen Stand (gleiche Hardware) ist und auf einem Restore der anderen Instanz basiert. Die Berechtigungen für das check_icmp sind original ohne SUID (wie auf dem Problemserver). Alles läuft prima.

Hat jemand eine Idee, wie ich das System noch retten kann? Oder ist es hin?

Habe ich in der Doku was übersehen, das man beim OS-Upgrade speziell beachten muss bzw. nacharbeiten kann?

Das Upgrade auf SLES15SP4 hat bei uns auch zu diversen Problemen geführt, u.a. gibts grosse Probleme mit SSL-Libraries was unsere ganze Userauthentication zerschossen hat. Ein Ticket ist dazu schon bei Tribe29 in Bearbeitung. Ich vermute, dass das bei Opensuse mit dem geleichen Releasestand nicht anders sein wird.

Dein konkretes Problem ist bei uns nicht aufgetreten. Bei vielen Probleme nach dem Update hat bei uns geholfen, die Variable LD_LIBRARY_PATH des Site-Users zu leeren womit er dann die des OS nimmt.

Versuche bitte mal, in der Datei

~/etc/enviroment

folgendes einzutragen

LD_LIBRARY_PATH=""

Starte danach mal die Site durch.

Vielen Dank für den Tipp.
Leider hilft er bei mir nicht, denn die startende Instanz findet dann diverse libs nicht, die CheckMK mitbringt:
omd start
Starting rrdcached…/omd/sites/cmk_buero/bin/rrdcached: error while loading shared libraries: librrd.so.8: cannot open shared object file: No such file or directory
Error
Starting npcd…OK
Starting nagios…OK
Starting apache…httpd2-prefork: Syntax error on line 236 of /omd/sites/cmk_buero/etc/apache/apache.conf: Syntax error on line 2 of /omd/sites/cmk_buero/etc/apache/conf.d/01_wsgi. conf: Cannot load /omd/sites/cmk_buero/lib/apache/modules/mod_wsgi.so into server: libpython3.9.so.1.0: cannot open shared object file: No such file or directory
…ERROR

omd status
agent-receiver: running
mkeventd: running
rrdcached: stopped
npcd: running
nagios: running
apache: stopped
redis: running
crontab: running

Overall state: partially running

Hallo zusammen,

Es treten immer wieder Ungereimtheiten auf, die ich meist auch irgendwie beheben konnte.

Die Ursache sehe ich im Update von openSUSE, dass bei Upgrades häufiger neue User und Gruppen mitbringt, die dann IDs bekommen, die vorher der CheckMK-Instanz zugeordnet waren.

Solange CheckMK IDs im Systembereich vergibt (< 1000), kann das immer wieder passieren und solange werde ich auch nie wieder versuchen, das Betriebssystem des CheckMK-Servers auf eine neue Version zu heben und belasse es maximal bei Updates.

Gelöst habe ich mein Problem nun mit Neuinstallation des Server und Backup/Restore des ChecMK, was tadellos funktionierte.

This topic was automatically closed 365 days after the last reply. New replies are no longer allowed. Contact an admin if you think this should be re-opened.