Ich erhalte seit kurzem folgende Fehlermeldung bei einer via ‘Distributed Monitoring’ hinzugefügten Site:
Cannot connect to 'tcp:host:6557': [Errno 114] Operation already in progress
Ich habe bereits ein Update beider Checkmk-Instanzen durchgeführt, die omd-sites neugestartet, die Maschinen selbst neugestartet… Es sind darüber hinaus auch auf beiden Systemen alle Updates installiert.
kannst du bitte prüfen, ob Port 6557 schon belegt ist?
Wenn du auf einem System mehrere Sites anbinden möchtest, musst du z.B. 6558 für die zweite Site nehmen.
danke für die schnelle Rückmeldung. Falls du mit “einem System” meine (Haupt)-Instanz meinst: Ja, dort ist in der Tat eine weitere (Kunden)-Site (auch remote) ebenfalls angebunden.
Auf den Kunden-Sites läuft nur Checkmk, nur eine Site je Kunde – auf meinem System läuft auch nur Checkmk, jedoch mit 2 Sites (test/prod) und in der prod-Site sind zwei Kunden via Livestatus/Distributed Monitoring angebunden.
Ich mag mich irren, aber das hat soweit ich mich erinnern kann anfangs wunderbar so funktioniert. Gab es hier eventuell eine Änderung in einem der kürzlich erfolgten Updates?
Bevor ich mich jetzt doof ausgedrückt habe: Alle drei Sites laufen auf anderen Servern – es sind zwei unabhängige Kundennetze sowie mein Server an einem anderen Standort. Die beiden Kunden-Instanzen waren via Livestatus an meine Instanz angebunden.
Dies auch bis vor einer Weile (bin nicht sicher wann, habe Checkmk nach einem anfänglichen intensiven Test dann erstmal beiseite legen müssen) problemlos gelaufen.
sorry, dann habe ich das falsch verstanden.
Ich habe im Forum eben einen passenden Artikel gefunden:
Das würde ich mal probieren.
Schau dir auch unseren Artikel zu Distributed Monitoring und Livestatus an. Dort bekommst du noch weitere Analyse Möglichkeiten.
ich hatte den Artikel auch schon gesehen und auch einen Fehler in der Netzwerkkonfiguration vermuetet – konnte ihn aber bis eben nicht finden. Da ich nun auch beim Aufruf der Zertifikats-Einstellungen folgende Meldung bekam, bin ich dem nochmal auf den Grund gegangen.
Failed to fetch peer certificate ([Errno 110] Connection timed out)
Siehe da: Port 6557 war im Router nicht weitergeleitet. (Bei diesem Kunden ist derzeit leider noch Double-NAT vorhanden, daher hatte ich das übersehen.)