Site backup failed: Failed to perform backup: [Errno 104] Connection reset by peer

Just upgraded to 2.0.0p2 but still backup problem, it komes a bit longer, but now I have snmp check_mk craches on cisco 5525x firewall :frowning:
So might have to go back to 2.0.0p1 for that an hope fore som backup fix in p3

You can test p3 now yesterday released :slight_smile:

Der Fehler ist nach wie vor. Hab mir mal mal meine private CheckMK Instanz angeguckt, die seit Jahren ohne Probleme lÀuft: Dort hab ich den Fehler auch: Connection reset by peer.

Vor einigen Jahren war schon mal so ein Bug mit “Connection reset
” drin und das Team konnte es damals fixen.

Edit:
Das Problem besteht mit der p3 auch noch - das automatische Backup lief beim ersten Anlauf durch, das manuelle Backup danach gab ein “Connection reset by peer”

Und die Berechtigungen auf die nötigen Directories und Files stimmen?
Liegt ev. noch ein Lockfile rum, welches das Backup verhindert?
Darf in das gewĂŒnschte Backupdir geschrieben werden?

Ja da passt alles - auf meiner Home CheckMK Instanz lief das seit Jahren problemlos. Erst seit dem Update auf 2.0.0 scheint das Probleme zu machen. Die Berechtigungen stimmen soweit alle

ich hab ein internes Ticket angelegt. Wir schauen uns das an

1 Like

Ich weiß nicht, welche Versionen bisher als betroffenen gelistet sind, aber ich sehe den selben Fehler in der virt. Appliance 1.4.13 mit CME 2.0.0.p3.

@edit: Der Fehler scheint bei uns einmalig aufgetreten zu sein. Nun lÀuft das Backup seit ein paar Tagen ohne Probleme.
@nextedit: Fehler ist wieder da seit drei Tagen, diesmal schlÀgt jedes automatische und manuelle Backup fehl.
@onemoreedit: Scheinbar sind sowohl Appliance Backup als auch Site Backup betroffen. Immer die gleiche Fehlermeldung wie im Titel (Errno 104). Ich bin nicht sicher, ob es damit immer noch ein Bug sein kann, aber ich habe am Backup auch keine spannenden Einstellungen vorgenommen.

Also, related: Backups don't work with 2.x.

@_rb gibt es schon Neuigkeiten? Ich bekomme nun auch tÀglich den Fehler beim automatischen Backup der Appliance.

Wir arbeiten grad an einem Fix fĂŒr CentOS/RedHat.
Dass du auch mit der Appliance Probleme hast gebe ich mal weiter

1 Like

Danke!
Habe meinen vorherigen Beitrag nochmal ergÀnzt um den aktuellen Status sauber abzubilden.
Wenn ich irgendwas zuliefern kann, lass es mich wissen.

Wir haben dasselbe Problem seit heute Nacht. Sowohl automatisch als manuell dasselbe Problem. Wenn ich das vorhandene Backup lösche, klappt das erste Backup einmalig. Danach immer derselbe Fehler.

grafik

Ubuntu 18.04, Checkmk Version 2.0.0p3.cee
War vor einigen Wochen eine Neuinstallation mit 2.0.0.cee.

Wenn ich die RRD-Dateien aus der Sicherung rausnehme, funktioniert das Backup.

Upgraded to 2.0.0p3.cre but still no working backup, same problem :frowning:

Hmm. Habe 2.0.0p3 (CRE) unter openSUSE Leap 15.2 installiert und möchte per backup/restore auf andere Hardware umziehen. Schade, dass dabei die RRDs nicht mitkommen.
Mit omd backup erhalte ich “Failed to perform backup: [Errno 104] Connection reset by peer” und ĂŒber Setup > Maintenance > Backups heißt es “Site backup failed: Failed to perform backup: [Errno 104] Connection reset by peer”.
Keine Kompression, keine VerschlĂŒsselung. Die Berechtigungen sind OK, denn ohne RRDs funktioniert’s.
Ist da ein bestimmter Dienst nicht erreichbar?

Hab’ noch ein wenig getestet:
Als User root funktioniert es (# omd backup ) - als Site User nicht.
Dabei ist es unerheblich, ob die lokale Firewall an oder aus ist, ob die Site als root oder als Site User gestartet wurde und ob --no-compression benutzt wird, oder nicht. Und das alles in verschiedenen Kombinationen.
Das Zielverzeichnis liegt natĂŒrlich außerhalb der Site - Struktur und ist vom Site User beschreibbar.

Das Problem zur Zeit ist die laufende Site und dort genauer gesagt der RRDCached.
FĂŒr einen Umzug einfach die Site stoppen und dann ein Backup erstellen das geht immer. Oder gleich per ssh and backup/restore command umziehen.

Stimmt - die root Variante klappt bei laufender Site auch nicht immer.
Mit dem work around ist erstmal eine Lösung da.
Vielen Dank fĂŒr die Info.

A ver tiznaos! no funciona la parte de omd backup SITE, pero desde dentro del site si se puede hacer un cmk backup.

OMD[SEM]:~/tmp$ cmk --backup BCK20210517.tar.gz
OMD[SEM]:~/tmp$ ls -l
total 35700
-rw-rw---- 1 SEM SEM 83815 May 17 11:27 BCK20210517.tar.gz

Liegen die rrd files bei der betroffenen site zufÀllig noch in var/pnp4nagios/perfdata ?

Ist bei mir der Fall, ist auch eine Site die von 1.6 geupdated wurde.
Habe eben mal bei einer frisch mit 2.0.0p3 angelegten Site geschaut, da liegen die Dateien im gleichen Verzeichnis, also auch unter ~/var/pnp4nagios/perfdata.

Da kann ich nix zu sagen. Es ist nur meine Erfahrung bisher egal wenn ein Site Backup fehl schlÀgt liegt es immer daran, dass entweder sich Dateien beim Backup Vorgang Àndern - rrdcached schreibt Dateien.

Gute Nachrichten zum Wochenende
 :sun_with_face:
Das Problem wird mit Werk #10246 ab der Version 2.0.0p5 behoben.

6 Likes