DUP Meldungen beim Ausführen des Ping Kommandos auf CMK Sites

**CMK version:2.0.0p18 (CEE)
**OS version:RHEL 7.9

Hi,
ich habe mal wieder ein skurriles Problem, welches ich in meiner langen IT-Laufbahn noch nie gesehen habe.

Ich weiß auch nicht seit wann das so ist, oder ob es schon immer so war.
Ich habe ein distributed Environment mit 8 Remote Sites und einem Master. Die Sites laufen alle auf RHEL 7.9.

Wenn ich auf einer der Sites ein beliebiges anderes System anpinge, dann bekomme ich sporadische Rückmeldungen von komplett anderen Systemen. Diese Systeme, die da hin und wieder antworten, werden von der jeweiligen Site gemanaged, auf der ich das Ping Kommando ausführe.
Das ganze sieht dann auf der commandline wie folgt aus:

Wed Nov 16 10:10:25 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=226 ttl=63 time=0.253 ms
Wed Nov 16 10:10:26 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=227 ttl=63 time=0.231 ms
Wed Nov 16 10:10:27 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=228 ttl=63 time=0.234 ms
Wed Nov 16 10:10:27 CET 2022: 64 bytes from host2.foo.local (15.45.42.15): icmp_seq=1 ttl=61 time=0.675 ms (DUP!)
Wed Nov 16 10:10:28 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=229 ttl=63 time=0.255 ms
Wed Nov 16 10:10:29 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=230 ttl=63 time=0.408 ms
Wed Nov 16 10:10:30 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=231 ttl=63 time=0.221 ms


Wed Nov 16 10:14:36 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=477 ttl=63 time=0.266 ms
Wed Nov 16 10:14:37 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=478 ttl=63 time=0.224 ms
Wed Nov 16 10:14:38 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=479 ttl=63 time=0.250 ms
Wed Nov 16 10:14:39 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=480 ttl=63 time=0.254 ms
Wed Nov 16 10:14:39 CET 2022: 64 bytes from host5.foo.local (15.25.12.17): icmp_seq=1 ttl=61 time=0.536 ms (DUP!)
Wed Nov 16 10:14:40 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=481 ttl=63 time=0.251 ms
Wed Nov 16 10:14:41 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=482 ttl=63 time=1.87 ms
Wed Nov 16 10:14:42 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=483 ttl=63 time=0.336 ms


Wed Nov 16 10:18:47 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=728 ttl=63 time=0.218 ms
Wed Nov 16 10:18:48 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=729 ttl=63 time=0.368 ms
Wed Nov 16 10:18:49 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=730 ttl=63 time=0.259 ms
Wed Nov 16 10:18:50 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=731 ttl=63 time=0.395 ms
Wed Nov 16 10:18:51 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=732 ttl=63 time=0.265 ms
Wed Nov 16 10:18:51 CET 2022: 64 bytes from host200.foo.local (15.11.7.181): icmp_seq=1 ttl=61 time=0.493 ms (DUP!)
Wed Nov 16 10:18:52 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=733 ttl=63 time=0.316 ms
Wed Nov 16 10:18:53 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=734 ttl=63 time=0.282 ms
Wed Nov 16 10:18:54 CET 2022: 64 bytes from host1.foo.local (15.52.51.76): icmp_seq=735 ttl=63 time=0.306 ms

Die Zeilen haben dann - warum auch immer - ein DUP hinten dran, obwohl weder DNS Name noch IP gleich sind.

Kann es sein, dass das Ping Kommando irgendwie meinen manuellen Ping mit Pings des CMK Cores vermischt?

Jemand Ideen?

VG
Christian

Ja, das ist gut möglich.

Das DUP hat nichts mit dem DNS Namen oder der IP-Adresse in der Antwort zu tun. Es ist ein Mechanismus, der aufdecken soll, dass potenziell verschiedene Systeme auf ein- und denselben ICMP Echo Request mit einem Echo Reply antworten. Dazu gibt es im ICMP Echo Request/Reply Header zwei 16-Bit Felder: Identifier und Sequence Number. Diese Felder werden im Echo Reply dupliziert, so dass der Sender diese einem Echo Request zuordnen kann.

Womit genau diese Felder befüllt werden, ist nicht exakt spezifizert. Üblicherweise ist aber der Identifier pro Ping-Kommando immer gleich, oft wird die PID des Ping Prozesses genutzt. Die Sequence Number beginnt bei Null und wird mit jedem einzelnen Echo Request um eins erhöht.

Du hast offenbar einen lange laufenden Ping (deinem Listing nach über 10 Minuten). In dieser Zeit sendet der CMC Smart Ping Mechanismus auf einem gut ausgelasteten System vermutlich viele Pings zu unterschiedlichen Zielen und mit verschiedenen Identifiern. Die Wahrscheinlichkeit, dass dabei auch mal der gleiche Identifier wie in dem lange laufenden Ping Kommando verwendet wird, ist durchaus vorhanden. In diesem Fall betrachtet das Ping-Kommando den empfangenen Echo Reply als verzögerte zweite Antwort auf einen lange zurück liegenden Echo Request und stellt ein DUP hintenan.

Meines Erachtens kein Grund zur Besorgnis.

2 Likes

Wenn der SmartPing gestoppt ist dürfte das Verhalten nicht auftreten.
Falls trotzdem dann gibt es eher ein Netzwerkproblem.
@CFriedrich das würde dann mit deinem anderen Thread mit verlorenen Pings zusammen passen.

Hi Heavy, danke für diese super ausführliche Antwort. Das wusste ich noch nicht (offensichtlich :smiley: )
Danke!

Hi Andreas, ja über dieses Ping Problem bei dem einen System bin ich überhaupt erst auf diese DUP Meldungen gestoßen. Komischerweise verschwanden diese Probleme mit dem Knoten, nachdem ich ihn an eine andere Site gehangen habe. Ich werde das System aber nochmal an die vorherige Site hängen, um zu schauen, ob checkmk ja dann wieder Probleme mit der Erreichbarkeit hat.
Danke für die Unterstützung.

This topic was automatically closed 365 days after the last reply. New replies are no longer allowed. Contact an admin if you think this should be re-opened.