Chrony Graph kann nicht erstellt werden

Hallo zusammen,

ich habe nun endlich mehr Zeit mich dem Graphen Problem zu widmen.
Leider wurde der alte Post geschlossen da 30 Tage lang darauf nicht geantwortet wurde.

Das Logging für RRD habe ich extra mal auf Debug gestellt.
Folgendes wird protokolliert:

2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1590113447 -e 1590127847 --step 17 CDEF:xxx= XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [4] [client 0] [rrd] Error accessing RRD: can not parse an empty rpn expression
2020-05-22 08:10:48 [7] [client 1] [rrd] retrieving RRD data: rrdtool xport -s 1590113447 -e 1590127847 --step 17 DEF:var_1=/opt/omd/sites/SITENAME/var/check_mk/rrd/HOSTNAME.bpo.DOMAINNAME.com/NTP_Time.rrd:1:MAX CDEF:xxx=var_1,0.001000,* XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1590113448 -e 1590127848 --step 162 CDEF:xxx= XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [4] [client 0] [rrd] Error accessing RRD: can not parse an empty rpn expression
2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1590037848 -e 1590127848 --step 1022 CDEF:xxx= XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [4] [client 0] [rrd] Error accessing RRD: can not parse an empty rpn expression
2020-05-22 08:10:48 [7] [client 1] [rrd] retrieving RRD data: rrdtool xport -s 1590113448 -e 1590127848 --step 162 DEF:var_1=/opt/omd/sites/SITENAME/var/check_mk/rrd/HOSTNAME.bpo.DOMAINNAME.com/NTP_Time.rrd:1:MAX CDEF:xxx=var_1,0.001000,* XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1589436648 -e 1590127848 --step 7854 CDEF:xxx= XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [4] [client 0] [rrd] Error accessing RRD: can not parse an empty rpn expression
2020-05-22 08:10:48 [7] [client 1] [rrd] retrieving RRD data: rrdtool xport -s 1590037848 -e 1590127848 --step 1022 DEF:var_1=/opt/omd/sites/SITENAME/var/check_mk/rrd/HOSTNAME.bpo.DOMAINNAME.com/NTP_Time.rrd:1:MAX CDEF:xxx=var_1,0.001000,* XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1587103848 -e 1590127848 --step 34362 CDEF:xxx= XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [4] [client 0] [rrd] Error accessing RRD: can not parse an empty rpn expression
2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1555567848 -e 1590127848 --step 392726 CDEF:xxx= XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [4] [client 0] [rrd] Error accessing RRD: can not parse an empty rpn expression
2020-05-22 08:10:48 [7] [client 1] [rrd] retrieving RRD data: rrdtool xport -s 1589436648 -e 1590127848 --step 7854 DEF:var_1=/opt/omd/sites/SITENAME/var/check_mk/rrd/HOSTNAME.bpo.DOMAINNAME.com/NTP_Time.rrd:1:MAX CDEF:xxx=var_1,0.001000,* XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1587103848 -e 1590127848 --step 34362 DEF:var_1=/opt/omd/sites/SITENAME/var/check_mk/rrd/HOSTNAME.bpo.DOMAINNAME.com/NTP_Time.rrd:1:MAX CDEF:xxx=var_1,0.001000,* XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock
2020-05-22 08:10:48 [7] [client 0] [rrd] retrieving RRD data: rrdtool xport -s 1555567848 -e 1590127848 --step 392726 DEF:var_1=/opt/omd/sites/SITENAME/var/check_mk/rrd/HOSTNAME.bpo.DOMAINNAME.com/NTP_Time.rrd:1:MAX CDEF:xxx=var_1,0.001000,* XPORT:xxx: --daemon /omd/sites/SITENAME/tmp/run/rrdcached.sock

Dieses Verhalten habe ich auf allen Hosts die von ntpd auf chrony umgestellt wurden.
Aktuell sind es nur 3 Stück aber weitere 60 werden noch umgestellt und würde gerne für das Problem vorher eine Lösung mit Euch zusammen finden.

Gruß Micha

Wenn ich das richtig sehe produziert Chrony genau nur einen Performance Wert - “Offset”.
Dieser wird bei dir ja auch richtig angezeigt.
Das Problem liegt bestimmt darin begründet, dass es früher mal Daten vom check_ntp bei diesem Service vorlagen. Dieser hatte zwei Werte - “Offset” und “Jitter”.

Im Endeffekt müsst mal aus dem RRD File die zweite obsolete Datenreihe “raus operiert” werden.
Oder für einen Test mal die dazugehörigen RRD Dateien weg kopieren und danach mal neu anlegen lassen und schauen ob nur noch eine Datenreihe existiert.

Das Tool für die Manipulation der Daten wäre dann “rrdtool tune …”

Hallo Andreas,

RRD Datei “wegwerfen” habe ich schon gemacht. Habe alles was ich mit NTP zu dem Host finden konnte gelöscht und die Services neu Discovern lassen.

Bei einem funktionierenden Host mit Chrony gibt es auch 2 Graphen, Offset und Stratum.

Gruß Micha

Ok ich sehs grad hab scheinbar bisl schief geschaut.
In dem Fall kann ich leider auch erstmal nicht weiter helfen.

In dem Fehlerprotokoll stehen da bei den CDEF und XPORT Statements überall “xxx” drin?
Vor allem wenn nach “CDEF:xxx=” nix weiter kommt ist auch klar, dass ein Fehler produziert wird da dies eine ungültige/leere rpn ist, wie auch im Fehler steht.

Hallo Andreas,

ja da steht überall xxx.

Vielleicht schaut noch jemand über diesen Post mit einer Idee was ich noch testen könnte.

Schöne Grüße aus Kamenz
Micha

Hallo zusammen,

hat jemand noch eine Idee?

Gruß Micha

Leider nur ein paar vage Ideen …
Ist das Checkmk Enterprise oder Raw? welche Version?
Daten je nachdem unter ~/var/check_mk/rrd/FQDN/NTP_Time.*
oder var/pnp4nagios/perfdata/FQDN/NTP_Time*

Hast du dort auch die NTP_Time.info bzw. NTP_Time.xml beiseite geschoben? vermutlich am besten bei gestopptem rrdcached. Wird sie neu angelegt? Unterschied zu vorher bzw. Unterschied zu einem Host mit funktionierenden Graphen?

Hallo Martin,

es handelt sich um die Enterprise Version 1.5p24
Beide Dateien bei gestoppter Site entfernt und werden auch neu erstell.

So sollte es aussehen:

Gruß Micha

Die NTP_Time.info wurde also auch gelöscht und automatisch neu angelegt? Sieht man darin einen Unterschied zu einem funktionierenden Host?

Sorry, bin sonst leider auch ziemlich ratlos. Bei meinen wenigen Graphen-Problemen hat die Holzhammer-Methode “alles löschen und neu anlegen lassen” bisher funktioniert.

Ja wurde auch gelöscht und der Unterschied ist die Reihenfolge.
Diese sind aber auch in der RRD Datei wohl unterschiedlich.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.