[Release] Checkmk stable release 2.1.0p23

Dear friends of Checkmk,

the new stable release 2.1.0p23 of Checkmk is ready for download.

Warning:
This version breaks the agent receiver on IPv4-only Checkmk servers which have completely disabled IPv6 support on kernel level. This prevents host registration (cmk-agent-ctl register) and registration status queries (cmk-agent-ctl status). The issue will be fixed with the next patch release.

This maintenance release ships with 29 changes affecting all editions of Checkmk,
3 Enterprise Edition specific changes and 0 Managed Services Edition specific changes.

Support periods can be found here: Checkmk versions

Changes in all Checkmk Editions:

Agent bakery:

  • 15152 FIX: Fix crash in mk-job.solaris
  • 15149 FIX: agent_azure: Fix crash if the metric isn’t found
  • 15384 FIX: check_mk_agent: handle tabs when reading definitions from mrpe.cfg…

Checks & agents:

  • 15416 FIX: Agent receiver is accessible via IPv4 and IPv6…
  • 15385 FIX: agent_kube: ignore resource quota with no hard resource requirement…
  • 15151 FIX: azure_storageaccounts: Fix aggregation type and units in performance check…
  • 15274 FIX: brocade_fcport: wrong port speed
  • 15272 FIX: juniper_fru: support for Juniper MX2010

Configuration generation:

  • 15373 FIX: time_period: disallow builtin timeperiod as the exclude option…

Core & setup:

  • 14304 FIX: Fix global setting migration during site update…

Dynamic host configuration:

  • 14583 FIX: Fix attribute update and deletion of existing hosts…

HW/SW inventory:

  • 15095 FIX: inventory_win_exefiles: Fix uniqueness of packages…
  • 15386 FIX: solaris_psrinfo: Fix missing Hardware>Processor inventory entries

REST API:

  • 13974 FIX: Correct ruleset search documentation text…
  • 13973 FIX: Putting a service into downtime no longer requires access to the corresponding host in the REST API…
  • 15376 FIX: dcd: Fixes 2 issues with phases 1.1 & 2.4 calling incorrectly formed urls…
  • 15383 FIX: folder_config: adapt folder name pattern of get, put, delete endpoints to post endpoint
  • 15375 FIX: service_group: alias field when creating is now required…
  • 15220 FIX: time period: put endpoint now returns 200 with edited time period config…
  • 15219 FIX: time_period: disallow builtin timeperiod in timeperiod exclude…

Setup:

  • 15127 FIX: Fix host rename for hosts with parents in same folder…
  • 15126 FIX: Fix rule search for folders with same name…
  • 15238 FIX: Too restrictive permission checking in service discovery
  • 15239 FIX: Unknown services on discovery page of SNMP devices…

Setup, site management:

  • 15406 FIX: Renaming of hosts: Handle TLS agent registrations correctly…

Site management:

  • 14303 FIX: Fix “omd config” terminating after changing a setting…

User interface:

  • 15129 FIX: Fix possible lost publish configuration of visuals after saving…
  • 15128 FIX: Fix visible published visuals without permission “See user …”
  • 15130 FIX: Only execute PDF cleanup cronjob if PDF tmp directory exists…

Changes in the Checkmk Enterprise Edition:

Agent bakery:

  • 15276 FIX: agent bakery: win_script_runas: improve help

Inline SNMP:

  • 14948 FIX: Inline SNMP Backend uses credentials correctly…

The Checkmk Micro Core:

  • 12767 FIX: added tags and labels to cmcdump exported and imported data

Changes in the Checkmk Managed Services Edition:

NO CHANGES

You can download Checkmk from our download page: Download Checkmk for free | Checkmk

List of all changes: Werks

Please mail bug reports and qualified feedback to feedback@checkmk.com.
We greatly thank you for using Checkmk and wish you a successful monitoring,

Your Checkmk Team

3 Likes

Bei mir startet der agent-receiver nicht mehr nach dem Update auf 2.1.0p23.
Somit auch kein cmk-agent-ctl status mehr möglich.

Haben einen Rollback gemacht.

hier auch das gleiche verhalten auf Ubuntu 22.04 LTS Server und Update der RAW von 2.1.0p22 auf p23. Nach Downgrade von p23 auf p22 wieder ok.

Hier noch der Auszug aus der error.log vom agent-receiver


[INFO] Starting gunicorn 20.1.0
[ERROR] Retrying in 1 second.
[ERROR] Retrying in 1 second.
[ERROR] Retrying in 1 second.
[ERROR] Retrying in 1 second.
[ERROR] Retrying in 1 second.
[ERROR] Can´t connect to (‘::’, 8000)

Gruß
Frank

1 Like

Hallo,
bei mir das gleiche Verhalten,
Der agent-receiver startet nicht und die gleichen Fehler im Log.
WH

Wäre ja etwas für einen Public Bug Tracker :wink:

Hi zusammen,

ich kann den Fehler in unseren Testinstallationen bisher nicht nachstellen.
Habt Ihr ggf. mehr Input, was bei Euch ggf. anders oder speziell ist?
Habt Ihr eventuell ipv6 hart abgestellt auf dem Checkmk Server?

Ich kann nicht mehr liefern. Ist einfach alles was sofort aufgefallen ist. Der Service lässt sich starten, geht aber gleich wieder runter. Sonst ist bei uns eigentlich alles standard.

Ja, IPv6 ist ausgeschaltet.

Hi @mik kannst Du mir noch sagen, wie Du IPv6 ausgeschaltet hast?
Wir vermuten, dass es daher kommen könnte, aber ich kann es mittels Ausknipsen durch
echo 1 > /proc/sys/net/ipv6/conf/all/disable_ipv6 && omd restart SITE agent-receiver
nicht nachstellen.

Ach so, und welches OS hast Du?

Hi @gulaschcowboy ,
wir sind zwar aktuell (noch) nicht betroffen, aber wir deaktivieren auf RHEL ipv6 so:

root@xxx (cmk-master) [~]

cat /etc/sysctl.d/ipv6.conf

net.ipv6.conf.all.disable_ipv6 = 1

mit disable via grub können wir es nachstellen

GRUB_CMDLINE_LINUX_DEFAULT="ipv6.disable=1"
GRUB_CMDLINE_LINUX="ipv6.disable=1"
1 Like

@gulaschcowboy Genau, so wird bei uns IPV6 disabled - da nicht in Gebrauch.
Können wir für diese Maschine aber auch enablen… müsste aber nicht sein.

Wir sind bereits auf einer Rocky9, dies aber seit drei Wochen - war also schon ein Update dazwischen.

Thx!

Danke @mik für die Bestätigung. Müssen wir natürlich abfangen, dass ipv6 ganz weggeknipst sein kann.

1 Like

Ich glaube, die meisten tun das nicht :wink: wir überall :smiley:
danke euch.

kein IPv6 ist schon so 2001 :slight_smile:

Wir disablen es auch global :person_raising_hand:

Wir tun es überall wo wir es nicht brauchen - nicht überall :wink:

Wir haben auch GRUB_CMDLINE_LINUX="ipv6.disable=1" gesetzt. Den Parameter entfernt und der agent-receiver funktioniert wieder. Da heute sehr viele Dienste IPv6 zumindest auf localhost ::1 benötigen, kann ich damit leben. Das einzige unangenehme ist, das es nicht kommuniziert wurde, hat einige Zeit der Fehlersuche gekostet.

1 Like

…und genau das ist was wir meinten in den Gesprächen und Foren-Beiträgen:

  • p22 → Rename bug behoben - dafür DCD Error
  • p23 → DCD behoben - dafür Agent-Receiver Problem

Was kommt als nächstes?
Wie lange dauert es jetzt bis alles behoben ist?

1 Like

Um den agent-receiver zu starten ohne v6 aktivieren zu müssen, kann man auch das agent-receiver init script bearbeiten und die bind Option bei gunicorn wieder auf das alte Verhalten anpassen:

aus
-b [::]:$CONFIG_AGENT_RECEIVER_PORT \
wird
-b 0.0.0.0:$CONFIG_AGENT_RECEIVER_PORT \

Ja, das ist so. Auch nicht weiter schlimm. Maschinen werden voll automatisch konfiguriert mit vielen settings, daher ist es drin. Und geht auch gleich so schnell wieder raus.