[Check_mk (deutsch)] Resource temporarily unavailable

Hallo,

hin und wieder aber immer öfter kriege ich beim Aktivieren der Changes im WATO folgenden Fehler:

Cannot connect to event daemon via /omd/sites/DMG/tmp/run/mkeventd/status: [Errno 11] Resource temporarily unavailable

Installiert ist OMD - Open Monitoring Distribution Version 1.2.7i2p2.cee und verwendet wird der cmc als core. Auf dem Gerät werden etwa 1400 Hosts und 35000 Services überwacht.

Nach mehrmaligen Versuchen funktioniert das Aktivieren. Hat jemand eine Idee wodurch der Fehler entsteht und wie ich das beheben kann?

Mit freundlichen Grüßen / Kind regards

Hallo Jonas,

wie ist der OMD Host denn ausgestattet und was sagen de PerfGraphen des Hosts aus?

HW oder VM?
CPUs/Cores?
Speicher?
HDD/RaidLevel?
Host/Service Check Intervall?

CPU Util und Load?
Mem Util?

Grüße,
Marcel

···

Rabe Jonas jonas.rabe@dmgmori.com schrieb am Sa., 21. Nov. 2015 13:33:

Hallo,

hin und wieder aber immer öfter kriege ich beim Aktivieren der Changes im WATO folgenden Fehler:

Cannot connect to event daemon via /omd/sites/DMG/tmp/run/mkeventd/status: [Errno 11] Resource temporarily unavailable

Installiert ist OMD - Open Monitoring Distribution Version 1.2.7i2p2.cee und verwendet wird der cmc als core. Auf dem Gerät werden etwa 1400 Hosts und 35000 Services überwacht.

Nach mehrmaligen Versuchen funktioniert das Aktivieren. Hat jemand eine Idee wodurch der Fehler entsteht und wie ich das beheben kann?

Mit freundlichen Grüßen / Kind regards

Jonas Rabe

GILDEMEISTER Beteiligungen GmbH
Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806
Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes


checkmk-de mailing list

checkmk-de@lists.mathias-kettner.de

http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de

…davon mal abgesehen ist die Innovation Release nicht für den Produktiv betrieb gedacht und deine Version ist nicht die Aktuelle…

···

Marcel Schulte schulte.marcel@gmail.com schrieb am Sa., 21. Nov. 2015 13:42:

Hallo Jonas,

wie ist der OMD Host denn ausgestattet und was sagen de PerfGraphen des Hosts aus?

HW oder VM?
CPUs/Cores?
Speicher?
HDD/RaidLevel?
Host/Service Check Intervall?

CPU Util und Load?
Mem Util?

Grüße,
Marcel

Rabe Jonas jonas.rabe@dmgmori.com schrieb am Sa., 21. Nov. 2015 13:33:

Hallo,

hin und wieder aber immer öfter kriege ich beim Aktivieren der Changes im WATO folgenden Fehler:

Cannot connect to event daemon via /omd/sites/DMG/tmp/run/mkeventd/status: [Errno 11] Resource temporarily unavailable

Installiert ist OMD - Open Monitoring Distribution Version 1.2.7i2p2.cee und verwendet wird der cmc als core. Auf dem Gerät werden etwa 1400 Hosts und 35000 Services überwacht.

Nach mehrmaligen Versuchen funktioniert das Aktivieren. Hat jemand eine Idee wodurch der Fehler entsteht und wie ich das beheben kann?

Mit freundlichen Grüßen / Kind regards

Jonas Rabe

GILDEMEISTER Beteiligungen GmbH
Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806
Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes


checkmk-de mailing list

checkmk-de@lists.mathias-kettner.de

http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de

Hallo Marcel,

danke für deine Antwort. Das Gerät ist ein Hardware Host.

CPU: Intel(R) Xeon(R) CPU E5-2650 v2 @ 2.60GHz (32 cores) (average load über 1 Minute / CPU ultilization war in den letzten 6 Monaten
nie über 25% / 35%)

RAM 32 GB verbaut, 48 GB virtueller RAM (bei Spitzen bis 25 GB belegt)

HDD (als RAID 10 Verbund): hat noch 152 GB = 36% frei

Die meisten Checks haben ein Check Intervall von einer Minute.

Ich werde die Tage mal auf die neuste Version patchen.

Mit freundlichen Grüßen / Kind regards

···

Marcel Schulte schulte.marcel@gmail.com schrieb am Sa., 21. Nov. 2015 13:42:

Hallo Jonas,

wie ist der OMD Host denn ausgestattet und was sagen de PerfGraphen des Hosts aus?

HW oder VM?
CPUs/Cores?
Speicher?
HDD/RaidLevel?
Host/Service Check Intervall?

CPU Util und Load?
Mem Util?

Grüße,
Marcel

Rabe Jonas jonas.rabe@dmgmori.com schrieb am Sa., 21. Nov. 2015 13:33:

Hallo,

hin und wieder aber immer öfter kriege ich beim Aktivieren der Changes im WATO folgenden Fehler:

Cannot connect to event daemon via /omd/sites/DMG/tmp/run/mkeventd/status: [Errno 11] Resource temporarily
unavailable

Installiert ist OMD - Open Monitoring Distribution Version 1.2.7i2p2.cee und verwendet wird der cmc als core. Auf dem
Gerät werden etwa 1400 Hosts und 35000 Services überwacht.

Nach mehrmaligen Versuchen funktioniert das Aktivieren. Hat jemand eine Idee wodurch der Fehler entsteht und wie ich
das beheben kann?

Mit freundlichen Grüßen / Kind regards

Jonas Rabe

GILDEMEISTER Beteiligungen GmbH

Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806

Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes

GILDEMEISTER Beteiligungen GmbH
Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806
Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes


checkmk-de mailing list

checkmk-de@lists.mathias-kettner.de

http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de

Hallo Jonas,

mit den “üblichen Verdächtigen” hat es damit dann wohl nicht zur Erklärung gereicht :wink:

Mir fällt noch ein, dass es vielleicht an fehlenden Helpern oder Ähnlichem liegen könnte. Monitore ihr diese Werte? Ich habe mal einen Check geschrieben, der wichtige Statistiken des CMC überwacht und grafisch darstellt. Bei Bedarf stelle ich den gerne bereit, nur wird das wahrscheinlich vor Montag nichts, das Wochenende gehört dann doch eher der Familie…

Als Letztes… Wir hatten schonmal Probleme weil zu viele Discovery- und/oder HW-Inventory-Checks liefen. Beide Typen haben wir daraufhin auf 24h eingestellt (wie der Wert vorher war weiß ich nicht mehr). Wenn allerdings jemand z.B. ein Bulk-Inventory über alle Server laufen lässt werden alle die Checks vom Core wieder auf “jetzt in 24h” geplant. Um das zu verhindern werden alle 24h alle diese Checks per Cronjob neu und gleichmäßig verteilt über die nächsten 23h geplant. Auch diese Jobs kann ich Montag zur Verfügung stellen :wink:

Grüße,
Marcel

···

Rabe Jonas jonas.rabe@dmgmori.com schrieb am Sa., 21. Nov. 2015 15:31:

Hallo Marcel,

danke für deine Antwort. Das Gerät ist ein Hardware Host.

CPU: Intel(R) Xeon(R) CPU E5-2650 v2 @ 2.60GHz (32 cores) (average load über 1 Minute / CPU ultilization war in den letzten 6 Monaten
nie über 25% / 35%)

RAM 32 GB verbaut, 48 GB virtueller RAM (bei Spitzen bis 25 GB belegt)

HDD (als RAID 10 Verbund): hat noch 152 GB = 36% frei

Die meisten Checks haben ein Check Intervall von einer Minute.

Ich werde die Tage mal auf die neuste Version patchen.

Mit freundlichen Grüßen / Kind regards

Jonas Rabe

From: Marcel Schulte [mailto:schulte.marcel@gmail.com]
Sent: Saturday, November 21, 2015 1:45 PM
To: Rabe Jonas jonas.rabe@dmgmori.com; checkmk-de@lists.mathias-kettner.de
Subject: Re: [Check_mk (deutsch)] Resource temporarily unavailable

…davon mal abgesehen ist die Innovation Release nicht für den Produktiv betrieb gedacht und deine Version ist nicht die Aktuelle…

Marcel Schulte schulte.marcel@gmail.com schrieb am Sa., 21. Nov. 2015 13:42:

Hallo Jonas,

wie ist der OMD Host denn ausgestattet und was sagen de PerfGraphen des Hosts aus?

HW oder VM?
CPUs/Cores?
Speicher?
HDD/RaidLevel?
Host/Service Check Intervall?

CPU Util und Load?
Mem Util?

Grüße,
Marcel

Rabe Jonas jonas.rabe@dmgmori.com schrieb am Sa., 21. Nov. 2015 13:33:

Hallo,

hin und wieder aber immer öfter kriege ich beim Aktivieren der Changes im WATO folgenden Fehler:

Cannot connect to event daemon via /omd/sites/DMG/tmp/run/mkeventd/status: [Errno 11] Resource temporarily
unavailable

Installiert ist OMD - Open Monitoring Distribution Version 1.2.7i2p2.cee und verwendet wird der cmc als core. Auf dem
Gerät werden etwa 1400 Hosts und 35000 Services überwacht.

Nach mehrmaligen Versuchen funktioniert das Aktivieren. Hat jemand eine Idee wodurch der Fehler entsteht und wie ich
das beheben kann?

Mit freundlichen Grüßen / Kind regards

Jonas Rabe

GILDEMEISTER Beteiligungen GmbH

Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806

Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes

GILDEMEISTER Beteiligungen GmbH
Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806
Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes


checkmk-de mailing list

checkmk-de@lists.mathias-kettner.de

http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de

Hallo Marcel,

die Helper des CMC werden hier noch nicht monitored. Aber im Snap-In „Micro Core Statistics“ steht im Moment Livestatus usage: 0.5%,
Check Helper usage: 25.4% und Check_MK helper usage: 67.3%. Kann es sein, dass die Helper zu Peakzeiten überlastet sind?
Hier die aktuelle Konfiguration:

Maximum concurrent active checks - 30

Maximum concurrent Check_MK checks - 100

Maximum concurrent Livestatus connections – 20

Ich kann man probieren ob der Fehler seltener auftritt wenn man diese Werte einfach mal erhöht.

Dein CMC Check wird bei der Eingrenzung helfen. Kannst du mir diesen zuschicken?

Das neu verteilen aller Checks mittels Cronjob verstehe ich nicht, wie sieht meinst du das?

Mit freundlichen Grüßen / Kind regards

···

Rabe Jonas jonas.rabe@dmgmori.com schrieb am Sa., 21. Nov. 2015 15:31:

Hallo Marcel,

danke für deine Antwort. Das Gerät ist ein Hardware Host.

CPU: Intel(R) Xeon(R) CPU E5-2650 v2 @ 2.60GHz (32 cores) (average load über 1 Minute / CPU ultilization
war in den letzten 6 Monaten nie über 25% / 35%)

RAM 32 GB verbaut, 48 GB virtueller RAM (bei Spitzen bis 25 GB belegt)

HDD (als RAID 10 Verbund): hat noch 152 GB = 36% frei

Die meisten Checks haben ein Check Intervall von einer Minute.

Ich werde die Tage mal auf die neuste Version patchen.

Mit freundlichen Grüßen / Kind regards

Jonas Rabe

From: Marcel
Schulte [mailto:schulte.marcel@gmail.com]
Sent: Saturday, November 21, 2015 1:45 PM
To: Rabe Jonas jonas.rabe@dmgmori.com;
checkmk-de@lists.mathias-kettner.de
Subject: Re: [Check_mk (deutsch)] Resource temporarily unavailable

…davon mal abgesehen ist die Innovation Release nicht für den Produktiv betrieb gedacht und deine Version ist nicht die Aktuelle…

Marcel Schulte schulte.marcel@gmail.com schrieb am Sa., 21. Nov. 2015 13:42:

Hallo Jonas,

wie ist der OMD Host denn ausgestattet und was sagen de PerfGraphen des Hosts aus?

HW oder VM?
CPUs/Cores?
Speicher?
HDD/RaidLevel?
Host/Service Check Intervall?

CPU Util und Load?
Mem Util?

Grüße,
Marcel

Rabe Jonas jonas.rabe@dmgmori.com schrieb am Sa., 21. Nov. 2015 13:33:

Hallo,

hin und wieder aber immer öfter kriege ich beim Aktivieren der Changes im WATO folgenden Fehler:

Cannot connect to event daemon via /omd/sites/DMG/tmp/run/mkeventd/status: [Errno 11] Resource temporarily
unavailable

Installiert ist OMD - Open Monitoring Distribution Version 1.2.7i2p2.cee und verwendet wird der cmc als core. Auf dem
Gerät werden etwa 1400 Hosts und 35000 Services überwacht.

Nach mehrmaligen Versuchen funktioniert das Aktivieren. Hat jemand eine Idee wodurch der Fehler entsteht und wie ich
das beheben kann?

Mit freundlichen Grüßen / Kind regards

Jonas Rabe

GILDEMEISTER Beteiligungen GmbH

Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806

Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes

GILDEMEISTER Beteiligungen GmbH

Sitz der Gesellschaft: Bielefeld - Amtsgericht Bielefeld, HRB 40806

Geschäftsführer: Dipl.-Kfm. André Danks; Dipl.-Kfm. Christian Thönes


checkmk-de mailing list

checkmk-de@lists.mathias-kettner.de

http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de