SNMP-Abfrage Temperatursensoren iLO 5 (HP Proliant)

CMK version: Managed Service Edition 1.6.0p25

Wir haben auf HP ProLiant-Systemen (hier: DL380 Gen10) festgestellt, daß die IDs der Temperatursensoren in der iLO (hier: iLO 5 v2.55 Oct 01 2021) abweichen von den IDs, wie sie in den Checkmk-Services dargestellt werden.

Hier die Angaben der iLO:

Hier die Services im Checkmk:

Dies führt bei uns regelmäßig zu Irritationen.

Ursache ist der zugehörige Python-Check im Checkmk. Dieser hat im Bauch, daß die Index-Nummer für den Temperatur-Sensor in einem bestimmten OID-Zweig zu suchen ist:
‘snmp_info’: (
“.1.3.6.1.4.1.232.6.2.6.8.1”,
[
“2”, # cpqHeTemperatureIndex

Und wenn man sich die SNMP-Daten roh anschaut, stimmen diese mit den Nummern in den Services überein. Ist das ein Bug? Oder gab es MIB-Anpassungen für unterschiedliche iLO-Versionen, die im Check noch nicht nachgezogen wurden?

Vielen Dank und viele Grüße,
Antje

Soweit ich das sehe wird genau der Wert aus “2”, # cpqHeTemperatureIndex im Item verwendet. Sollte also mit den raw data übereinstimmen.

Aus cmk/base/check_legacy_includes/hp_proliant.py Line 233/234.

def format_hp_proliant_name(line):
    return "%s (%s)" % (line[0], hp_proliant_locale[int(line[1])])

Hi,
danke für die Analyse. Und ja - die Werte des Items im Check stimmen mit denen in den Services überein. Aber wieso haben die Sensoren, die mir in der iLO-Weboberfläche angezeigt werden, ganz andere Indexnummern? Das verstehe ich nicht.

Hallo @akummich!
Das wird wohl wieder eine “Ich bin der Hersteller, ich weiß es besser”-Situation sein. Solange Checkmk und die Daten, die per SNMP kommen übereinstimmen arbeitet Checkmk, wie es soll. Wenn der Hersteller es für eine gute Idee hält, in seiner Oberfläche andere IDs zu verwenden ist natürlich sein gutes Recht, aber für dich wird es damit schwer, das überein zu bringen.

1 Like

Hallo Robin,

danke für Deine Rückmeldung.
Leider schreibst Du das, was man als Anwender nicht gerne lesen will. :woozy_face:
Aber anscheinend ist das hier genau der Fall… Schauen wir mal, wie es mit den nächsten iLO-Versionen aussieht.

Viele Grüße,
Antje

Wir sitzen da alle in einem Boot, die Hersteller tun manchmal die haarsträubendsten Dinge, und dann soll man dazu einen passenden Workaround bauen. Wenn du kannst, mach deinem Ansprechpartner beim Hersteller mal Feuer, wenn genug Kunden meckern, hören sie ja vielleicht irgendwann darauf. :upside_down_face:

2 Likes

Klare Antwort aller Server Hersteller zur Zeit → don’t use SNMP anymore.
iLO, iDRAC, xClarity usw. alles nur noch über Redfish REST API.

Dann hoffe ich mal, daß die tribe29-Entwickler so schnell wie möglich nachziehen und auf Redfish-PlugIns oder andere APIs umstellen… Der kleine Checkmk-Kunde kann nicht alles selbst programmieren…

Wenn du magst kann meine Implementierung ausprobieren :wink:
Auf dem CMK Server muss “nur” die Redfish Python Lib mittels “pip3 install redfish” noch nachinstalliert werden.

Hallo Andreas,

vielen Dank! Dein PlugIn habe ich mir in unserer Testumgebung schon angeschaut. Leider wurden, wenn ich mich recht erinnere, keine Netzwerkinterfaces abgefragt. Das ist für uns aber wichtig.
Und unsere Produktionsumgebung (inklusive der angebundenen Kunden-Checkmk-Server) laufen noch unter v1.6. Wir planen ein zwar ein Upgrade, aber das geht nicht von heute auf morgen, weil wir auch viele selbstgeschriebene PlugIns im Einsatz haben. So wird es aber vielen Checkmk-Kunden vermutlich gehen…

Viele Grüße,
Antje

Netzwerkinterfaces auf dem iLO Port warum? Die Daten welche man dort erhält sind nix wert.
Einzig das iLO Interface selbst ist wäre relevant aber da ist meine Meinung - ich komm zum iLO hin also ist das Interface auch online :smiley:

Für 1.6 hab ich da auch noch ne Version rumliegen die benutzt halt noch die HP eigene Redfish Lib ist aber ansonsten recht identisch zu der 2.0er

Wenn man HP Hardware in Cluster-Umgebungen einsetzt, sind fehlerhafte Pakete bei der Netzwerkanbindung nicht uninteressant. Das bloße Abfragen, ob die iLO erreichbar ist, hilft bei der Fehleranalyse nicht immer weiter.

Wäre schön, wenn tribe29 Deine beiden PlugIns offiziell in den PlugIn-Katalog übernehmen, supporten und weiterentwickeln würde…

Kann ich ja mal wieder probieren :wink:

Das ist mir soweit klar. Nur sind die Daten welche das iLO sieht nicht “real” da diese Daten nur vom Betriebssystem ans iLO durchgereicht werden. Die produktiven Interfaces frage ich immer über die jeweiligen Betriebssysteme ab.

Dann versuche mal Dein Glück. :grinning_face_with_smiling_eyes:

“Die produktiven Interfaces frage ich immer über die jeweiligen Betriebssysteme ab.”
=> Tja, das wird schwierig, wenn man Appliances auf einem HP Proliant betreibt. Hier habe ich (oftmals) kein Betriebssystem (oder nur ein Embedded Linux), das ich nicht mit einem Checkmk-Agent beglücken kann. Am Ende bleibt mir dann doch wieder nur, SNMP v2 zu aktivieren und darüber die Interface-Daten abzugreifen…

So hab erstmal iLO und XClarity Pakete auf die Exchange geworfen mal sehen ob die dort erstmal ankommen.

2 Likes

Links, or didn’t happen. :wink:

1 Like

https://exchange.checkmk.com/p/hpe-ilo
https://exchange.checkmk.com/p/lenovo-xclarity
:wink:

2 Likes