Falscher Wert bei APC USV? (Phase Battery)

Hallo,

erst einmal vielen herzlichen Dank für CheckMK RAW, wir nutzen dies seit ca. einem Jahr bei uns im Unternehmen und haben unsere IT-Landschaft deutlich besser damit im Blick! :heart_eyes:

Ich habe eine kleine Frage zur Überwachung von USV von APC. Wir betreiben mehrere APC SURT 5000 XLI und haben bei dem Modell immer folgendes wie in den Bildern zu sehen. Was genau bedeutet Phase Battery hier?
Ist das die Zuleitung zur Batterie mit der die geladen wird?
Und wie kommt CheckMK hier auf 24A, ich finde diesen Wert nicht in der USV selbst im Webinterface. Kann mir das vielleicht jemand kurz erläutern? Ich glaube ich verstehe hier etwas falsch :smiley:
Ich würde das sehr gerne korrigieren und sauber integriert haben.

Vielen Dank im Voraus, sollte noch Fragen sein oder Infos benötigt werden, gerne Bescheid geben. :slight_smile:

Darf als neuer User nur 1 Bild pro Beitrag, hoffe hier geht nun das zweite :smiley:

Der Check nimmt diesen Wert von der OID .1.3.6.1.4.1.318.1.1.1.2.2.9.0 mit dem Namen PowerNet-MIB::upsAdvBatteryCurrent, mehr kann ich aber auch nicht sagen.

Danke für die Antwort, dann wäre es doch der markierte Wert oder?
Phase Battery wird in Ampere angegeben. Im Webinterface meiner USVs gibt es hier nur den Wert Load current:
image

Ist hier ein Umrechnungsfehler irgendwie drin?
Sonst wird ja immer von VAC überall gesprochen außer dort. :slight_smile:

Eine Warnung in den USVs gibt es auch nicht, alles in Ordnung wird dort angezeigt. Nur CheckMK ist traurig :smiley:

Hallo zusammen,

habe es aktuell wieder und verstehe nicht was der Wert aussagen soll.
Ich habe mal geschaut, ob das alle USV bei uns haben. Wir betreiben 53 USV und nur 5 haben überhaupt diesen Wert in CheckMK aufgeführt.

Grundsätzlich laufen 2 USV immer auf 23A laut CheckMK Graphen und manchmal springt er auf 24A für einige Stunden. Eine andere USV ist immer bei 4A und die übrigens immer bei 0A.

Habe jetzt den Schwellwert auf 25 gesetzt, damit die Meldung nicht ständig aufploppt, denn aus meiner Sicht passt alles.
Die Sicherungen sind auf 32A ausgelegt, falls es das bedeuten soll (also mit wie viel aus dem Stromnetz bezogen wird was aber auch keinen Sinn macht, da die Batterien komplett voll sind).

Falls noch jemand eine Info hat, was der Wert genau aussagen soll und warum das nicht alle USV haben, freue ich mich auf eine kleine Antwort :slight_smile:

Dankeschön!

Hey,

habe gerade bemerkt, dass die Managementkarte 3 generell wohl nicht fehlerfrei läuft. Die Batterien einer USV sind defekt und CheckMK bemerkt und meldet das einfach nicht. Für CheckMK ist alles in Ordnung, im Webinterface der USV ist aber alles rot und auf ALARM.

Habe nun alle USV aus CheckMK entfernt und lasse mich per Mail informieren über alles, das ist mir an dieser Stelle zu gefährlich. Vielleicht wird das ja noch gefixt, dann bin ich wieder dabei :smiling_face:

Tja hier wäre dann am besten ein SNMP Dump der betroffenen USV. Wie soll ein Fehler “gefixt” werden wo nicht klar ist was überhaupt “kaputt” ist.
Für mich sieht das alles mehr nach kaputter SNMP Firmware auf den USV Management Karten aus.

Zu deinem eigentlichen Problem - der Wert für Battery Current steht meist (jedenfalls bei APC) nicht in der Web GUI zur Verfügung.
Wenn das System alles richtig ausgibt ist dies der Strom welcher über die Batterie fließt. Hier kommt jetzt das Problem ins Spiel, der USV Typ. Online USV vs. Line-Interactive vs. Offline USV
Wobei sich bei dem Problem hier die Varianten auf Offline/Line Interactive vs. Online beschränken lassen.
Nun kann es sein, dass der Strom welcher zwischen dem Gleichrichter und Wechselrichter fließt auch als Batterie Strom ausgegeben wird. Was natürlich nicht richtig ist. Kommt halt aufs Modell an.

Wenn man im APC Forum danach schaut wird man auch fündig. Die Battery Current Werte können auch einfach an dem verwendeten NMC Typ hängen. Hab nen Post gefunden wo der Wert brav mit der Karte gewandert ist von USV zu USV.

Das ist halt mit Abstand die schlechteste Variante einer Alarmierung - per Mail.
Muss nur die USV ausfallen wo das Internet dran hängt und Ups keine Alarmierung mehr.

1 Like

Hallo,

das stimmt natürlich absolut, sorry, das sollte nicht böse rüber kommen. :slight_smile:
Kann ich so einen SNMP-Dump über CheckMK erzeugen? Dann würde ich das sofort machen. Oder wie komme ich da genau dran?

Also die aktuelle USV hat eine Management Card 2 (Firmware Revision UPS 05.3 (ID1010)) sehe ich gerade, ich hatte noch einen anderen Thread mit Version 3 offen bzgl. externer Temperatursensoren. Da habe ich das wohl gerade mit vertauscht: Externer Temperatursensor wird nicht angezeigt bei neuester APC-Firmware - Global Community / Deutsch - Checkmk Community

Im Webinterface sehe ich aktuell folgenden Status, den ich durch Zufall gesehen habe:

In CheckMK (v2.2.0p24) sehe ich aber folgendes, auch wenn ich mal die Serviceerkennung neu starte bzgl. auch mal alles entferne und neu erkennen lasse:

Ich würde wohl nächste Woche mal ein Firmware Update probieren, vielleicht bringt das ja schon eine Besserung. Das ist auf jeden Fall eine gute Idee! :slight_smile:

Vielen Dank für die Hilfe!

Den SNMP Dump/Walk kann man am einfachsten auf der Command Line als SiteUser erzeugen.

cmk --snmpwalk HOSTNAME

Der Walk selbst ist dann im Verzeichnis “~/var/check_mk/snmpwalks/” zu finden.

Laut den Forumsbeiträgen ist das Problem nicht über Firmware lösbar. Liegt scheinbar am Typ der Management Card und betrifft hier immer die Card 2
Lustiger wirds, dass es dann noch auf die USV ankommt in der die Karte eingebaut ist. 1500er und SU2200 RM zeigen beiden den Battery Current eine SUA5000 aber zeigt ordentlich 0 an. Kann hier nicht am Bautyp liegen sind alles LineInteractive.

2 Likes

kkh-USV-USV-02-06-D33-walk.txt (19.7 KB)

Danke, anbei die Datei. Kann man sogar über die Oberfläche laden wie ich in den Docs gesehen habe. Auf dem System gibt es cmk so nicht (er löst mit cmk-agent-ctl auf).
Firmware habe ich gerade mal geprüft, alle haben 6.9.6 installiert. Es ist schon merkwürdig irgendwie.

Danke für die Unterstützung! :slight_smile:

Ist der Walk auf der Command Line erstellt oder über das Webinterface?
Wenn der Output von der Command Line kommt das ists seltsam. Es fehlt der komplette Enterprise Teil - jener welcher die APC USV Daten enthält.
Normal müssten Daten unter dem OID Zweig .1.3.6.1.4.1.318 mit dabei sein.
Bei deinem Dump sind aber Daten für generische USV Dabei OID Zweig .1.3.6.1.2.1.33.1.
Alles bisl seltsam :wink:
Zu deiner Problemmeldung - die würde mit dem generischen USV Daten nicht auftreten.

.1.3.6.1.2.1.33.1.2.3.0 67
.1.3.6.1.2.1.33.1.2.4.0 100
.1.3.6.1.2.1.33.1.2.5.0 1091
.1.3.6.1.2.1.33.1.2.7.0 28

.1.2.6.0 - upsBatteryCurrent - fehlt hier einfach :smiley:

Hey,

das habe ich über die Oberfläche gemacht, da ich auf dem CheckMK Server nicht mit cmk arbeiten kann. Das Commandlet kennt er da so nicht:

image

Er bietet mir nur cmk-agent-ctl an und damit geht es nicht.

Danke für die Unterstützung!

Auf der Command Line immer nur als Site User arbeiten.
Also erstmal ein “su sitename” dann kannst auch “cmk” als Command verwenden.

1 Like

Ah okay, das klappt dann tatsächlich prima, danke!

Wenn ich das ausführe (habe ich in der Doku den Parameter -v gefunden) kriege ich die gleiche Ausgabe (hängt hier an) aber mit einer Fehlermeldung (Timeout). Die USV ist aber durchgehend dabei erreichbar per Ping und auch im Webinterface kann ich rum klicken. Habe nun mehrere Exports probiert aber immer diese Meldung mit dem Timeout. Kann das Limit irgendwie anpassen, dass er mehr Zeit hat?

USV-02-06-D33-snmpwalk-cmk.txt (19.7 KB)

Eine andere USV hingegen funktioniert, hier kriege ich folgende Meldung:
image

Datei ist auch viel größer. Eine noch andere USV hat auch wieder das Problem…
Alle haben die gleiche Firmware installiert.

Habe jetzt mal ein Firmware-Update auf dieser USV gemacht auf die neueste Version 7.1.2 aber das Problem ist das selbe. Er findet jetzt zwar mehr Variablen aber bricht dann auch mit einem Timeout ab:

image

Result bricht an der selben Stelle ab
USV-02-06-D33-firmware712.txt (20.0 KB)