Ich habe zwei gestackte Dell 10G switches die ich mit einer Checkmk RAW 2.0.0p34 Instanz via SNMP ueberwache. Bei der Discovery bekomme ich direkt Alerts ueber nicht funktionierende Fans:
Fuer beide switches, werden dieselben Fans “moniert”.
Meine Netzwerkadmins koennen das allerdings ueber das CLI der switches, nicht bestaetigen, und
schickten mir folgenden Output:
-- Unit 1 --
Unit Type : Management Unit
Status : online
Next Boot : online
Required Type : S4048-ON - 54-port TE/FG (SK-ON)
Current Type : S4048-ON - 54-port TE/FG (SK-ON)
Master priority : 14
Hardware Rev : 2.0
Num Ports : 72
Up Time : 2 yr, 41 wk, 1 day, 3 hr, 50 min
Dell EMC Networking OS Version : 9.13(0.1)
Jumbo Capable : yes
POE Capable : no
FIPS Mode : disabled
Boot Flash : 3.21.2.9
Boot Selector : 3.21.0.0-5
Memory Size : 3201302528 bytes
Temperature : 33C
Voltage : ok
Serial Number : NA
Part Number : 0FRV58 Rev A03
Vendor Id : DL
Date Code : 22092018
Country Code : CN
Piece Part ID : CN-0FRV58-28298-89M-0651
PPID Revision : A03
Service Tag : - REDACTED -
Expr Svc Code : - REDACTED -
Auto Reboot : enabled
Burned In MAC : 4c:d9:8f:e7:e3:88
No Of MACs : 3
-- Power Supplies --
Unit Bay Status Type FanStatus FanSpeed Power AvgPower AvgPowerStartTime
-------------------------------------------------------------------------------------
0 1 up AC up 6864 49 50 06/14/2020-09:59
1 2 up AC up 6960 41 42 06/14/2020-09:59
-- Fan Status --
Unit Bay TrayStatus Fan1 Speed Fan2 Speed
------------------------------------------------------------------------------------
1 1 up up 7021 up 7021
1 2 up up 6971 up 7072
1 3 up up 7021 up 7021
Der obere Output wird auch beim zweiten “Unit” des Stacks angezeigt.
Das Wort “REDACTED” habe ich da reingeschrieben, das kommt natuerlich
nicht so zurueck
Wenn ich obigen Output richtig deute, haben die Dinger drei Fans, und alle sind OK.
Fuer Checkmk ist aber - wie gesagt - einer der drei Fans, nicht OK.
Im HW/SW inventory zu den beiden switches, wird - soweit ich das beurteilen kann - auch kein dritter Fan erkannt:
Für mich siehts so aus wie wenn er einen vierten nicht existierenden Tray erkennt.
Tray 0 bis 2 scheinen ja da zu sein nur kein vierter. Bestimmt gibt es bei den Modellen die technische Möglichkeit für einen vierten Tray. SNMP gibt hier einfach “sinnlose” Werte zurück anstatt einfach zu sagen “nicht installiert”.
Mehr wie dein ignore bleibt hier nicht übrig.
Bei uns scheint das letztere Modell im Einsatz zu sein. Dem CLI Output zu urteilen nach, vermute ich
ebenfalls dass jedes “Fantray” jeweils zwei Luefter hat, also insgesamt 12. Das wuerde sich mit der Information vom HW/SW Inventory decken, so wie ich das sehe.
Bei den Checks, scheine ich allerdings insgesamt 11 die OK sind und 2 die nicht OK sind
zu haben. Das waeren ja dann 13. Der letzte Service der auf “SLOT 0” noch nen Luefter
erkennt - den 14ten also - soll auch nicht OK sein.
Kann das sein, dass der Check da was “fehlinterpretiert”?
.1.3.6.1.4.1.674.10895.3000.1.2.110.7.1.1.1 → index
.1.3.6.1.4.1.674.10895.3000.1.2.110.7.1.1.2 → description/name
.1.3.6.1.4.1.674.10895.3000.1.2.110.7.1.1.3 → status
.1.3.6.1.4.1.674.10895.3000.1.2.110.7.1.1.4 → rpm (wird vom check nicht abgefragt)
Wie gesagt, das ist ein “gestackter” switch. Der CLI output den ich im initialen Post
gepastet habe existiert eigentlich zwei mal. Der “zweite Teil” beginnt dann mit -- Unit 2 -- und Unit Type: Standby Unit. Hier ist der output des “zweiten Teils” des stacks:
-- Unit 2 --
Unit Type : Standby Unit
Status : online
Next Boot : online
Required Type : S4048-ON - 54-port TE/FG (SK-ON)
Current Type : S4048-ON - 54-port TE/FG (SK-ON)
Master priority : 1
Hardware Rev : 2.0
Num Ports : 72
Up Time : 2 yr, 41 wk, 1 day, 3 hr, 54 min
Dell EMC Networking OS Version : 9.13(0.1)
Jumbo Capable : yes
POE Capable : no
FIPS Mode : disabled
Boot Flash : 3.21.2.9
Boot Selector : 3.21.0.0-5
Memory Size : 3201302528 bytes
Temperature : 32C
Voltage : ok
Serial Number : NA
Part Number : 0FRV58 Rev A03
Vendor Id : DL
Date Code : 22092018
Country Code : CN
Piece Part ID : CN-0FRV58-28298-89M-0640
PPID Revision : A03
Service Tag : - REDACTED -
Expr Svc Code : - REDACTED -
Auto Reboot : enabled
Burned In MAC : 4c:d9:8f:e7:e2:88
No Of MACs : 3
-- Power Supplies --
Unit Bay Status Type FanStatus FanSpeed Power AvgPower AvgPowerStartTime
-------------------------------------------------------------------------------------
0 1 up AC up 6928 50 51 06/14/2020-09:59
1 2 up AC up 6928 39 39 06/14/2020-09:59
-- Fan Status --
Unit Bay TrayStatus Fan1 Speed Fan2 Speed
------------------------------------------------------------------------------------
2 1 up up 6971 up 7021
2 2 up up 7021 up 7021
2 3 up up 7021 up 6971
Wenn ich darueber nachdenke waehrend ich das schreibe, und in Anbetracht der Tatsache dass eben nur zwei und nicht vier Netzteile gefunden werden, sollte der check dann nicht nursechs Luefter in Erwaegung ziehen und diese checken?
Das schliesst natuerlich nicht aus, dass man das eigentlich ueber den SNMPwalk nicht wirklich erkennen kann und dieser “Fehler” genau deswegen entsteht.
Ich finde zwar im walk ein-zwei Referenzen zu Stack und Unit 1 oder Unit 2 aber nichts wirklich womit man unterscheiden kann, welches “Unit” gerade aktiv ist…
das sind zwei verschiedene Checks. Bei den FANs ist der Name eindeutig, bei den PSUs nicht. Der PSU Check berücksictigt nicht den PSU Index. Hier ist die Herausforderung bei CMK…
macht bei 3 FAN Trays und 2 Switches 322=12 Fans, soweit OK.
Zu den PSUs hast du eine Info in welcher Einheit die Power angabe ist (W)?
-- Power Supplies --
Unit Bay Status Type FanStatus FanSpeed _Power_ AvgPower AvgPowerStartTime
-------------------------------------------------------------------------------------
0 1 up AC up 6928 _50_ 51 06/14/2020-09:59
1 2 up AC up 6928 _39_ 39 06/14/2020-09:59
Nee, kann ich leider nicht sagen. Die CLI reference die ich finde, schweigt sich darueber aus.
Hier ist ein PDF davon, allerdings fuer OS 9.14 wo dieser Befehl erklaert wird:
Das ist grossartig, vielen lieben Dank! Die Instanz mit der ich diese Dell switches
ueberwache hat allerdings die Version 2.0.0p34 und ich kann die momentan
leider nicht aktualisieren.
This topic was automatically closed 365 days after the last reply. New replies are no longer allowed. Contact an admin if you think this should be re-opened.