Lenovo Storwize 5000e

Hi,

its possible to check the Disks for a Storwize 5000e (if possible other Hardware Components to, like Powersupply …)?

We are using Version 1.6.0p6.

Thansk for any sollution

You checked the SAN Volume Controller special agent?

Hallo Andreas,

ich habe kein SVC (SAN Colume Controller). Verbinde mich direkt auf den Storwize 5000e.

Danke und viele Grüße

Das meinte @andreas-doehler:

“Check state of IBM SVC / V7000 storage systems”.

Funktioniert auch bei der 5000.

ttr

1 Like

Irgendwie komme ich nicht weiter.

Habe bis jetzt folgendes gemacht

  • mit openssh id_rsa.pub und i_rsa erstellt
  • Auf dem Storage einen Benutzer erstellt und während der Erstellung die id_rsa_pub als Schlüssel eingetragen
  • Dann wie von euch vorgeschlagen “Check state of IBM SVC / V7000 storage systems” auf ein Ordner erstellt
  • Dort den Host eingetragen.

Bekomme leider keine ergebmnise und wenn ich dort auf save%test klicke bekomme die meldung
Communication failed: timed outAgent exited with code 2: Error connecting via ssh: Permission denied, please try again.
Permission denied, please try again.

Der Host ist als Agent eingetragen, kein SNMP.

Was mache ich da falsch ?

Danke für alle hinweise

Wo ist der Private Key abgelegt? Die Fehlermeldung

zeigt ja das Problem schon.
Wie immer auf der Commandline ein “cmk -D hostname” machen um zu sehen welcher Aufruf für den Special Agent genutzt wird und nun auch diesen per Hand ausführen.
Der Special Agent sucht im Normalfall den Private Key an den bekannten einschlägigen Stellen und wenn er da nicht fündig wird gibts halt nen Fehler.

Hi,

vmtl. hast Du die Keys nicht richtig erzeugt oder sie liegen falsch. Am einfachsten generierst Du einen Schlüssel als Site-User auf dem checkmk-Host neu (Achtung beim Überschreiben, nicht dass Du noch andere Verbindungen hast):

OMD[<Site User>]:~$ ssh-keygen -b 4096 -C "SVC checkmk" -f ~/.ssh/id_rsa -q -N ''

Den Public-Key (~/.ssh/id_rsa.pub) lädst Du dann in der SVC GUI in Deinen Storage User. Dann muss folgendes funktionieren (als Site-User):

OMD[<Site User>]:~$ ssh <Storage User>@<Storage System>

also z.B. ssh monitor@mystorage. Wenn das klappt, dann funktioniert auch der Special Agent

ttr

Danke euch beiden.
@ttr
Das hat super hingehauen.

Was mich allerdings nur wundert ist die Tatsache, dass die Festplatten nicht angezeigt werden ! Ich sehe die mdesks, RAID, Ports aber nicht die physikalische Festplatten.

Grüße

@admin4ever: Es gibt einen Service “Disk Summary”, da wird das zusammengefasst, das werden sonst zuviele Services:

"OK - Total raw capacity: 69.89 TB, Total disks: 72 (3 Spare), Failed disks: 0"

Ein Fehler sieht so aus:

"WARN - Total raw capacity: 69.89 TB, Total disks: 71 (3 Spare), Failed disks: 1, failed Disk Details: Enclosure: 3, Slot: 2, Type: ..."

ttr

Super,

vielen Dank nochmal für die Unterstützung und Infos.

Grüße

Habt Ihr noch einen tip für dieses Verhalten. Die Daten werden geliefert, allerdings erscheint diese Meldung in der Console

CRIT - [agent] Communication failed: [Errno 110] Connection timed out CRIT , [special_ibmsvc] Version: unknown, OS: unknown, execution time 32.7 sec

Kann ich die Timeouts irgendwo einstellen ?

Danke

Kommt die Meldung immer oder von Zeit zu Zeit?
Wenn das immer passiert dann lässt sich auf der Commandline recht einfach mal testen an welcher Stelle er hängt.
Führe mal bitte ein “cmk -D hostname” aus und nimm den Befehl unter “Type of agent” und teste diesen manuell.
Dabei kannst sehen an welcher Stelle er lange braucht.
Der Timeout kommt nicht direkt vom CMK sondern sieht so aus wie wenn das Agent Script abbricht selbst.

So sieht das Ergebnis aus.
Habe 3 von den Dosen. Alle 3 melden das gleiche.

Type of agent:
TCP: 10.8.100.15:6556
Program: /omd/sites/mysites01/share/check_mk/agents/special/agent_ibmsvc -u ‘cUser01’ --accept-any-hostkey -i lshost,lslicense,lsmdisk,lsmdiskgrp,lsnode,lsnodestats,lssystem,lssystemstats,lseventlog,lsportfc,lsportsas,lsenclosure,lsenclosurestats,lsarray,disks ‘10.8.100.15’
Process piggyback data from /omd/sites/mysites01/tmp/check_mk/piggyback/Stor5000e

Hier ist der Fehler das Gerät ist für einen normalen Agent und gleichzeitig noch mit dem Special Agent die Zeile darunter konfiguriert.
Es ist nun wichtig zu kontrollieren auf was der Host eingestellt ist.
Folgende Option sollte ausgewählt sein:
entweder
Normal Checkmk agent, or special agent if configured (Default value)
oder
No CheckMK agent, all configured special agents

Ich könnte mir vorstellen, dass in deinem Fall die Option “Normal Checkmk agent, all configured special agents” gewählt ist.

genau so war es auch.

Habe auf “No CheckMK agent, all configured special agents” umgestellt und es sieht im Moment alles ruhig aus.

Danke und viele Grüße