NetApp Latenz Alarm

Hallo zusammen,

im NetApp Volume Service werden u. a. die Latenzwerte für verschiedene Workloads wie z. B. CIFS angezeigt.
Ich würde diese Metrik gerne nutzen, um einen Alarm auszulösen, z. B. sobald die Latenz über 10 ms steigt.
Leider finde ich in den Service monitoring rules für NetApp Volumes keine Möglichkeit, hierfür Schwellwerte zu konfigurieren.
Gibt es eine Möglichkeit, die vorhandenen Latenz‑Metriken für Alerts zu verwenden.

Viele Grüße
Sebastian

Hi @Sebastian1,

das ist ein bekanntes Designproblem: Die Latenz-Metriken in netapp_ontap_volumes werden vom Built-in-Check nur als Graphen-Daten gesammelt — es gibt keine check_levels()-Logik dafür, und die Service-Monitoring-Rules bieten daher keinen Latenz-Schwellwert an.

Lösung: Eigenen Check-Plugin schreiben, der sich an die bestehende netapp_ontap_volumes-Sektion hängt und daraus eigenständige “NetApp Volume Latency”-Services erzeugt. Das geht sauber mit der Check API v2:

local/lib/python3/cmk_addons/plugins/netapp_latency/agent_based/netapp_ontap_vol_latency.py

Der Plugin definiert sections=["netapp_ontap_volumes"] — nutzt also dieselben bereits geholten Daten ohne einen zweiten API-Call. Der Check discovert einen Service pro Volume das Latenzdaten hat, und eine WATO-Rule erlaubt dann pro Volume (oder per Pattern) WARN/CRIT-Schwellwerte für CIFS, NFS, SAN etc. getrennt zu konfigurieren.

Wichtig vor der Implementierung prüfen: Ob die Latenz-Werte (z.B. cifs_read_latency) tatsächlich im parsed dict der Section landen, oder ob sie nur als Metriken ausgegeben werden. Das zeigt:

bash

cmk -d NETAPP-HOSTNAME | grep -A5 "<<<netapp_ontap_vol"

ONTAP liefert Latenz immer in Mikrosekunden — im Check durch 1000 teilen für ms-Anzeige.

lG Bernd