[Check_mk (deutsch)] Linux MD Software wird scheinbar nicht korrekt gemeldet - Fwd: ** PROBLEM Service Alarm: lgs01.wrat.lan/MD Softraid md0 ist CRITICAL **

Hallo zusammen,

wir haben hier die OMD Version 0.54 im Einsatz. Einer der �berwachten Server mit openSUSE 10.3
(check_mk-agent-1.1.12p6-1) hat eine HDD aus einem Software-RAID verloren. Anbei die beiden Meldungen nach dem das "md"
die HDD als "faulty" aus dem RAID entfernt hat. Ich habe eine 4. Partition in das RAID5 eingef�gt, sodass das RAID5
wieder komplett ist ([UUU]). Ich h�tte erwartet, das das OMD dann die OK Meldung schickt, weil ja wieder 3 von 3 HDDs im
RAID aktiv und synchron sind.

Gru�
Stefan K.

PS: aktueller Zustand
/dev/md0:
        Version : 01.00.03
  Creation Time : Fri Jun 5 20:32:59 2009
     Raid Level : raid5
     Array Size : 1940908544 (1850.99 GiB 1987.49 GB)
  Used Dev Size : 1940908544 (1850.99 GiB 1987.49 GB)
   Raid Devices : 3
  Total Devices : 4
Preferred Minor : 0
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Sun Dec 16 07:00:44 2012
          State : active
Active Devices : 3
Working Devices : 3
Failed Devices : 1
  Spare Devices : 0

         Layout : left-symmetric
     Chunk Size : 128K

           Name : 0
           UUID : 5c5f5e95:2ec77d23:d1801ede:8491aaa5
         Events : 33597

    Number Major Minor RaidDevice State
       0 8 3 0 active sync /dev/sda3
       4 8 51 1 active sync /dev/sdd3
       3 8 35 2 active sync /dev/sdc3

       1 8 19 - faulty spare /dev/sdb3

** PROBLEM Service Alarm: lgs01_wrat_lan/MD Softraid md0 ist CRITICAL **.eml (2.6 KB)

** PROBLEM Service Alarm: lgs01_wrat_lan/MD Softraid md0 ist CRITICAL **.eml (2.57 KB)

Hallo,

die Meldung ist doch im Grunde genommen richtig. So lange noch das “faulty” Laufwerk Mitglied des md0 ist ist dieses auch nicht ok. Mann könnte nun noch drüber streiten ob ein defektes Spare Laufwerk gleich eine “CRITICAL” oder nicht lieber ein “WARNING” ist. Wenn du das defekte Laufwerk aus dem md0 entfernst sollte auch wieder der Status in ok wechseln.

Gruß

Andreas

···

Am 16. Dezember 2012 07:29 schrieb Stefan Kärst stefan.kaerst@cd-jena.de:

Hallo zusammen,

wir haben hier die OMD Version 0.54 im Einsatz. Einer der überwachten Server mit openSUSE 10.3

(check_mk-agent-1.1.12p6-1) hat eine HDD aus einem Software-RAID verloren. Anbei die beiden Meldungen nach dem das “md”

die HDD als “faulty” aus dem RAID entfernt hat. Ich habe eine 4. Partition in das RAID5 eingefügt, sodass das RAID5

wieder komplett ist ([UUU]). Ich hätte erwartet, das das OMD dann die OK Meldung schickt, weil ja wieder 3 von 3 HDDs im

RAID aktiv und synchron sind.

Gruß

Stefan K.

PS: aktueller Zustand

/dev/md0:

    Version : 01.00.03

Creation Time : Fri Jun 5 20:32:59 2009

 Raid Level : raid5

 Array Size : 1940908544 (1850.99 GiB 1987.49 GB)

Used Dev Size : 1940908544 (1850.99 GiB 1987.49 GB)

Raid Devices : 3

Total Devices : 4

Preferred Minor : 0

Persistence : Superblock is persistent

Intent Bitmap : Internal

Update Time : Sun Dec 16 07:00:44 2012

      State : active

Active Devices : 3

Working Devices : 3

Failed Devices : 1

Spare Devices : 0

     Layout : left-symmetric

 Chunk Size : 128K



       Name : 0

       UUID : 5c5f5e95:2ec77d23:d1801ede:8491aaa5

     Events : 33597



Number   Major   Minor   RaidDevice State

   0       8        3        0      active sync   /dev/sda3

   4       8       51        1      active sync   /dev/sdd3

   3       8       35        2      active sync   /dev/sdc3



   1       8       19        -      faulty spare   /dev/sdb3

checkmk-de mailing list

checkmk-de@lists.mathias-kettner.de

http://lists.mathias-kettner.de/mailman/listinfo/checkmk-de