จะตรวจสอบสถานะฮาร์ดดิสก์ที่อยู่เบื้องหลัง Dell PERC H710 Raid Controller ด้วย CentOS 6 ได้อย่างไร


26

ฉันมีเซิร์ฟเวอร์ Dell ทำงานCentOS 6โดยใช้PERC H710การ์ด Raid Controller ที่มีการตั้งค่า Raid 5 และฉันต้องการตรวจสอบสถานะความล้มเหลวของฮาร์ดดิสก์ / สถานะการทำงานที่อยู่เบื้องหลัง Raid Controller

จากนั้นฉันควรจะใช้สคริปต์ทุบตีเพื่อตรวจสอบสถานะฮาร์ดดิสก์และส่งอีเมลแจ้งเตือนหากมีข้อผิดพลาด

LSI MegaRAID SASเครื่องมือคำสั่ง(เกี่ยวกับเครื่องมือ LSI MegaRAID SAS ลินุกซ์)สำหรับ CentOS / Red Hat / Linux ไม่สนับสนุน PERC H710 และsmartctlไม่สนับสนุนมันทั้ง

จากเว็บไซต์ของ Dell CentOSไม่รองรับเซิร์ฟเวอร์นี้ ( NX3200 PowerVault) และฉันไม่สามารถดาวน์โหลดโปรแกรม linux ใด ๆ เพื่อตรวจสอบฮาร์ดดิสก์

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

ใครรู้วิธีการตรวจสอบสถานะฮาร์ดดิสก์ที่อยู่เบื้องหลังการจู่โจมฮาร์ดแวร์ใน Dell PERC H710 กับ CentOS 6?

คำตอบ:


26

สมาร์ทคือไม่ได้คำสุดท้ายในดิสก์หรือจัดเก็บข้อมูลการตรวจสอบ !! มันเป็นส่วนประกอบ แต่คอนโทรลเลอร์ RAID ที่ทันสมัยใช้มันพร้อมกับวิธีการอื่นเพื่อตรวจสอบความสมบูรณ์ของไดรฟ์และอาเรย์

ฉันสมมติว่านี่เป็นตัวควบคุม PERC ในเซิร์ฟเวอร์ Dell PowerEdge

แนวทางที่เป็นมิตรกับ Linux ปกติในการตรวจสอบสุขภาพของฮาร์ดแวร์ของ Dell คือการติดตั้งตัวแทนของ Dell OMSA สำหรับ Linux ผ่าน Yum - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-allจะติดตั้งชุดเต็มของตัวแทน เมื่อติดตั้งแล้วคุณสามารถใช้omreportคำสั่งเพื่อรับข้อมูลเกี่ยวกับอาร์เรย์ของคุณ

ตัวอย่าง:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1

7
สิ่งนี้จะติดตั้งส่วนประกอบเพิ่มเติมเช่นเว็บเซิร์ฟเวอร์ / ssl บนเครื่อง Linux ของฉัน แต่ดูเหมือนว่าฉันไม่มีทางเลือกอื่น! ฉันเกลียดที่จะเพิ่มแพ็คเกจที่ไม่จำเป็นในเซิร์ฟเวอร์ของฉัน
Xianlin

2
ระวังการรั่วไหลของหน่วยความจำที่อาจเกิดขึ้นจากหนึ่งในโปรแกรม OMSA เหล่านั้น มันเกิดขึ้นกับฉันอย่างช้าๆในช่วง 3-4 สัปดาห์ต่อจากนั้นความเจริญรุ่งเรืองก็ไม่มีความทรงจำใด ๆ เลยสำหรับ linux
bksunday

1
ใช่การรั่วไหลอยู่ใน dsm_sa_snmpd (ดังนั้นฉันจึงเรียกใช้ 'killall -9 dsm_sa_snmpd' ได้รับการแก้ไขแล้ว)
markus

5
ตัวควบคุม PERC 7xx และ 8xx เป็นเพียงตัวควบคุม LSI Megaraid และเครื่องมือ LSI MegaCLI จะทำงานได้ดีถ้าคุณไม่ต้องการทำให้ระบบของคุณยุ่งเหยิงด้วยไลบรารีของเดลล์และบริการอื่น ๆ และ / หรือโมดูลเคอร์เนลที่กำลังลดลงในทุกวันนี้ มีชีต MegaCLI มากมายสคริปต์ตรวจสอบ nagios และเคล็ดลับการปรับแต่งประสิทธิภาพสำหรับไบนารี LSI นั่นเป็นเพียงความชอบส่วนตัวและความเห็นของฉันแน่นอน ฉันเป็นมินิมอล
แอรอน

@Xianlin นี้ไม่เป็นความจริงเลย ใช่มันจะติดตั้งขยะจำนวนมาก แต่ดูคำตอบของฉัน ฉันไม่ต้องการเพิ่มแพ็คเกจที่ไม่จำเป็นดังนั้นฉันจึงคิดได้เฉพาะแพ็คเกจที่ต้องการสำหรับการจัดเก็บ
Mike S

25

คุณสามารถดูสถานะ SMART ของดิสก์ด้วยคำสั่ง smartctl และเป็น-dอาร์กิวเมนต์ ตัวอย่างเช่นหากต้องการดูดิสก์แรกในอาร์เรย์:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

นี่คือบน Scientific Linux 6 (อีกระบบปฏิบัติการแบบ RHEL6) ที่มี smartmontools-5.43-1.el6.x86_64


-d megaraid,0เพียงพอในsmartctl 6.6บรรทัดคำสั่ง ในสDEVICESCANตริ/etc/smartd.confมันต้องการ-d removable
Stuart Cardall

9

yum install srvadmin-allคำตอบที่ได้รับการยอมรับแนะนำกล้าที่ Blecch ต่อไปนี้เป็นวิธีทำให้ blecch-y น้อยลงเล็กน้อย (แต่ยังคงเป็น blecch-y แต่คุณสามารถใช้งานได้มากบนแพลตฟอร์มของ HP แต่ฉันพูดนอกเรื่อง) โดยวิธีนี้ฉันหมายความว่าเพียงติดตั้งส่วนประกอบเหล่านี้เพื่อจัดการพื้นที่เก็บข้อมูลบนเครื่องของคุณ .

BTW คำตอบสำหรับคำถามของผู้ใช้โดยตรงอยู่ในรายการ "แสดงฟิสิคัลดิสก์บน vdisk 0" ในรายการด้านล่าง

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

เพิ่มใน. bashrc ของรูท:

export PATH=$PATH:/opt/dell/srvadmin/bin

สนุก:

คำสั่ง RAID

  • แสดงฟิสิคัลดิสก์ทั้งหมดบนคอนโทรลเลอร์ 0

    $ omreport storage pdisk controller=0
    
  • แสดงโลจิคัลดิสก์ทั้งหมดบนคอนโทรลเลอร์ 0

    $ omreport storage vdisk controller=0
    
  • แสดงดิสก์ที่มีอยู่จริงทั้งหมดใน vdisk 0

    $ omreport storage pdisk controller=0 vdisk=0
    
  • กำหนดค่า vdisk ใหม่ให้เป็น raid1 จาก raid0 ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • สร้าง vdisk บนดิสก์ใหม่:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

ข้อมูลเพิ่มเติม

BTW เนื่องจากไม่มีอะไรมากไปกว่าการ์ด LSI MegaCLI ของ Dell คุณอาจพบว่าคำตอบของฮันโซโลดียิ่งขึ้น! อย่างไรก็ตามฉันยังไม่ได้ลอง

ความหวาน

นี่คือตัวอย่างของเอาต์พุตของ omreport ที่ส่งผ่าน grep เพื่อรวมกลุ่มข้อมูลที่แสนอร่อย:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D

@slm เกี่ยวกับการแก้ไขของคุณ - ใช้งานได้จริงหรือไม่ ฉันไม่มี omreport / omconfig ต่อหน้าฉันในวันนี้ แต่ฉันไม่แน่ใจว่าผู้ใช้รายใดสามารถสร้าง vdisk ได้ '$' ในบรรทัดคำสั่งหมายถึงผู้ใช้ปกติไม่ใช่รูท
Mike S

ใช่ฉันเพิ่งทำสิ่งนี้ในวันอื่น ๆ เมื่อฉันจัดการกับ Dell 730 cmds ทั้งหมดยกเว้น 2 ที่ทำ "สร้าง" ไม่ต้องการรากฉันจะแก้ไข
slm

6

ฉันยังดิ้นรนเพื่อให้มันทำงานใน CentOS และฉันก็พบแพ็คเกจทำงานที่นี่http://mirror.ndchost.com/software/lsi/

เรียกว่า " MegaCli-8.07.10-1.noarch.rpm "

การอ้างอิงคำสั่งhttp://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

ฉันหวังว่ามันจะช่วย


1
ฉันเห็นด้วยอย่างยิ่งให้ใช้ / opt / megacli / MegaCli64 -PDList -aALL | grep -i เฟิร์มแวร์และมันจะบอกคุณว่าดิสก์ทางกายภาพนั้นใช้ได้หรือไม่ (คำสั่งมาจากerikimh.com/megacli-cheatsheet - ดูถ้าฉันใช้ผิด) โดยทั่วไปการดูแลการจู่โจมทำหน้าที่ได้อย่างยอดเยี่ยมในการตรวจสอบดิสก์ดังนั้นเพียงแค่ติดตามความคิดเห็นเกี่ยวกับสถานะการทำงานของดิสก์
Linux Nerd

3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:

8
โปรดพิจารณาการอ่านฉันจะเขียนคำตอบที่ดีได้อย่างไร ในศูนย์ช่วยเหลือของเราแล้วแก้ไขคำตอบ คำสั่งของคุณอาจเป็นวิธีการแก้ปัญหาซึ่งได้กล่าวถึงแล้วในคำอื่น ๆ คำตอบที่เก่ากว่ามากและยินดีต้อนรับคำอธิบายบางอย่าง ขอบคุณล่วงหน้า.
HBruijn

1
คำตอบอื่น ๆ ใช้ "sat + megaraid" ซึ่งไม่ได้ผลสำหรับฉัน (ใช่ฉันไม่รู้จักคำสั่ง smartctl ดีและไม่ทราบว่าจะแก้ไขคำสั่งให้ทำงานได้อย่างไร) คำตอบนี้ทำให้ฉันอยู่บนเส้นทางที่ถูกต้องและทำงานได้ดีสำหรับฉัน
Yongwei Wu

1

perccliคำสั่งนอกจากนี้ยังสามารถแสดงให้คุณมากของข้อมูลไดรฟ์ถ้าคุณถามมันอย่าง:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

สิ่งนี้จำเป็นต้องทำซ้ำสำหรับแต่ละตู้สล็อตหรืออย่างน้อยฉันก็ไม่พบวิธีพิมพ์ทั้งหมดในครั้งเดียวด้วยperccliคำสั่งเดียว

นอกจากนี้ยังง่ายต่อการติดตั้งเมื่อเทียบกับตัวเลือกอื่น ๆ ที่ครอบคลุมมากขึ้น:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliคือไม่ได้เป็นชุดตรวจสอบที่ครอบคลุมเช่น Delll OMSA แต่มันเสียงเหมือนคนจำนวนมากไม่ต้องการบางสิ่งบางอย่างที่ครอบคลุมและแทนที่จะต้องดีเครื่องมือง่ายๆ


-1

สวัสดีฉันมีการ์ด Dell PERC / LSI ที่คล้ายกันและฉันต้องการตรวจสอบสถานะ RAID LSI มียูทิลิตี้ที่เรียกว่า sas2ircu ซึ่งฉันพบว่าค่อนข้างมีประโยชน์มีเวอร์ชั่นสำหรับ Windows และ Linux

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.