คุณจะตรวจสอบสภาพของฮาร์ดไดรฟ์แต่ละตัวในอาเรย์ RAID ได้อย่างไร


5

ฉันใช้อาร์เรย์ 1 TB RAID แบบง่าย ๆ กับ mdadm บน Ubuntu Server 10.10 ฉันต้องการเพียงแค่ตรวจสอบสถานะของฮาร์ดไดรฟ์แต่ละตัวเพื่อให้แน่ใจว่าทั้งสองฟังก์ชั่นการทำงานก่อนที่มันจะสายเกินไป ฉันจะทำสิ่งนี้ได้อย่างง่ายดายได้อย่างไร?

คำตอบ:


4

โดยทั่วไปสิ่งที่คุณต้องการคือแพ็คเกจที่เรียกว่า smartmontools สามารถสืบค้นอินเทอร์เฟซ SMART บนดิสก์ของคุณซึ่งอยู่ในดิสก์ที่ทันสมัยที่สุด

มีภูตที่เรียกว่า smartd ซึ่งสามารถช่วยคุณในการตรวจสอบอย่างต่อเนื่อง

อย่างไรก็ตามหากระบบของคุณเป็นเซิร์ฟเวอร์ในบ้านการตรวจสอบด้วยตนเองมักจะดีกว่า ชอบมาก

smartctl -a / dev / sda

ข้อมูลจำนวนมากพ่นออกมา สิ่งที่ฉันสนใจมากที่สุดคือ:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE

  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       13946
 13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   075   066   000    Old_age   Always       -       25
194 Temperature_Celsius     0x0022   075   064   000    Old_age   Always       -       25
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   100   000    Old_age   Always       -       0

วิธีนี้ช่วยให้คุณสามารถวัดค่าสุขภาพไดรฟ์ได้ เมื่ออัตราความผิดพลาดเริ่มขึ้นเวลาในการค้นหาการแทนที่ นอกจากนี้คุณสามารถตรวจสอบว่าพวกเขาจะไม่ร้อน


2

บางอย่างเช่น "mdadm --query --detail / dev / md0" ควรใช้งานได้ แต่เมื่อไดรฟ์ล้มเหลวจริง ๆ รูทจะได้รับอีเมล เพียงตรวจสอบการแจ้งเตือนว่าล้มเหลว (เช่น: mdadm --manage / dev / md0 --fail / dev / sda1) และคุณจะมั่นใจ 100%


2

คุณจะต้องการติดตั้ง smartd และดูตัวเลือกการกำหนดค่าของคุณ

สำหรับฉันฉันได้ตรวจสอบดิสก์ RAID ของฉันโดยเฉพาะ:

/dev/sda -a
/dev/sdb -a
/dev/sdc -a

สิ่งนี้ทำให้ฉันได้รับการตรวจสอบสิ่งที่ฉันต้องการ

คุณยังสามารถตั้งค่า smartd เพื่อทำการทดสอบไดรฟ์แบบเต็มตามเวลาที่กำหนด


นอกจากนี้คุณยังสามารถจ้าง mdadm เพื่อตรวจสอบการจู่โจมได้เองตามที่ Pitr แนะนำ แต่คุณต้องการทำทั้งสองอย่าง
Mike
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.