วิธีทำให้ smartd ปิดภาคที่ไม่สามารถแก้ไขได้แบบออฟไลน์โดยเฉพาะ


18

ฉันมีดิสก์ในซอฟต์แวร์สองดิสก์ RAID-1 ซึ่งเมื่อเร็ว ๆ นี้ "เซกเตอร์ที่ไม่สามารถแก้ไขได้แบบออฟไลน์" ปรากฏในสถานะสมาร์ท

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

เห็นได้ชัดว่านี่เป็นเพียงสัญลักษณ์ของความล้มเหลวของดิสก์ที่ใกล้เข้ามาหากเกิดขึ้นบ่อยขึ้น (และเนื่องจากไดรฟ์ถูกทำมิเรอร์จึงไม่มีความเสี่ยงในการสูญหายของข้อมูลจริงเช่นกัน) ในบางครั้งการทดสอบตัวเองก็ล้มเหลวในบางครั้งและsmartdส่งอีเมลถึงฉันเพื่อแจ้งให้ฉันทราบถึงสิ่งที่ควรทำ

อย่างไรก็ตามการเขียนไปยังเซกเตอร์ที่เสียหายมักทำให้ดิสก์ใช้เซกเตอร์สำรองอย่างใดอย่างหนึ่งแทนซึ่งเห็นได้ชัดว่าเป็นเพราะตั้งแต่ฉันเขียนddทับดิสก์การทดสอบตัวเองทั้งหมดก็ทำได้ดี และbadblocksก็ไม่มีเหตุผลที่จะบ่น

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

จำนวนของภาคที่ผิดพลาดไม่ได้ลดลงแม้ว่ามันจะไม่ควรจริง ๆ เนื่องจากภาคที่เสียหายยังคงอยู่ถึงแม้ว่าจะไม่ได้ใช้ อย่างไรก็ตามsmartdส่งอีเมลถึงฉันทุกคืน:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

นี่เป็นเรื่องที่น่ารำคาญอย่างมากและทำให้ฉันรู้สึกตื่นตระหนกกับsmartdอีเมล

ดิสก์เป็น Western Digital WD20EARS และsmartdรุ่นคือ 5.41 2011-06-09 r3365

คำตอบ:


23

ในบางดิสก์คุณอาจต้องใช้-U 198+(หรือ-U +?) ในไฟล์ปรับแต่ง

โปรดระวัง. หากคุณไม่ใช่ผู้ถามที่เป็นต้นฉบับให้อ่านคำถามทั้งหมดอย่างถี่ถ้วน หากคุณใช้สิ่งนี้กับดิสก์ที่ไม่ต้องการใช้งานมันจะหยุดการเตือนที่ถูกต้องทั้งหมด

หากระบุ ´+´ รายงานจะถูกพิมพ์ก็ต่อเมื่อจำนวนวินาทีเพิ่มขึ้นตั้งแต่รอบการตรวจสอบล่าสุด ดิสก์บางตัวไม่รีเซ็ตแอตทริบิวต์นี้เมื่อมีการจัดสรรเซกเตอร์ที่ไม่ดีใหม่ ดูเพิ่มเติม ´-v 198 เพิ่มขึ้น´ ด้านล่าง

smartd.conf (5)

smartd.confตัวอย่างเช่นสมมติว่าคุณกำลังใช้กำหนดค่าเริ่มต้นใน ในกรณีนี้มีความคิดเห็นมากมายในไฟล์ แต่บรรทัดที่ไม่ใช่ความคิดเห็นมีเพียงที่นี่:

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

เพิ่มตัวเลือกไปที่ท้ายบรรทัด:

DEVICESCAN -U 198+

1
-U 198+ควรทำมัน ยินดีที่ได้พบ!
Michael Hampton

มีข้อสอบอะไรบ้าง?
JIV

1
@JIV แก้ไขแล้ว ฉันยังเพิ่มคำเตือน โปรดใช้ความระมัดระวังเนื่องจากข้อมูลของคุณ :-)
sourcejedi

0

มีความเป็นไปได้สองทางที่อีเมลเหล่านี้มาจาก smartd สามารถส่งจดหมายด้วยตัวเอง แต่ส่วนใหญ่ไม่ได้กำหนดค่าด้วยวิธีนี้ดังนั้นฉันคิดว่าอีเมลเหล่านี้ถูกส่งโดย logcheck หากสมมติฐานนี้ผิดคุณไม่จำเป็นต้องอ่านเพิ่มเติม

logcheck สแกนไฟล์บันทึกและส่งอีเมลหากคิดว่าคุณควรกังวลเกี่ยวกับสิ่งที่เกิดขึ้นกับ / บนระบบของคุณ

คุณมีตัวเลือกในการเขียนกฎการไม่สนใจ logcheck ซึ่งจะบอกให้ logcheck ไม่ส่งข้อความที่ตรงกับรูปแบบเฉพาะ

คุณสามารถ (ภายใต้ระบบที่ใช้เดเบียน) สร้างไฟล์ชื่อ "/etc/logcheck/ignore.d.server/smartd_own" ด้วยเนื้อหาต่อไปนี้:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

สิ่งนี้ควรกรองอีเมลที่น่ารำคาญ แต่เขียนคุณอีกครั้งหากตัวนับเซกเตอร์ที่ไม่สามารถแก้ไขได้เพิ่มขึ้น


smartdส่งข้อความโดยตรงโชคไม่ดี เห็นได้ชัดว่าเป็นตัวเลือกที่จะเปลี่ยนแปลงสิ่งนี้เสมอ ฉันจะพิจารณาสิ่งนี้หากไม่ควรมีวิธีอื่นขอบคุณมาก!
Christian

โอ้ตอนนี้คุณมีวิธีแก้ปัญหาแล้ว
hennr
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.