คอนโทรลเลอร์คอนโทรลเลอร์ระบุว่าดิสก์ใดมีข้อบกพร่อง


0

ดังนั้นสำหรับฉันที่ใช้พาริตี้ XOR ฉันไม่สามารถระบุได้ว่าดิสก์ใดมีข้อบกพร่องในชุดแถบ

สมมติว่าหนึ่งในดิสก์ในชุดนั้นกำลังทำการเปิดบิตบนแผ่นดิสก์ (หรือที่รู้จักกันในชื่อ rot rot) แบบเงียบ ๆ ตัวอย่างเช่นเนื่องจากเฟิร์มแวร์ไม่ดี ดิสก์ไม่ได้ล้มเหลวหรือรายงานการบล็อกที่ไม่ดี แต่บางครั้งก็มีข้อผูกมัดกับดิสก์อย่างอื่นมากกว่าอินพุต

การใช้ XOR เช่นเดียวกับการตรวจสอบอื่น ๆ จะไม่บอกว่าดิสก์ใดในแถบนั้นเป็นสาเหตุของการคำนวณพาริตีที่ไม่ดี แต่คุณรู้ว่าดิสก์ตัวใดตัวหนึ่งมีปัญหา

สถานการณ์นี้ต้องแก้ไขได้อย่างไรด้วยข้อ จำกัด ของการจู่โจม 5 แต่จริงๆแล้วมันทำให้ฉันหลง ฉันสามารถจินตนาการได้ว่าการจู่โจม -6 พร้อมแนวนอน (Raid-4'ish) และความเสมอภาคในแนวทแยงสามารถสามเหลี่ยมบล็อกที่ไม่ดีและแสดงให้เห็นว่าดิสก์ใดมีพื้นที่ที่ไม่ดี .... แต่คำถามนี้เกี่ยวข้องกับชุดบุก -5

ขอบคุณล่วงหน้า.


RAID ชนิดใดกันแน่? คำตอบสำหรับคำถามนั้นจะกำหนดวิธีการตรวจพบดิสก์ที่ไม่ดีหรือหากเป็นไปได้ที่จะตรวจพบดิสก์ ข้อมูลที่เฉพาะเจาะจงมากขึ้นที่คุณให้คำตอบที่ดีกว่าสามารถให้
Ramhound

ทฤษฏีการจู่โจมใด ๆ ที่ใช้แฮคเกอร์ในทางทฤษฎีจะได้รับผลกระทบ แต่เพื่อเป็นตัวอย่าง ... ลองสมมติว่าการกำหนดค่า RAID-5 มาตรฐาน แต่คุณอาจไปด้วยการจู่โจม -4 ถ้าใช้งานได้
Jon Disnard

RAID 4 และ RAID 5 ใช้บิตพาริตี ถ้าฉันขับได้บิตที่ไม่ดีมันถือว่าแย่
Ramhound

นั่นถูกต้องพาริตีคือการคำนวณ XOR การคำนวณความเท่าเทียมกันสามารถเปิดเผยว่า A) ไม่มี porblem หรือ B) มีปัญหา แต่ไม่เปิดเผยว่าสมาชิกชุดแถบใดมีปัญหา
Jon Disnard

ไดรฟ์ส่วนใหญ่มีวิธีการตรวจสอบภายใน 'บิตเน่า' ตามที่คุณเรียกดูเหมือนว่าควรส่งผลให้เกิดการตรวจสอบล้มเหลวในไดรฟ์ที่มีบิตเน่า นอกจากนี้ความล้มเหลวของเฟิร์มแวร์นั้นหาได้ยากมาก ปัญหาทางกายภาพบนดิสก์เป็นปัญหาที่พบบ่อยที่สุด RAID5 นั้นไม่สมบูรณ์แบบ อาจมีหลายกรณีที่มันเป็นไปไม่ได้ที่คอนโทรลเลอร์ RAID จะรู้
Zoredache

คำตอบ:


2

ตัวควบคุม RAID กำหนดว่าดิสก์ใดที่มีข้อผิดพลาดโดยดูว่ามีอันใดที่โยนข้อผิดพลาด I / O หรือไม่ตอบสนอง

ฮาร์ดไดรฟ์สมัยใหม่ (เช่นที่เกิดขึ้นในช่วง 20 ปีที่ผ่านมา) ใช้ ECC ระดับภาคเพื่อตรวจจับและแก้ไขข้อผิดพลาดแบบบิตฟลิป ระบบ ECC ที่ใช้อยู่ในปัจจุบันสามารถแก้ไขข้อผิดพลาดบิตเดียวใด ๆ ในภาคและสามารถเห็นข้อผิดพลาดสองบิตทั้งหมด หากการอ่านซ้ำของเซกเตอร์ก่อให้เกิดข้อผิดพลาดบิตเดียวอย่างต่อเนื่องเฟิร์มแวร์ของไดรฟ์จะทำการแมปเซกเตอร์ไปยังส่วนที่ไม่ได้ใช้ของไดรฟ์ (ฮาร์ดไดรฟ์ทันสมัย หากเกิดข้อผิดพลาดสองบิตเฟิร์มแวร์จะรายงานข้อผิดพลาด I / O ไปยังคอนโทรลเลอร์และ RAID คอนโทรลเลอร์จะทำเครื่องหมายว่าไดรฟ์ล้มเหลว เพื่อให้ข้อมูลเสียหายอย่างตรวจจับไม่ได้อย่างน้อยสามบิตในเซกเตอร์เดียวต้องพลิก - เหตุการณ์ที่หายากหายไป

หากคุณสงสัยว่าเฟิร์มแวร์ที่ไม่ดีกำลังทำให้บิตพลิกคุณสามารถมองเห็นสิ่งนี้ได้ที่ระดับ RAID (สำหรับ RAID 1, 10, 5 และ 6) โดยใช้การตรวจสอบความสอดคล้อง แต่สิ่งนี้จะบอกคุณว่ามีลายเส้นตรงที่ การมิร์เรอร์ไม่ตรงกัน มันจะไม่บอกคุณว่าไดรฟ์ไหนไม่ดี คุณสามารถค้นหาไดรฟ์ที่ไม่ดีได้โดยการดึงไดรฟ์ออกจากอาเรย์และใช้ "การสแกนพื้นผิว" เพื่อบล็อกที่ไม่ดีด้วยเครื่องมือตรวจสอบดิสก์ที่คุณชื่นชอบ: หากเฟิร์มแวร์ไม่ดี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.