ใช่มันเป็นปัญหาส่วนใหญ่เป็นขนาดไดรฟ์ขึ้นไป ไดรฟ์ SATA ส่วนใหญ่มีอัตรา URE (ข้อผิดพลาดในการอ่านที่แก้ไขไม่ได้) ที่ 10 ^ 14 หรือทุก ๆ 12TB ของข้อมูลที่อ่านทางสถิติผู้จำหน่ายไดรฟ์กล่าวว่าไดรฟ์จะคืนค่าการอ่านที่ล้มเหลว ไดรฟ์จะยังคงทำงานได้ดีสำหรับส่วนอื่น ๆ ทั้งหมดของไดรฟ์ โดยทั่วไปแล้วไดรฟ์ Enterprise FC & SCSI มีอัตรา URE ที่ 10 ^ 15 (120TB) พร้อมกับไดรฟ์ SATA จำนวนน้อยซึ่งช่วยลด
ฉันไม่เคยเห็นดิสก์หยุดหมุนในเวลาเดียวกัน แต่ฉันมีโวลุ่ม RAID5 ที่กระทบกับปัญหานี้ (5 ปีที่แล้วกับไดรฟ์ PATA ผู้บริโภค 5400 รอบต่อนาที) ไดรฟ์ล้มเหลวมันถูกทำเครื่องหมายว่าตายแล้วและการสร้างใหม่เกิดขึ้นกับไดรฟ์สำรอง ปัญหาคือในระหว่างการสร้างใหม่ไดรฟ์ที่สองไม่สามารถอ่านบล็อกเล็ก ๆ ของข้อมูล ปริมาณทั้งหมดอาจตายหรือบล็อกเล็ก ๆ นั้นอาจตาย สมมติว่าเป็นเพียงบล็อกเดียวเท่านั้นที่ตายถ้าคุณพยายามอ่านคุณจะได้รับข้อผิดพลาด แต่ถ้าคุณเขียนลงไปไดรฟ์จะทำการแมปใหม่ไปยังตำแหน่งอื่น
มีหลายวิธีในการป้องกัน: raid6 (หรือเทียบเท่า) ซึ่งป้องกันความล้มเหลวของดิสก์สองตัวที่ดีที่สุดวิธีเพิ่มเติมคือระบบไฟล์ URE ที่รู้ตัวเช่น ZFS โดยใช้กลุ่มการโจมตีที่เล็กลง ข้อ จำกัด (มิรเรอร์ไดรฟ์ขนาดใหญ่หรือไดรฟ์ RAID5 ที่มีขนาดเล็กลง) การขัดดิสก์ & SMART ช่วยได้ แต่ไม่ใช่การป้องกันในตัวเองจริงๆ แต่ใช้นอกเหนือจากหนึ่งในวิธีการข้างต้น
ฉันจัดการแกนหมุนเกือบ 3,000 ลูกในอาร์เรย์และอาร์เรย์นั้นขัดถูไดรฟ์อย่างต่อเนื่องเพื่อค้นหา URE ที่แฝงอยู่ และฉันได้รับกระแสข้อมูลที่ค่อนข้างคงที่ (ทุกครั้งที่พบมันแก้ไขก่อนไดร์ฟล้มเหลวและแจ้งเตือนฉัน) ถ้าฉันใช้ raid5 แทนที่จะเป็น raid6 และไดรฟ์ตัวใดตัวหนึ่งตายไปหมด ... ฉันต้องการ จะมีปัญหาถ้ามันตีบางตำแหน่ง