คุณทดสอบความเครียดกับฮาร์ดไดรฟ์ของคุณอย่างไร?


3

เมื่อมองหาไดรฟ์ใหม่ขนาดใหญ่ (> = 1 TB) บน newegg และอื่น ๆ ที่คล้ายกันฉันบันทึกความเห็นจำนวนมากที่พูดถึงไดรฟ์ที่เป็น DOA หรือกดปุ่ม Click of Death (หรือปล่อยควัน Magic) ภายในหนึ่งสัปดาห์ ใช้. ส่วนหนึ่งของความคิดเห็นพูดถึงปรากฏการณ์นี้ว่าไดรฟ์ที่มีปัญหาคือ Western Digital, Hitachi หรืออะไรก็ตาม

สำหรับผู้ที่ใช้ Windows คุณจะทำอะไร:

1) วางความเครียดเริ่มต้นขนาดใหญ่ไว้ที่ไดรฟ์เพื่อดูว่าสามารถใช้งานได้หรือไม่ นานแค่ไหน?

2) ทดสอบไดรฟ์ในภายหลัง (สมมุติว่าใช้เครื่องมือ SMART หรืออื่น ๆ ) เพื่อดูว่ามีการเปลี่ยนแปลงในเชิงลบหรือไม่?

หมายเหตุ: นี่เป็นองค์ประกอบหนึ่งของแผนขนาดใหญ่สำหรับทั้งความพร้อมใช้งานสูงและการสำรองข้อมูลสำหรับข้อมูลบ้านของฉัน

คำตอบ:


5

เวลาเฉลี่ยปัจจุบันระหว่างความล้มเหลว (MTBF) สำหรับไดรฟ์ SATA สำหรับผู้บริโภคคือบิตการเขียน 10 ^ 14 ซึ่งหมายความว่าหากคุณมีไดรฟ์ 2TB และเขียนทุก ๆ 50 บิตบนไดรฟ์แล้วลองอ่านทุก ๆ บิตคุณจะมีความล้มเหลวของดิสก์ในเวลานั้น
Google ได้ทำการวิเคราะห์ทางสถิติของดิสก์สำหรับผู้บริโภคจำนวนมากและได้ระบุถึงแนวโน้มหลายประการสิ่งที่สำคัญที่สุดสำหรับคำถามของคุณคือคุณจะได้รับโอกาส 10% ของความล้มเหลวใน 3 เดือนแรกหากคุณใส่ดิสก์ในการใช้งานสูง การทดสอบความเครียด). หากมันผ่านไป 3-6 เดือนแรกมันจะมีอายุ 3-4 ปีก่อนที่อัตราความล้มเหลวจะเริ่มกลับมาอีกครั้ง
มันเป็นการอ่านที่น่าสนใจถ้าคุณชอบสถิติและแม้แต่พวกเราที่ยังไม่ได้รับความคิดจากกราฟ ...
ลิงค์ของ Google
แหล่งข้อมูลอื่นคือCarnegie Mellon

แก้ไข: อีกสิ่งหนึ่งที่เกี่ยวข้องกับคำถามของคุณจากกระดาษของ Google คืออัตราเหล่านี้ใช้กับผู้ผลิตไดรฟ์ทั้งหมด Google ซื้ออะไรก็ตามที่มอบ MB ให้ได้มากที่สุด


ฉันอ่านกระดาษแล้ว กระดาษเป็นสิ่งที่กระตุ้นให้คำถามของฉันเกี่ยวกับการทดสอบความเครียดและข้อสรุปว่ามันลงไปเป็นแบทช์ในบางรุ่นแทนที่จะเป็นผู้ผลิตไดรฟ์คือเหตุผลที่ฉันทำให้ผู้ผลิตคำถามไม่เชื่อเรื่องพระเจ้าโดยสังเกตว่าปรากฎการณ์ปรากฏบนไดรฟ์ทั้งหมด

อืม. ที่เลข 10 ^ 14 ถูกนำมาใช้เล็กน้อยบริบทที่นี่ บิต 10 ^ 14 เป็นอัตราข้อผิดพลาดบิตที่ไม่สามารถกู้คืนได้ ... ซึ่งเป็นตำแหน่งที่บิตตรวจไม่พบการพลิกบนดิสก์ทำให้เกิดเซกเตอร์ที่อ่านไม่ได้ ไม่ใช่ความล้มเหลวของดิสก์ แต่จะทำให้ไฟล์ดังกล่าวเสียหายหากคุณไม่ได้ใช้งาน RAID เพื่อให้สามารถจัดการกับข้อผิดพลาดได้
3dinfluence

@ 3dinfluence: ขึ้นอยู่กับคำจำกัดความของคุณเกี่ยวกับความล้มเหลวของไดรฟ์ กระดาษ Carnegie Mellon ทำให้คำถามนี้เกิดขึ้น: คำจำกัดความของความล้มเหลวของไดรฟ์คืออะไร สำหรับผู้ผลิตปัญหาการเขียนแบบเงียบ (บิตพลิก) สำหรับผู้บริโภคอาจเป็น 100% ของเวลา ฉันไม่เคยเจอใครที่จะบอกว่าไดรฟ์สูญเสียข้อมูลของฉัน แต่มันไม่ได้ล้มเหลว ยาวและระยะสั้นผมไม่เชื่อว่า 10 ^ 14 ออกจากบริบท ...

1
@Scott Lundberg: คำถามคือเกี่ยวกับความล้มเหลวของไดรฟ์ไม่ใช่ข้อผิดพลาดในการขับขี่ นี่เป็นข้อผิดพลาดไม่ต้องสงสัยเลยว่า แต่ไม่มีวิธีที่จะหลีกเลี่ยงข้อผิดพลาดนี้ได้คุณสามารถพยายามลดความเสี่ยงที่อาจเกิดขึ้นได้ ในทางสถิติคุณมีแนวโน้มที่จะพบข้อผิดพลาดนี้จากการอ่านใด ๆ จากไดรฟ์ มันไม่มีอะไรเกี่ยวข้องกับถ้าไดรฟ์มีสุขภาพดีหรือไม่ คุณยังสามารถเขียนข้อมูลกลับไปยังจุดเดิมบนไดรฟ์และอ่านมันกลับมาสำเร็จ อันตรายที่แท้จริงที่นี่กำลังทำงานอยู่ในข้อผิดพลาดนี้ในระหว่างการสร้าง RAID5 ที่ลดระดับลงใหม่ blogs.zdnet.com/storage/?p=162
3dinfluence

ยุติธรรมพอสมควร เดาว่าเราจะต้องปล่อยให้ OP ตัดสินใจว่าสิ่งที่เขารู้สึกคือความล้มเหลว :-)

4

ฉันไม่เครียดทดสอบพวกเขาเลย แต่ฉันจับตาดูค่าสมาร์ท ฉันใช้ Speedfan หรือ HDtune เพื่อดูข้อมูลอัจฉริยะ


ฉันทำไม่ได้ แต่ใช้piriform.com/speccyเพื่อสังเกตข้อมูลสมาร์ท
Scoregraphic

1

Spinrite ทำสิ่งนี้ทั้งในการกู้คืนข้อมูลที่สูญหายและการป้องกัน เมื่อใช้โหมด 4 จะพลิกแต่ละบิต 4 ครั้ง (เปิด / ปิด / เปิด / ปิดหรือกลับกัน) เพื่อค้นหาเซ็กเตอร์ที่ไม่ดี หากพบพวกเขาจะพยายามแก้ไขและทำเครื่องหมายเซกเตอร์นั้นว่าไม่ดีหรือดำเนินการต่อ การบำรุงรักษาที่ยอดเยี่ยมสำหรับไดรฟ์และการบังคับใช้ข้อมูล SMART

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.