SSD ล้มเหลวอย่างไรในช่วงสุดท้ายของชีวิต?


9

สมมติว่า MLC SSD ใช้เวลานานมากและเซลล์แรกได้เข้าสู่รอบการลบครั้งสุดท้ายและปฏิเสธที่จะลบ

หลังจากนั้นจะเกิดอะไรขึ้น คอนโทรลเลอร์ตรวจพบว่าเป็นบล็อกที่ไม่ดีและย้ายไปยังบล็อกถัดไปและพยายามลบมันแทนหรือไม่ ความจุทั้งหมดของไดรฟ์จะลดลงอย่างช้าๆเมื่อเวลาผ่านไปหรือไม่

แก้ไข

และแน่นอนเราสามารถลืมเกี่ยวกับการปรับระดับการสวมใส่ ใช่มันยืดอายุของไดรฟ์ แต่ฉันไม่ได้พูดถึงเรื่องนั้น ในที่สุดเซลล์จะเข้าสู่รอบการลบครั้งสุดท้าย

คำตอบ:


8

ชิปแฟลช NAND มีกลไกในตัวเพื่อตรวจสอบความล้มเหลวในการเขียนและลบและจะแจ้งเตือนให้คอนโทรลเลอร์ทราบหากล้มเหลว ในกรณีนี้ผู้ควบคุมสามารถลองอีกครั้งหรือถือว่าบล็อกนั้นไม่ดีและแมปจากอัลกอริธึมการปรับระดับการสึกหรอ แต่ละหน้าในอุปกรณ์ NAND ยังมีพื้นที่ว่างข้างพื้นที่ข้อมูลหลักซึ่งมีไว้สำหรับข้อมูลเมตาเช่น ECC และรูปแบบอื่น ๆ ของการตรวจจับข้อผิดพลาดและความอดทน ตัวควบคุมสามารถตัดสินใจเลือกรูปแบบการยอมรับความผิดของตนเองโดยใช้พื้นที่ว่าง Hamming Codesเป็นหนึ่งในรูปแบบทั่วไปแม้ว่าจะมีอยู่หลายอย่างรวมถึงบิตพาริตีธรรมดาและรหัส Reed-Solomon. หากสิ่งต่าง ๆ ไม่ตรงกันในการอ่านอีกครั้งตัวควบคุมมีอิสระที่จะทำตามที่พอใจ ตามหลักแล้วมันจะแมปบล็อกเหล่านี้ออกมาจากอัลกอริธึมการเลื่อนระดับการสึกหรอและคุณจะสูญเสียความจุทีละน้อยจนกระทั่งบล็อก "มากเกินไป" ล้มเหลวโดยที่ "มากเกินไป" ขึ้นอยู่กับอัลกอริทึมและขนาดโครงสร้างฮาร์ดแวร์ภายในตัวควบคุม คอนโทรลเลอร์ตัวแรกที่ตัดหลายตัวออกแบบเพียงประกาศข้อผิดพลาดไปยังระบบปฏิบัติการ

โปรดทราบว่านี่ไม่ใช่ปัญหาเฉพาะของ MLC แม้ว่าเซลล์ MLC อาจมีแนวโน้มที่จะเกิดข้อผิดพลาดในการอ่านมากขึ้นเนื่องจากจำเป็นต้องมีระยะขอบที่น้อยกว่าสำหรับข้อผิดพลาดเซลล์ SLC ล้มเหลวด้วยกลไกเดียวกันส่วนใหญ่และสามารถจัดการโดยตัวควบคุมในลักษณะเดียวกัน


2

เช่นเดียวกับฮาร์ดดิสก์มันขึ้นอยู่กับการใช้งานในระบบปฏิบัติการ คอนโทรลเลอร์จะรายงานว่าการเขียน (การลบเป็นการดำเนินการเขียนจริง) ล้มเหลวและขึ้นอยู่กับไดรเวอร์ devide ในเคอร์เนลระบบปฏิบัติการเพื่อตัดสินใจว่าจะทำอย่างไร จากสิ่งที่ฉันเห็นจนถึงขณะนี้การใช้งาน Microsoft และ Linux เพียงแค่ส่งคืนรหัสข้อผิดพลาดไปยังแอปพลิเคชันการโทร - เพื่อให้เกิดข้อผิดพลาด I / O

ในระยะสั้น: คุณเพียงแค่ได้รับอุปกรณ์ "เสีย" ในบางจุด


นั่นมันแย่มาก ไม่ได้เป็นนามธรรมที่ดีมากแล้ว ...
Pyrolistical

1
และผิด หลักนี้จะจัดการใน SSD เอง - ไม่ใช่ไดรเวอร์อุปกรณ์ เพราะนี่เป็นการดำเนินงานปกติ การปรับระดับการสึกหรอจะบันทึกเซกเตอร์ว่าล้มเหลวและทำการแมปเซกเตอร์ใหม่
TomTom

1

SSD ใช้สิ่งที่เรียกว่า "wear leveling" ซึ่งไดรฟ์เก็บสถิติเกี่ยวกับการใช้งานเซกเตอร์และในบางจุดหรือเมื่อตรวจพบปัญหาก็จะย้ายเซกเตอร์ไปยังส่วนสำรองหนึ่งเหมือนที่เกิดขึ้นกับฮาร์ดไดรฟ์ปกติ


ใช่ แต่ฉันเห็นกลไก HD ล้มเหลวทางกลไกก่อนที่จะหมดเซกเตอร์สำรอง SSD อาจไม่ทำงาน จะเกิดอะไรขึ้นเมื่อไดรฟ์หมดส่วนที่สงวนไว้
Pyrolistical

ข้อผิดพลาดในการเขียน คุณคาดหวังอะไรอีก
TomTom
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.