จะกำหนดจำนวนรอบการเขียนหรืออายุการใช้งานที่คาดหวังสำหรับ SSD ภายใต้ Linux ได้อย่างไร?


10

เราใช้ SSD (Intel X25-M) ในเซิร์ฟเวอร์ Linux (RHEL 5) มาระยะหนึ่งแล้ว แต่ไม่เคยพยายามคิดเลยว่าปริมาณการเขียนนั้นต่ำกว่าเท่าไหร่ในปีที่ผ่านมา มีเครื่องมือใดบ้างใน Linux ที่จะบอกเราว่ามีการเขียนลงดิสก์ในช่วงระยะเวลาหนึ่งหรือมากกว่านั้นหรือยัง แค่มองหาคำใบ้เพื่อดูว่ามันใกล้จะตายแล้วหรือยัง ...

คำตอบ:


13

Intel SSDs เก็บสถิติเกี่ยวกับการเขียนทั้งหมดและระยะเวลาที่มันน่าจะเป็น

ต่อไปนี้มาจาก Intel X25-M G2 160GB (SSDSA2M160G2GC)

# smartctl -data -A /dev/sda
smartctl 5.40 2010-10-16 r3189 [x86_64-redhat-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       6855
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       68
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148487
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       3168
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       1
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       1950295543
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

ค่าดิบ Host_Writes_32MIB แสดงจำนวนข้อมูล 32MiB ที่เขียนลงในไดรฟ์นี้

ค่า Media_Wearout_Indicator จะแสดงเปอร์เซ็นต์ปกติของระยะเวลาการสึกหรอของไดรฟ์ที่มีประโยชน์ตามปกติ สิ่งนี้เริ่มต้นที่ 100 (หรือ 099 ฉันลืมไปแล้ว) และดำเนินต่อไปที่ 001 ซึ่ง Intel คิดว่าไดรฟ์นั้นมีอายุการใช้งานที่ยาวนาน Intel ใช้ MWI เป็นส่วนหนึ่งของการเรียกร้องการรับประกันเช่นกันเมื่อ MWI ถึง 001 การรับประกันจะหมดอายุ

MWI ถึง 001 ไม่ได้หมายความว่าไดรฟ์จะล้มเหลวทันที! Intel จะมีความอดทนในตัวเพื่อจัดการกับความแปรปรวนในหน่วยแฟลช ฉันเคยเห็นไดรฟ์ที่ผ่านจุดนี้มานานแล้วและฉันสวมการทดสอบ SSD 320 Intel บางรุ่นเพื่อดูว่าพวกเขาใช้งานได้นานเท่าใด

อย่างไรก็ตามเมื่อการรับประกันสิ้นสุดลงเมื่อ MWI ถึง 001 ฉันจะเปลี่ยนไดรฟ์ที่จุดนั้น


สำหรับการอ้างอิงในอนาคตMedia_Wearout_Indicatorเริ่มต้นที่ 100 สำหรับ Intel 520 Series SSD ของฉัน
pableu

เป็นที่น่าสังเกตว่าแม้ว่าไดรฟ์จะไม่ "ล้มเหลว" เมื่อถึง 001 ในบางจุดหลังจากนั้น (อาจจะนานหลังจากนั้น) ความสามารถของไดรฟ์บางอย่างในการเก็บข้อมูลเมื่อไฟฟ้าดับลงจนถึงเวลาอันสั้นอย่างน่าตกใจ . ฉันคิดว่ามีการทดสอบความทนทานที่โพสต์ออนไลน์ที่วัดค่านี้
sa289

6

Corsair ไดรฟ์ส่งออกตัวบ่งชี้เปอร์เซ็นต์ชีวิตซ้ายที่คล้ายกัน ในกรณีของพวกเขามันเป็นแอตทริบิวต์ 231:

231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0

(โปรดทราบว่าหาก smartctl แสดงสิ่งนี้เป็นอุณหภูมิคุณต้องอัปเดตฐานข้อมูลอุปกรณ์ของคุณบนระบบ Debian ของฉันซึ่งหมายถึงการทำงาน/usr/sbin/update-smart-drivedb)

โพสต์โจรสลัดบล็อกดูเหมือนว่าจะแสดงให้เห็นว่าค่าที่ไม่เคยไปต่ำกว่า 10% ดังนั้นผมจึงคิดว่ามันควรจะถูกแทนที่ที่ 10%

ฉันยังมีไดรฟ์ OCZ ที่มีตัวควบคุม Sandforce เดียวกันซึ่งส่งออก SSD_Life_Left ค่าเดียวกัน


3

Media_Wearout_Indicator คือสิ่งที่คุณกำลังมองหา สำหรับ 100 หมายความว่า ssd ของคุณมีชีวิต 100% จำนวนที่ต่ำกว่าหมายถึงชีวิตที่เหลือน้อยลง

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

ส่งออกจากแล็ปท็อปของฉัน

233 Media_Wearout_Indicator 0×0032 100 100 000 Old_age Always – 0

หากคุณต้องการดูรายละเอียดเพิ่มเติมและคุณสมบัติทั้งหมดจากไดรฟ์ของคุณคุณสามารถเรียกใช้

# smartctl -data -A /dev/sda

และเอาท์พุท

# smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-49-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0×0032 100 100 000 Old_age Always – 0
9 Power_On_Hours 0×0032 000 000 000 Old_age Always – 232959027031342
12 Power_Cycle_Count 0×0032 100 100 000 Old_age Always – 279
170 Unknown_Attribute 0×0033 100 100 010 Pre-fail Always – 0
171 Unknown_Attribute 0×0032 100 100 000 Old_age Always – 0
172 Unknown_Attribute 0×0032 100 100 000 Old_age Always – 0
174 Unknown_Attribute 0×0032 100 100 000 Old_age Always – 278
184 End-to-End_Error 0×0033 100 100 090 Pre-fail Always – 0
187 Reported_Uncorrect 0×0032 100 100 000 Old_age Always – 0
192 Power-Off_Retract_Count 0×0032 100 100 000 Old_age Always – 278
225 Load_Cycle_Count 0×0032 100 100 000 Old_age Always – 10752
226 Load-in_Time 0×0032 100 100 000 Old_age Always – 65535
227 Torq-amp_Count 0×0032 100 100 000 Old_age Always – 66
228 Power-off_Retract_Count 0×0032 100 100 000 Old_age Always – 65535
232 Available_Reservd_Space 0×0033 100 100 010 Pre-fail Always – 0
233 Media_Wearout_Indicator 0×0032 100 100 000 Old_age Always – 0
241 Total_LBAs_Written 0×0032 100 100 000 Old_age Always – 10752
242 Total_LBAs_Read 0×0032 100 100 000 Old_age Always – 21803
249 Unknown_Attribute 0×0013 100 100 000 Pre-fail Always – 357

http://namhuy.net/1024/how-to-check-ssd-life-left.html


มีประโยชน์ที่จะกล่าวถึงว่าในกรณีนี้ควรใช้ค่าปกติ
Falcon Momot

1

ไม่ได้จริงๆ หากไดรฟ์ไม่เก็บสถิติคุณจะไม่ทราบแน่นอน แม้กระทั่งไดรฟ์ก็จะสรุปอัลกอริธึมการปรับระดับการเขียนและพยายามปรับสิ่งต่าง ๆ ให้เหมาะสมภายใต้ประทุน กล่าวอีกนัยหนึ่งไดรฟ์อาจโกหกคุณได้อย่างง่ายดายว่าข้อมูลถูกเขียนลงใน "สื่อ" จริงหรือไม่ดังนั้นคุณจะไม่ทราบว่าเซลล์กำลังทำอะไรอยู่

ที่ยังไม่รับประกันเมื่อ / ถ้าคุณจะเห็นความล้มเหลวหรือข้อผิดพลาด ไดรฟ์อาจล้มเหลวในวันพรุ่งนี้อาจล้มเหลวในสามปี

ทางออกที่ดีที่สุดคือการเก็บไว้ในการกำหนดค่า RAID และมีแผนในการแทนที่เมื่อมันล้มเหลว (ก่อนที่ไดรฟ์อื่นล้มเหลว) และทำให้แน่ใจว่าการสำรองข้อมูลของคุณเป็นปัจจุบัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.