ฉันจะตีความผลลัพธ์ HDD SMART ได้อย่างไร


58

แล็ปท็อปของฉันเพิ่งเริ่มกลายเป็นบิตที่ไม่น่าเชื่อถือและด้วยเหตุผลบางอย่างฉันเริ่มสงสัยว่า HDD ของฉันเริ่มล้มเหลว หลังจากการล่าสัตว์บนอินเทอร์เน็ตฉันพบ Disk Utility ของ Ubuntu ในเมนู System และรันการวินิจฉัย SMART ที่ยาวนานจากสิ่งนี้

อย่างไรก็ตามเนื่องจากเอกสารประกอบสำหรับ Disk Utility แย่มาก ( palimpsest?) ฉันไม่แน่ใจว่าจะตีความผลลัพธ์ได้อย่างไร:

มีมูลค่ามากกว่า 50 ล้านสำหรับอัตราการอ่านผิดพลาด แต่การทดสอบนั้นดีหรือไม่!

ตัวอย่างเช่นอัตราการอ่านผิดพลาดมากกว่า 50 ล้าน (!) แต่การประเมินนั้นอยู่ในระดับ "ดี"

ดังนั้นใครบางคนจะอธิบายให้ฉันอธิบายวิธีการตีความผลลัพธ์ของการทดสอบเหล่านี้ (โดยเฉพาะตัวเลข Normalized, Worst, Threshold และ Value)? และอาจจะบอกฉันว่าพวกเขาคิดอย่างไรกับผลลัพธ์ที่ฉันได้รับจาก HDD? (ขอบคุณ)


"Hardware ECC กู้คืน" ค่าเดียวกันกับ "อ่านอัตราข้อผิดพลาด" หรือไม่ ดิสก์ของฉันมี 676 รอบการใช้พลังงานเปิด 285 วันและมีข้อผิดพลาด 193M เมื่อเทียบกับของฉันดิสก์ของคุณมีข้อผิดพลาดมากเกินไป แต่ฉันแค่คาดเดาที่นี่ ยัง
ไงก็ตาม

Yip - ตัวเลขทั้งคู่เหมือนกัน!
Marty

คำตอบ:


54

คุณมีคำอธิบายที่ดีของการทำงานวิธีการที่สมาร์ทในวิกิพีเดีย แต่คำนำอย่างรวดเร็ว:

  • ค่า: นี่คือค่าดิบที่ตัวควบคุมรายงาน โดยปกติแล้วจะเป็นค่าที่เข้าใจง่าย (เช่นเปิดชั่วโมงหรืออุณหภูมิ) แต่บางครั้งก็ไม่ได้ (เช่นอัตราการอ่านข้อผิดพลาด) ผู้ผลิตต่าง ๆ สามารถใช้โครงสร้างและความหมายต่างกันสำหรับข้อมูลนี้

  • การทำให้เป็นมาตรฐาน: นี่คือค่าข้างต้นที่ทำให้เป็นมาตรฐานเพื่อให้ค่าที่สูงกว่าดีกว่าเสมอ ดังนั้นอัตราการอ่าน / ข้อผิดพลาด 114 ดีกว่า 113 อีกครั้งว่าฮาร์ดไดรฟ์ของคุณแปลงข้อมูลดิบเป็นค่าปกติได้อย่างไร

  • แย่ที่สุด: ค่าปกติที่เลวร้ายที่สุดที่ไดรฟ์ของคุณเคยมีในอดีต (ซึ่ง 99 มีแนวโน้มว่าจะเป็นการตั้งค่าจากโรงงาน)

  • Threshold: เมื่อค่าปกติที่ต่ำกว่าค่านี้ไดรฟ์มีแนวโน้มที่จะล้มเหลว

ดังนั้นฮาร์ดดิสก์ของคุณก็โอเค ค่าของอัตราการอ่านข้อผิดพลาดไม่ใช่เวลาที่ไดรฟ์ของคุณล้มเหลว แต่โครงสร้างข้อมูลบางอย่างที่ขึ้นอยู่กับผู้ผลิตดิสก์ของคุณ


หากไดรฟ์หนึ่งไม่ได้รายงานค่าที่ทำให้เป็นมาตรฐานนั่นหมายความว่าแย่ที่สุดและจะมีการรายงานเกณฑ์ในแง่หรือว่าไดรฟ์ทั้งหมดใช้ค่าปกติและมีเพียงบางคนเท่านั้นที่เลือกที่จะระบุว่าเป็น "ค่า"
DeveloperACE

25

ใช่โดยทั่วไปแล้วค่า raw สำหรับอัตราการอ่านผิดพลาดนั้นไร้สาระ ค่าที่คุณต้องการจับตาดูคือจำนวนเซกเตอร์ที่ถูกจัดสรรใหม่จำนวนที่ค้างอยู่และออฟไลน์ที่ไม่สามารถแก้ไขได้ สิ่งเหล่านี้คือการนับเซกเตอร์ที่ไม่ดีที่รอคอยหรือไม่สามารถแก้ไขได้และค่าดิบโดยทั่วไปก็สมเหตุสมผลและเป็นจำนวนเซกเตอร์

หากการอ่านเซกเตอร์ล้มเหลวมันจะค้างอยู่ ครั้งต่อไปที่คุณพยายามเขียนไปยังเซกเตอร์นั้นไดรฟ์จะพยายามเขียนใหม่และหากใช้งานได้ทุกอย่างจะกลับมาเป็นปกติ หากไม่สามารถเขียนเซกเตอร์ได้อย่างถูกต้องจะทำการจัดสรรเซกเตอร์จากพูลสำรอง หากไม่สามารถทำเช่นนั้นได้ (บางทีมันใช้หมดแล้วในพูลสำรอง?) แสดงว่าออฟไลน์ไม่สามารถแก้ไขได้และพยายามอ่านหรือเขียนถึงข้อผิดพลาด


1
ฉันมีไดรฟ์ที่ค่อนข้างผิดพลาดเพียงแค่อัตราการอ่านผิดพลาดแบบดิบเท่านั้น การทดสอบล้มเหลวหลังจากที่ไดรฟ์ทำงานนาน ๆ หรืออาจ 15 นาที; ภายใต้ Windows อาการคือการเข้าถึงไดรฟ์ใด ๆ ทำให้กระบวนการดังนั้นฉันใช้เครื่องมือ Ubuntu เพื่อตรวจสอบสิ่งที่ผิด แต่ฉันสูญเสียเป็นสิ่งที่มันบอกว่าผิดกับไดรฟ์เนื่องจากอัตราการอ่านข้อผิดพลาดไม่ได้ ' ดูเหมือนจะไม่ได้ระบุถึงความล้มเหลวของไดรฟ์ที่ใกล้จะเกิดขึ้น แต่ไดรฟ์นั้นมีปัญหาอย่างแน่นอน!
Michael

ฉันควรเพิ่มว่าผลการทดสอบตัวเองไม่ชัดเจน การทดสอบโดยรวมบอกว่ามันล้มเหลว แต่การทดสอบอัตราการอ่านข้อผิดพลาดแม้จะมีค่าที่ไร้สาระ (100/100 ที่แย่ที่สุดธรรมดา) กล่าวว่า "ตกลง"
Michael

9

psusi เล็บมัน

ถ้าคุณอ่านแผ่นข้อมูล (เอกสารสีขาว) พูดที่ seagate.com คุณจะเห็นว่า HDD ถูกสร้างขึ้นทดสอบและทำงานอย่างไร ไม่มี HDD ที่สมบูรณ์แบบไม่เคยเป็นไม่เคยจะเป็น (ประวัติและข้อเท็จจริง) ในสมัยก่อนเราต้องป้อนเซกเตอร์เสียลงในตัวควบคุม HDD จากรายการบนกระดาษที่มาในกล่องไดรฟ์ใหม่ดังนั้นตัวควบคุมจะข้ามพวกเขา

ไดรฟ์ที่ทันสมัยมีการแก้ไขข้อผิดพลาด จากวันที่ 1 ภาคส่วนไม่ดี

ดังนั้นพวกเขาจึงทำการแมปซึ่งหมายความว่าไดรฟ์ข้ามเซกเตอร์เสีย ในความเป็นจริงพวกเขา "แลกเปลี่ยนเหตุผล" - เซกเตอร์ที่ไม่ดีจะถูกแมปกับภาคใหม่ที่ดีและกระบอกสูบอะไหล่ (มันมีถังสำรอง - คิดว่าถังเป็นแทร็ค) ทั้งหมดนี้โปร่งใสสำหรับโลกภายนอก - ยกเว้น SMART util

ผู้ผลิตแต่ละรายสามารถทำตามที่ต้องการได้ดังนั้นบางคนตั้งข้อผิดพลาดให้เป็นศูนย์ถึงแม้ว่าอาจจะมีเซกเตอร์เสีย 10 เซ็กเตอร์ทันทีที่ผลิตไดรฟ์

มีกฎอยู่ 3 ครั้งในเฟิร์มแวร์ของไดรฟ์ - มันอ่านเซกเตอร์ 3 ครั้งและถ้าทั้ง 3 ครั้งไม่ดีแล้วมันอาจทำการ "ปรับเทียบ" ใหม่ได้ทันทีและอ่านอีก 3 ครั้ง ถ้าไดรฟ์ยังไม่เป็นไรมันจะแมปเซกเตอร์นั้นกับหนึ่งในเซกเตอร์สำรอง นี่คือลึกในเฟิร์มแวร์ แต่เกิดขึ้นอย่างต่อเนื่องในพื้นหลังทั้งหมดให้กับผู้ใช้โปร่งใส

ผู้ผลิตเลือกที่จะรายงานข้อผิดพลาดแบบดิบเมื่อใดก็ตามที่มีการอ่านที่ไม่ดี 3 ครั้งหรือหลังจากการปรับเทียบนั้นขึ้นอยู่กับพวกเขา เช่นเดียวกับที่เขาพูดไว้ข้างต้นมันไม่สำคัญหากคุณไม่มีไดรฟ์ประเภทเดียวกันและคุณเห็นแนวโน้มแปลก ๆ

จุดที่ 2: HDD ทั้งหมดมีข้อผิดพลาดในการอ่านตามธรรมชาติคุณสามารถเรียนรู้ได้ที่ Seagate เช่นกันหากคุณต้องการ แต่พวกเขาทั้งหมดมีข้อผิดพลาดได้ทันที และจะอ่านอีกครั้งและมักจะผ่านการทดสอบสำหรับข้อผิดพลาด CRC หากไม่ใช่ DRIVE จะพยายามสลับออก หากคุณใช้งานดิสก์เย็นมันจะใช้เวลานานและคุณจะไม่เคยใช้ไส้กุญแจสำรองหมด แต่ดูที่ psusi บอกคุณ!

ฉันพิมพ์สิ่งนี้บนพีซีเครื่องเก่าเรียกใช้ HDD 1GB ตัวแรกที่เคยทำ และยังดีอยู่ (ฉันสำรองข้อมูล) (ไม่มีการระบายความร้อนที่ไม่เคย ... ) ความร้อนคือนักฆ่าอันดับหนึ่งและไฟกระชากฉันใช้ UPS ไชโยและวันที่ดี ฉันหวังว่านี่จะช่วยได้. (เคยเห็นฮาร์ดไดรฟ์ของดาต้าทั่วไปชนหรือไม่และเติมเต็มห้องด้วยขนอลูมิเนียมจำนวนมากตัวชี้นำที่มีความสนุกสนานมากมายกลับมาแล้ว ...

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.