วิธีรีเซ็ตผลลัพธ์ SMART


16

ฉันจะรีเซ็ตผลลัพธ์ SMART ได้อย่างไรจึงไม่ได้ลงทะเบียนผลลัพธ์ก่อนหน้า เหตุผลของฉันคือฉันกำลังทดสอบฮาร์ดไดรฟ์ที่ปิดกันในกรณีปิด นี่เองที่ทำให้หนึ่งใน HDD ไม่สามารถอ่านค่าอุณหภูมิของอากาศ

หลังจากเปิดเคสขึ้น (ซึ่งลดอุณหภูมิของไดรฟ์ทั้งหมด 10 องศาเซลเซียสใน 5 นาที) จากนั้นแยกไดรฟ์ออกอีกเล็กน้อย (3 องศาน้อยกว่า) ผลลัพธ์ทั้งหมดเป็นสิ่งที่ดี แต่เนื่องจากการอ่าน Airflow ล้มเหลวในการอ่านก่อนหน้า แสดงว่าล้มเหลว

ดังนั้นฉันจะรีเซ็ตการอ่านสำหรับ SMART ได้อย่างไร

ป้อนคำอธิบายรูปภาพที่นี่


1
ฉันคิดว่าคุณสามารถใช้ Mhdd เพื่อปิดสมาร์ทได้ด้วยเครื่องมือฟลอปปี้บนsysresccd.org/System-toolsไม่ใช่ความคิดที่ดีที่สุด ... แต่อาจคุ้มค่าที่จะดู
Mateo

2
ทำไมคุณต้องการรีเซ็ต
แองเจโล

เมื่อ 3 ปีที่แล้วเป็นเรื่องปกติ แต่ฉันคิดว่ามันเป็นเพราะในขณะนั้น HDD อยู่ในสถานที่ที่มีความร้อนภายนอกมากมาย หลังจากย้ายไปที่ห้องที่มีอากาศหนาวเย็นมากกว่าเดิมปัญหายังคงอยู่แม้ว่าอุณหภูมิจะเปลี่ยนจาก 68 องศาเป็น 37 องศา ดังนั้นปัญหาคืออุณหภูมิภายนอกสูงขึ้นที่สร้างปัญหาในตอนแรก แต่ก็ยังคงแสดงหลังจากย้ายไปที่อื่น
Luis Alvarado

คำตอบ:


0

ฮาร์ดไดรฟ์มีพื้นที่ว่างสำหรับเหตุผลในการกู้คืน การกู้คืนจะเกิดขึ้นโดยอัตโนมัติ เครื่องมือการกู้คืนทำการแมปเซกเตอร์ที่ไม่ดีทางกายภาพกับพื้นที่ว่างนี้ เมื่อทำการแมปใหม่เมื่อการอ่านหรือเขียนเกิดขึ้นกับเซกเตอร์เสียไดรฟ์จะเปลี่ยนการเข้าถึงพื้นที่ว่างและซ่อนข้อผิดพลาด

พูดตามตรงฉันไม่รู้วิธีรีเซ็ตข้อมูล SMART เป็นสิ่งที่ฮาร์ดไดรฟ์เก็บรักษาไว้ภายในและไม่ว่าในกรณีใด ๆ มันจะเป็นเรื่องเลวร้ายที่ต้องทำ

SMART รายงานว่าฮาร์ดไดรฟ์ของคุณล้มเหลว! การรีเซ็ตตัวนับจะไม่เปลี่ยนความจริงที่ว่าเกินขีด จำกัด ข้อผิดพลาดสำหรับไดรฟ์

ดังนั้นไม่คุณไม่สามารถรีเซ็ตประวัติสมาร์ท มันถูกติดตั้งที่โรงงานเพื่อประเมินการขับขี่เมื่อเกิดข้อผิดพลาด SMART สามารถปิดใช้งานหรือเปิดใช้งานได้เท่านั้น

ฉันหวังว่านี้ตอบคำถามของคุณ.


สวัสดีมิทช์เช่นเดียวกับที่อธิบายในคำถามความล้มเหลวไม่ได้เป็นจริง เป็นเพราะ HDD ทั้งหมดนั้นถูกปิดอย่างแน่นหนาบนพื้นที่ที่มีการระบายอากาศไม่ดี หลังจากเปลี่ยนสิ่งนั้นและทำการทดสอบอีกครั้งมันทำงานได้อย่างสมบูรณ์ยกเว้นว่ามันยังคงกล่าวถึงความล้มเหลวในอดีต ในขณะที่ฉันทำ sudo smartctl -l sataphy ต่อไปนี้ให้รีเซ็ต / dev / sdd ซึ่งแก้ไขปัญหาของการประเมินโดยรวมโดยพิจารณาถึงความล้มเหลวก่อนหน้านี้ซึ่งถือเป็นเรื่องปกติ แต่ความล้มเหลวยังคงปรากฏสำหรับแอตทริบิวต์เฉพาะ อีกครั้ง HDD ไม่ได้ล้มเหลว แต่ข้อผิดพลาดก่อนหน้านี้ยังคงแสดงให้เห็น
Luis Alvarado

ฉันเข้าใจ แต่อาจดูเหมือนปกติมันซ่อนอยู่เท่านั้น คุณถามว่าสามารถรีเซ็ตได้หรือไม่และคำตอบคือไม่ แม้ว่าคุณจะสามารถซ่อนข้อผิดพลาดได้ แต่เมื่อไดรฟ์ไปถึงผู้ผลิตไม่ว่าด้วยเหตุผลใดก็ตามพวกเขาสามารถค้นหาสิ่งที่ผิดพลาดจริง ๆ กับไดรฟ์เมื่อเวลาผ่านไป ทั้งหมดที่ฉันบอกว่าข้อผิดพลาดก่อนหน้านี้ยังคงแสดงและถ้าคุณไม่ได้รับเครื่องมือที่ผู้ผลิตใช้เพื่อพักสถานะ SMART ของไดรฟ์ก็จะยังคงแสดง
Mitch

26

จริงๆแล้วมีวิธีการรีเซ็ตข้อมูล SMART คุณต้องการตัวแปลง rs232 เป็น usb อย่างง่าย (uart ถึง ttl) และสายเคเบิลสองสามตัวที่ต่อกับอินเตอร์เฟซการวินิจฉัย hdds (มันอยู่ที่ด้านขวาของพอร์ต sata, 5 หรือ 4 พิน) คุณต้องเชื่อมต่อสายเคเบิล RX TX และ GND (และสายไฟของหลักสูตร: D) จากนั้นเปิด HDD และเชื่อมต่อกับ putty หรือ hyperterminal (linux สามารถเชื่อมต่อ terminal ของตัวเองฉันเดา) ตัวอย่างเช่นไดรฟ์ซีเกท: สำหรับ 7200.10 และอัตรา baud ที่เก่ากว่าคือ 9600 สำหรับ 7200.11 และใหม่กว่าคือ 38400

คำสั่งหลังจากการเชื่อมต่อกด CTRL + Z แล้วพิมพ์ "/ 1" กด Enter พิมพ์ "N1" กด Enter เมื่อเสร็จสิ้นการถอดสายเคเบิลทั้งหมดและเปิด HDD เหมือนปกติเพื่อดูการเปลี่ยนแปลง :)

สำหรับข้อมูล hdd อื่น ๆ ใช้ google :)


5
ดูเหมือนว่าจะใช้กับไดรฟ์ Seagate เท่านั้น แต่คุณพูดถูกวิดีโอนี้อธิบายถึงกระบวนการ
Adrian Frühwirth

5
เพื่อนร่วมงานคนหนึ่งของฉันติดต่อ Seagate และพวกเขาบอกเราว่าพวกเขาล็อคคุณสมบัตินี้ไว้เพื่อให้ไม่สามารถเข้าถึงได้หากไม่มีเครื่องมือที่เป็นกรรมสิทธิ์ ไม่แน่ใจในสิ่งที่พวกเขาทำสิ่งนี้
JFA

4

ข้อมูล SMART นั้นไม่ได้มาตรฐานมากนักระหว่างผู้ผลิต แต่การทดสอบอุณหภูมิของฮาร์ดไดรฟ์ควรระบุว่าอุณหภูมิของไดรฟ์เกินขีด จำกัด ในอดีตหรือไม่: http://en.wikipedia.org/wiki/SMART#Known_ATA_S.MART_attributes

ความคิดคือการที่ร้อนมากเกินไปเพิ่มโอกาสของคุณสำหรับความล้มเหลว SMART ไม่ได้บอกว่าไดรฟ์ของคุณไม่ดี แต่มีโอกาสเพิ่มขึ้นสำหรับความล้มเหลวในอนาคต

SMART หมายถึงการตรวจสอบประวัติไดรฟ์และได้รับการดูแลรักษาโดยตัวไดรฟ์ดังนั้นคุณจึงไม่สามารถ "รีเซ็ต" หรือ "ล้าง" ค่าสมาร์ท


3

คุณลักษณะปัจจุบัน / ที่เลวร้ายที่สุดเช่นอุณหภูมิคือสิ่งนี้: เพื่อบอกคุณว่าไดรฟ์นั้นอยู่นอกอุณหภูมิการทำงานสูงสุดหรือไม่และอาจเกิดความเสียหายถาวร

นั่นคือเหตุผลที่มันบอกว่า "ล้มเหลวในอดีต" ไม่ใช่ "ล้มเหลวในตอนนี้": คุณเพิ่งแตะขีด จำกัด อุณหภูมิสูงสุด โปรดสังเกตว่าการแสดงแอททริบิวแสดง "normalized: 50, threshold: 45, เลวร้ายที่สุด: 45" (ค่าเหล่านี้คือ 0..200 ค่าที่ทำให้เป็นมาตรฐานเช่นเดียวกับแอตทริบิวต์อื่น ๆ ไม่ใช่ temps เซลเซียสเซลเซียส)

นอกจากนี้คุณยังมีเซกเตอร์ที่ไม่ดี (ข้อผิดพลาดเซกเตอร์ที่ไม่สามารถแก้ไขได้) ดังนั้นไม่ว่าจะเกิดจากอุณหภูมิสูงในช่วงสั้น ๆ หรือไม่ก็ตามอาจถึงเวลาที่ต้องขับทิ้ง

SMART software UI ที่ดีขึ้นจะแสดงอุณหภูมิปัจจุบันและอุณหภูมิสูงสุด เช่น
smartctl -a /dev/sdaหรือsmartctl -x /dev/sda( -xพิมพ์ข้อมูลสมาร์ทที่มีอยู่และไม่ใช่สมาร์ททั้งหมดที่ได้จากไดรฟ์รวมถึงบันทึกประวัติอุณหภูมิหากไดรฟ์มีหนึ่งด้วยกราฟแท่ง ASCII)

smartctl -x รวมถึงสิ่งนี้สำหรับฮาร์ดไดรฟ์ WD Green 1TB (WD10EADS) เก่า:

Current Temperature:                    36 Celsius
Power Cycle Min/Max Temperature:     25/42 Celsius
Lifetime    Min/Max Temperature:     35/46 Celsius

ซอฟต์แวร์ที่คุณใช้ดูเหมือนว่าจะแสดงเฉพาะอุณหภูมิปัจจุบันซึ่งต่ำกว่าขีด จำกัด เล็กน้อย แต่จะไม่ปิดบังความจริงที่ว่าไดรฟ์นั้นไม่ได้มาตรฐานในบางจุดในอดีต


คุณสามารถพิสูจน์ได้โดยไม่สนใจว่าอุณหภูมิสูงชั่วขณะถ้าคุณแก้ไขให้ถูกต้องในไม่กี่นาที แต่คุณจะไม่สามารถ (หรือไม่ควร) ที่จะทำให้ไดรฟ์ตัวเองโกหกเกี่ยวกับความจริงที่ว่ามันเกินอุณหภูมิสูงสุดในช่วงเวลาหนึ่งและทำให้แอตทริบิวต์นั้นล้มเหลวในอดีต

คุณสามารถกำหนดค่าsmartdให้เพิกเฉยคุณลักษณะที่กำหนดไว้ใด ๆ เพื่อให้คุณยังสามารถรับการแจ้งเตือนที่เป็นประโยชน์ได้หากมีสิ่งใดที่ข้ามเกณฑ์เข้าสู่อาณาเขตที่ล้มเหลวอย่างเป็นทางการ : smartd.conf(5)พูดว่า:

-i ID [ATA only]เพิกเฉย ID หมายเลขคุณสมบัติของอุปกรณ์เมื่อตรวจสอบความล้มเหลวของการใช้งานคุณสมบัติ ID ต้องเป็นเลขจำนวนเต็มฐานสิบในช่วงตั้งแต่ 1 ถึง 255 คำสั่งนี้จะปรับเปลี่ยนพฤติกรรมของคำสั่ง '-f' และไม่มีผลหากไม่มี

สิ่งนี้มีประโยชน์เช่นถ้าคุณมีดิสก์ที่เก่ามากและไม่ต้องการรับข้อความเกี่ยวกับแอตทริบิวต์ชั่วโมงต่อการใช้งาน (โดยปกติคือแอตทริบิวต์ 9) ที่ล้มเหลว คำสั่งนี้อาจปรากฏขึ้นหลายครั้งสำหรับอุปกรณ์เดียวหากคุณต้องการละเว้นหลายคุณสมบัติ


คุณลักษณะประวัติอุณหภูมิเพิ่มเติม

ฉันเพิ่งได้ Seagate Barracuda ใหม่ 6TB (ST6000DM003-2CY186 เฟิร์มแวร์ 0001, ไดรฟ์ 5425 RPM) ซึ่งมีสถิติที่น่าสนใจบางอย่างรวมถึงเวลาที่ใช้ในการปฏิบัติงานต่ำสุด / สูงสุดและระยะสั้น / ต่ำ .

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    33 Celsius
Power Cycle Min/Max Temperature:     27/33 Celsius
Lifetime    Min/Max Temperature:     27/33 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (2)

และในส่วนรายละเอียดแบบเต็ม:

0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              33  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              33  ---  Highest Temperature
0x05  0x028  1              30  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature

(ไดรฟ์เปิดทำงานเพียงไม่กี่นาทีนั่นเป็นเหตุผลว่าทำไม-ไม่มีข้อมูลในบางฟิลด์)

หากคุณขับรถมีคุณลักษณะเพิ่มเติมเหล่านี้คุณสามารถแสดงให้คนอื่นเห็นว่าเวลาที่ใช้นอกอุณหภูมิที่อนุญาตนั้นสั้นมาก (ถ้าเป็นกรณีนี้) สันนิษฐานว่าหากคุณกำลังจะแก้ไขข้อมูล SMART คุณเพียงแค่ทำและลบการเอ่ยถึงข้อมูลใด ๆ ที่อยู่นอกระยะเวลา แต่แน่นอนคุณไม่สามารถเชื่อถือข้อมูลใด ๆ 100% จากไดรฟ์มือสองที่ มีคนพยายามขายคุณ

ดู/superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-shouldnt-existสำหรับข้อมูลเพิ่มเติมเกี่ยวกับไดรฟ์ที่ใช้แล้ว "odometer rollback" บนแอตทริบิวต์ "Power_On_Hours" ของพวกเขา


ขอบคุณ Peter สำหรับการวิเคราะห์อย่างละเอียดที่นี่ ชื่นชมอย่างมาก
Luis Alvarado

0

สำหรับความรู้ของฉันวิธีเดียวที่จะหยุดมันได้คือปิด SMART ใน BIOS สิ่งนี้จะหยุดการทำงานของฮาร์ดแวร์เท่านั้น

ระบบปฏิบัติการของคุณจะยังคงสอบถามไดรฟ์สำหรับข้อมูลสมาร์ทและบอกคุณว่ามันล้มเหลว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.