ฮาร์ดไดรฟ์เก่า: การตีความเอาต์พุต smartctl


2

ฉันได้รับอีเมลจำนวนมากจาก 'smartd' daemon กับหัวเรื่อง: 'ข้อผิดพลาด SMART (CurrentPendingSector)' พูดว่า

The following warning/error was logged by the smartd daemon:
Device: /dev/sda, 1 Currently unreadable (pending) sectors

มันส่งอีเมล 80 ฉบับให้ฉันในช่วงหลายเดือน

ฉันวิ่ง 'e2fsck -cc', 'smartctl' และ 'gsmartcontrol'

  • 'e2fsck -cc' ไม่ได้รายงานบล็อกที่ไม่ดี

  • 'gsmartcontrol' เน้นบรรทัดต่อไปนี้ใน เอาต์พุต 'smartctl':

--

ID   ATTRIBUTE_NAME          FLAG   VALUE WORST THRESH TYPE    UPDATED  WHEN_FAILED RAW_VALUE  
...  
5    Reallocated_Sector_Ct   0x0033  100   100   005  Pre-fail  Always      -   1179816  
...  
196  Reallocated_Event_Count 0x0032  100   100   000    Old_age   Always      -   17  
197  Current_Pending_Sector  0x0022  100   100   000    Old_age   Always      -   1  
...  

- สิ่งเหล่านี้ถูกเน้นด้วยสีชมพูโดย 'gsmartcontrol' ไม่ใช่สีแดง

เช่นรายงาน 1,179,816 ภาคที่ปันส่วนใหม่ (มีความหมายหรือไม่?) และกิจกรรมจัดสรรคืน 17 รายการ

ยังคง 'เลวร้ายที่สุด' เท่ากับ 'ค่า'

  • / var / log / messages มีข้อความเป็นครั้งคราว

    Jul 24 03:12:46 turtle smartd[1443]: Device: /dev/sda,
    1 ส่วนที่อ่านไม่ได้ (อยู่ระหว่างดำเนินการ) ในปัจจุบัน

ข้อความ; รวม 38 ในไม่กี่วันที่ผ่านมา (!)

  • # smartctl -l error /dev/sda รายงานข้อผิดพลาดหลายประการ (ด้านล่าง)

ฉันจะตีความพวกเขาได้อย่างไร ฉันควรเปลี่ยนฮาร์ดไดรฟ์หรือไม่

ขอบคุณ.

เอาต์พุต 'smartctl' โดยละเอียดอยู่ด้านล่าง


# smartctl -H -A /dev/sda

SMART Attributes Data Structure revision number: 16  

Vendor Specific SMART Attributes with Thresholds:  

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE   

1 Raw_Read_Error_Rate     0x000b   100   100   062 Pre-fail  Always       -       0  
2 Throughput_Performance  0x0005   105   100   040 Pre-fail  Offline      -       4572  
3 Spin_Up_Time            0x0007   223   100   033 Pre-fail  Always       -       2  
4 Start_Stop_Count        0x0012   098   098   000 Old_age   Always       -       3671  
5 Reallocated_Sector_Ct   0x0033   100   100   005 Pre-fail  Always       -       1179816  
7 Seek_Error_Rate         0x000b   100   100   067 Pre-fail  Always       -       0  
8 Seek_Time_Performance   0x0005   120   100   040 Pre-fail  Offline      -       40  
9 Power_On_Hours          0x0012   030   030   000 Old_age   Always       -       30819  
10 Spin_Retry_Count        0x0013   100   100   060   Pre-fail  Always       -       0  
12 Power_Cycle_Count       0x0032   099   099   000  Old_age   Always       -       2205  
191 G-Sense_Error_Rate      0x000a   100   095   000  Old_age   Always       -       1  
192 Power-Off_Retract_Count 0x0032   100   100   000  Old_age   Always       -       97  
193 Load_Cycle_Count        0x0012   001   001   000  Old_age   Always       -       1865772  
194 Temperature_Celsius     0x0002   177   100   000  Old_age   Always       -       31 (Lifetime Min/Max 9/48)  
196 Reallocated_Event_Count 0x0032   100   100   000  Old_age   Always       -       17  
197 Current_Pending_Sector  0x0022   100   100   000  Old_age   Always       -       1  
198 Offline_Uncorrectable   0x0008   100   100   000  Old_age   Offline      -       0  
199 UDMA_CRC_Error_Count    0x000a   200   190   000 Old_age   Always       -       38  

`

# sudo smartctl -i /dev/sda

=== START OF INFORMATION SECTION ===  
Model Family:     Hitachi Travelstar 5K100 series  
Device Model:     HTS541060G9AT00  
Serial Number:    MPB3LAX5KUDB1M  
Firmware Version: MB3OA60A  
User Capacity:    60,011,642,880 bytes  
Device is:        In smartctl database [for details use: -P show]  
ATA Version is:   6  
ATA Standard is:  ATA/ATAPI-6 T13 1410D revision 3a  
..  
SMART support is: Available - device has SMART capability.  
SMART support is: Enabled  
  • # smartctl -l error /dev/sda

    === START OF READ SMART DATA SECTION ===
    รุ่น SMART Error Log: 1
    จำนวนข้อผิดพลาด ATA: 80 (บันทึกอุปกรณ์มีข้อผิดพลาดห้าข้อล่าสุดเท่านั้น)
    CR = คำสั่งลงทะเบียน [HEX]
    FR = คุณสมบัติการลงทะเบียน [HEX]
    SC = ลงทะเบียนการนับส่วน [HEX]
    SN = การลงทะเบียนหมายเลขภาค [HEX]
    CL = กระบอกสูบต่ำลงทะเบียน [HEX]
    CH = กระบอกสูงลงทะเบียน [HEX]
    DH = ลงทะเบียนอุปกรณ์ / หัวหน้า [HEX]
    DC = ลงทะเบียนคำสั่งอุปกรณ์ [HEX]
    ER = ข้อผิดพลาดในการลงทะเบียน [HEX]
    ST = การลงทะเบียนสถานะ [HEX]
    Powered_Up_Time วัดจากเปิดและพิมพ์เป็น
    DDd + hh: mm: SS.sss โดยที่ DD = วัน, hh = ชั่วโมง, mm = นาที SS = วินาทีและ sss = millisec มัน "แรป" หลังจาก 49.710 วัน

    Error 80 occurred at disk power-on lifetime: 28086 hours (1170 days + 6 hours)
    เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้นอุปกรณ์นั้นทำงานหรือไม่ได้ใช้งาน

    `หลังจากเสร็จสิ้นคำสั่งเกิดขึ้นทะเบียนเป็น:
    ER ST SC SN CL CH DH


    40 51 3f 50 28 2c e1 ข้อผิดพลาด: UNC 63 ส่วนที่ LBA = 0x012c2850 = 19671120`

    `คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
    คำสั่ง / Feature_Name CR FR SC SC CL CH DH DC DC Power_Up_Time


    c8 ff 3f 50 28 2c e1 00 04: 33: 56.000 อ่าน DMA
    c8 ff 3f 00 00 00 e0 00 04: 33: 56.000 อ่าน DMA
    c6 ff 10 00 02 00 a0 00 04: 33: 56.000 ตั้งค่าโหมดหลายชุด
    10 ff 3f 01 00 00 ae 00 04: 33: 56.000 บันทึกใหม่ [OBS-4]
    91 ff 3f 01 00 00 ae 00 04: 33: 56.000 พารามิเตอร์อุปกรณ์ INITIALIZE [OBS-6]
    ข้อผิดพลาด 79 เกิดขึ้นที่อายุการใช้งานดิสก์: 15200 ชั่วโมง (633 วัน + 8 ชั่วโมง)
    เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้นอุปกรณ์นั้นทำงานหรือไม่ได้ใช้งาน
    หลังจากคำสั่งเสร็จสิ้นลงทะเบียน:
    ER ST SC SN CL CH DH


    84 51 00 ae 3e 2f e4 ข้อผิดพลาด: ICRC, ABRT ที่ LBA = 0x042f3eae = 70205102`

    คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
    คำสั่ง / Feature_Name CR FR SC SC CL CH DH DC DC Power_Up_Time


    c8 00 08 a7 3e 2f e4 00 00: 00: 30.600 อ่าน DMA c8 00 00 af 62 2c e4 00 00: 00: 30.600 อ่าน DMA c8 00 00 af 61 2c e4 00 00: 00: 30.600 อ่าน DMA c8 00 00 af 60 2c e4 00 00: 00: 30.600 อ่าน DMA c8 00 00 af 5f 2c e4 00 00: 00: 30.600 อ่าน DMA

    เกิดข้อผิดพลาด 78 ...

คำตอบ:


0

HDD ทุกตัวมีจำนวนเซกเตอร์ที่ไม่ได้ใช้ซึ่งเก็บรักษาไว้จากโรงงานสำหรับกิจกรรมการย้าย เมื่อเฟิร์มแวร์ HDD ตรวจพบส่วนที่ไม่สามารถอ่านได้มันจะ "แทนที่" ด้วยส่วนที่ดีต่อสุขภาพ "จากสต็อก" ในความเป็นจริงไม่มีอะไรถูกย้ายจริงๆเพียงบันทึกว่าต้องใช้เซกเตอร์ภาค xxx yyy สิ่งนี้เรียกว่าเหตุการณ์การย้ายเซกเตอร์

หากเริ่มเกิดขึ้นนั่นหมายความว่า HDD ไม่แข็งแรงจะเริ่มเสื่อมสภาพพื้นผิวจำนวนภาคที่ย้ายจะเพิ่มขึ้นในอนาคตขึ้นอยู่กับการใช้งาน HDD อย่างหนัก จนถึงตอนนี้คุณสามารถผ่อนคลายคุณยังคงสามารถทำงานกับ HDD นี้ได้ แต่คุณต้องติดตามความคืบหน้าของการย้ายและพิจารณาเปลี่ยน HDD ในอนาคต

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.