ข้อผิดพลาด SATA เหล่านี้เป็นอันตรายหรือไม่?


36

ฉันได้รับข้อผิดพลาดเหล่านี้ ramdomly และฉันไม่รู้ว่าปกติหรือไม่

[39441.061856] ata3.00: failed to read SCR 1 (Emask=0x40)
[39441.061866] ata3.01: failed to read SCR 1 (Emask=0x40)
[39441.061892] ata3.15: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
[39441.061897] ata3.15: irq_stat 0x08000000, interface fatal error
[39441.061904] ata3.15: SError: { UnrecovData 10B8B BadCRC }
[39441.061910] ata3.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen
[39441.061917] ata3.01: exception Emask 0x100 SAct 0xe SErr 0x0 action 0x6 frozen
[39441.061923] ata3.01: failed command: READ FPDMA QUEUED
[39441.061933] ata3.01: cmd 60/a8:08:b0:48:62/00:00:00:00:00/40 tag 1 ncq 86016 in
[39441.061940] ata3.01: status: { DRDY }
[39441.061944] ata3.01: failed command: READ FPDMA QUEUED
[39441.061953] ata3.01: cmd 60/a8:10:b0:49:62/00:00:00:00:00/40 tag 2 ncq 86016 in
[39441.061959] ata3.01: status: { DRDY }
[39441.061963] ata3.01: failed command: READ FPDMA QUEUED
[39441.061972] ata3.01: cmd 60/58:18:58:4a:62/00:00:00:00:00/40 tag 3 ncq 45056 in
[39441.061978] ata3.01: status: { DRDY }
[39441.061987] ata3.15: hard resetting link
[39441.608302] ata3.15: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[39441.609090] ata3.00: hard resetting link
[39441.929246] ata3.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39441.929333] ata3.01: hard resetting link
[39442.249184] ata3.01: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39442.263242] ata3.00: configured for UDMA/133
[39442.277570] ata3.01: configured for UDMA/133
[39442.277725] ata3: EH complete

ฉันยังวางsmartctl -aสำหรับSDA , SDBและSDC

ขอบคุณล่วงหน้าสำหรับความช่วยเหลือของ.

คำตอบ:


16

ในขณะที่ฉันเห็นด้วยกับคำตอบของ Geppettvs D'Constanzoฉันขอแนะนำว่าสิ่งแรกที่คุณอาจลองคือ

  1. ตรวจสอบว่าสาย SATA ของคุณต่อแน่นและเสียบเข้ากับซ็อกเก็ตบนเมนบอร์ดและฮาร์ดไดรฟ์

  2. เปลี่ยนสายเคเบิล SATA ของคุณ สายเคเบิล SATA มีราคาไม่แพงและบางครั้งคุณอาจได้รับ " แย่ " บ่อยครั้งที่การเปลี่ยนสายเคเบิลเป็นวิธีที่ง่ายที่สุดในการวินิจฉัยและแก้ไขปัญหาเช่นนี้

(แม้ว่ามันจะไม่คาดคิดเลยว่าทั้งสองสายจะไม่ดีในเวลาเดียวกัน แต่ก็เป็นเรื่องง่ายที่จะตรวจสอบดังนั้นในความคิดของฉันอาจจะคุ้มค่าที่จะทำ)

ฉันเพิ่งเห็นคุณใส่ Pastbins ที่มีข้อมูล SMART สำหรับไดรฟ์ของคุณ ขอให้สังเกตจำนวนมากโดยไม่คาดคิดของข้อผิดพลาด CRC สำหรับไดรฟ์และsdb sdcฉันขอแนะนำให้คุณเริ่มต้นด้วยการตรวจสอบสายเคเบิลและการเชื่อมต่อของไดรฟ์เหล่านั้น

junior@mediacenter:/$ sudo  smartctl -a /dev/sda
...
Model Family:     SAMSUNG SpinPoint M7E (AFT)
Device Model:     SAMSUNG HM321HI
...
199 UDMA_CRC_Error_Count    0x0036   200   200   000   Old_age  Always -    0

junior@mediacenter:/$ sudo  smartctl -a /dev/sdb
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  -  57

junior@mediacenter:/$ sudo  smartctl -a /dev/sdc
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  - 398

ตกลง. ดังนั้นจึงไม่ใช่ Latpop ;-)
แน่นอนว่าหากเกิดเหตุการณ์นี้ขึ้นกับแล็ปท็อปเกินกว่าที่ระบุไว้ข้างต้นและฉันไม่แน่ใจว่าจะให้คำแนะนำอะไร อาจจะลบและติดตั้งฮาร์ดไดรฟ์ใหม่อีกครั้ง? บางทีมันอาจจะต้องเสียบใหม่ในซ็อกเก็ตเพื่อปรับปรุงการเชื่อมต่อ?


sbdและsdcเชื่อมต่อกับสาย e-sata ภายนอกเดียวกัน (Thermaltake Duo HDD Dock) ฉันจะแทนที่สาย e-sata ของฉัน

อาจเป็นเพราะสายเคเบิลมีข้อบกพร่องหรือมีคุณภาพต่ำ อาจเป็นไปได้ว่าสายเคเบิลถูกย้ายกระแทกหรือกระแทกเป็นอย่างอื่นในขณะที่ใช้ไดรฟ์


1
sbdและsdcเชื่อมต่อด้วยสายเคเบิล e-sata ภายนอกเดียวกัน (Thermaltake Duo HDD Dock) ฉันจะแทนที่สาย e-sata ของฉัน
Marcos Junior

9

ดูเหมือนว่าคุณมีสาย SATA Power / Data ที่มีคุณภาพ / เสียหาย ซึ่งอาจก่อให้เกิด Bad CRC พวกเขาไม่ได้เป็นอันตรายเลยและคุณสามารถอยู่กับพวกเขาได้ แต่คุณจะสูญเสียข้อมูลจำนวนมากในไม่ช้า

รายงาน SMART ของฮาร์ดดิสก์ไดรฟ์ของคุณดูมีเหตุผลดังนั้นฉันจึงพบปัญหาเกี่ยวกับแหล่งจ่ายไฟตามประสบการณ์ของฉันเมื่อตั้งค่าฮาร์ดดิสก์ 5 ตัวในแหล่งตัวพิมพ์ / แหล่งพลังงานเดียวกัน ฉันใช้แหล่งพลังงานภายนอก (475W) สำหรับ 2 ไดรฟ์และ 600W ของเคสสำหรับเคสทั้งหมดรวมถึง GPU, ออปติคัลและฮาร์ดดิสก์ไดรฟ์

อย่างไรก็ตามฉันขอแนะนำให้คุณสำรองข้อมูลเต็มรูปแบบก่อนที่จะทำสิ่งใด ถ้าเป็นไปได้ให้ทำการโคลนฮาร์ดดิสก์ของคุณหลังจากนั้นคุณควรตรวจสอบสายเคเบิลและแรงดันไฟฟ้าของแหล่งจ่ายไฟ


จากความอยากรู้ GPU นั้นเป็น GPU ที่กินพลังงานมากหรือเปล่า?
ไม่มีเหตุผล John

1
nVidia Quadro 4000 ไม่ใช่คนที่หิวแน่นอน
Geppettvs D'Constanzo

1
น่าสนใจ ฉันมี PSU Antec (Neo-Eco) 400w, ฮาร์ดไดรฟ์ 5 ตัว, ออปติคัลไดรฟ์ 2 ตัวและ NVIDIA GeForce 9500 GT และฉันไม่คิดว่าฉันมีปัญหาเกี่ยวกับแหล่งจ่ายไฟ ฉันมีข้อผิดพลาด CRC ของไดรฟ์แต่ฉันคิดว่าพวกเขามาจากข้อผิดพลาดของผู้ใช้ที่โง่ฉันทำกลับ (ชนโน่นชนสายเคเบิลและเช่น.) ฉันไม่ได้สังเกตเห็นบันทึกการเตือนใด ๆ ในของฉันข้อความเคอร์เนล ถึงกระนั้นฉันคิดว่าฉันควรเฝ้าดูมันอย่างใกล้ชิดเพื่อความปลอดภัย
ไม่มีเหตุผล John

1
1xIDE DVD-RW, 1xSATA DVD-RW และ 1xSATA Blu-Ray ROM ออปติคัลไดรฟ์ด้านนี้ 4 SATA และ 1 IDE HDD, GPU คือการใช้พลังงาน 142 วัตต์ ฉันไม่สามารถพูดได้ว่าฉันแน่ใจอย่างแน่นอนว่ามันเกี่ยวกับปัญหาแหล่งพลังงาน แต่เมื่อฉันเพิ่มแหล่งพลังงานใหม่ปัญหาจะหายไป BTW ไดรฟ์ของฉันดูเหมือนจะแข็งแรง แต่ขอบคุณที่ทำให้ฉันเห็นอย่างนั้น ความคิดเห็นของคุณเป็นที่ชื่นชมในด้านนี้ ขอขอบคุณ!
Geppettvs D'Constanzo

1
เอ่อ 142 วัตต์สำหรับ GPU คือ ... บางสิ่งบางอย่าง ระบบทั้งหมดของฉัน (ปกติ) ใช้น้อยกว่านั้น ขณะที่ฉันพิมพ์กล่องเดสก์ท็อปของฉันกำลังดึง ~ 117 วัตต์ (ตามที่Kill-A-Wattฉันลืมฉันยังคงเสียบมันไว้ ;-)
ไม่มีเหตุผล John

4

ดูเหมือนว่าจะมีปัญหาระหว่างเคอร์เนลบางรุ่นและตัวควบคุม SATA บางตัว

ฉันเพิ่งเริ่มประสบปัญหาคล้ายกันมาก (ไม่แน่ใจว่ามันเหมือนกัน) บนเว็บเซิร์ฟเวอร์ที่ใช้ Scientific Linux

ข้อมูลที่ถูกต้องและสมบูรณ์ที่สุดที่ฉันได้พบเกี่ยวกับปัญหาดังกล่าวเป็น Launchpad นี้ข้อผิดพลาด

กล่าวโดยย่อ: การปิดใช้งานNCQเป็นวิธีแก้ปัญหาที่ดีที่สุดสำหรับผู้ใช้ที่มีปัญหานี้


3
การปิดใช้งาน NCQ เป็นวิธีแก้ปัญหาทั่วไปสำหรับฮาร์ดแวร์บั๊ก ดูเหมือนจะไม่มีข้อผิดพลาดเคอร์เนล
psusi

ศักดิ์สิทธิ์ $ #! + ที่ใช้งานได้! ข้อความผิดพลาดทั้งหมดของฉันหายไปและระบบของฉันหยุดทำงานล้มเหลว! ฉันไม่เห็นด้วยอย่างสมบูรณ์กับข้อผิดพลาดเคอร์เนลเนื่องจากฉันสามารถใช้เคอร์เนลรุ่นเก่า (ตลอดทางกลับไปอย่างน้อย 2.6 ชุด) โดยไม่เกิดปัญหาใด ๆ ฉันไม่อยากจะเชื่อเลยว่าฉันไม่พบสิ่งนี้เร็วกว่านี้!
reukiodo

1

นี่เกือบจะเป็นไดรฟ์ที่ไม่ดีฉันมีไดรฟ์หลายพันตัวที่เราใช้และแม้ว่าข้อผิดพลาดเหล่านี้จะไม่ทำให้ไดรฟ์ล้มเหลว แต่ก็ทำให้ระบบไฟล์เสียหาย ฉันคิดว่ามันเกี่ยวข้องกับปัญหาเกี่ยวกับบอร์ดควบคุมบนไดรฟ์

ฉันได้ลองทุกอย่างเพื่อแก้ไขปัญหานี้แล้วการแก้ไขคือการเปลี่ยนไดรฟ์และสิ่งต่าง ๆ ทำงานบนสายเคเบิลและคอนโทรลเลอร์เดียวกัน

โชคดี


หลังจากใช้เวลานานกว่า 30 ปีในการแก้ไขปัญหาเหล่านี้เพื่อหาเลี้ยงชีพฉันสามารถรับรองได้ว่าจากประสบการณ์ของฉันนี้มักจะเป็นสายที่หลบอยู่เสมอ และเนื่องจากราคาถูกคุณลองใช้ครั้งแรก
Elder Geek

0

ฉันรู้ว่าเธรดนี้เก่า แต่เมื่อเร็ว ๆ นี้ฉันพบปัญหาเดียวกันกับเครื่องที่ซื้อใหม่ที่มี 6 สล็อต sata ฉันติดตั้ง cdrom และ hardrive บน 2 sata slot ใกล้กันแล้วดำเนินการติดตั้ง Ubuntu โดยไม่มีข้อผิดพลาดจนกว่าฉันจะรีบูตจากนั้นฉันเห็น ata8: ฮาร์ดลิงค์รีเซ็ตข้อผิดพลาด เครื่องหยุดทำงานจนถึงจุดนี้ไม่สามารถกู้คืนได้ ฉันลองรีบูตเครื่องสองสามครั้งและไม่ได้ผล จากนั้นฉันพยายามที่จะแทนที่ฮาร์ดไดรฟ์ในหนึ่งในสี่สล็อตที่มีอยู่และมันก็ใช้ได้ดีโดยไม่ต้องยุ่งยาก


คุณหมายถึงคุณเปลี่ยนพอร์ต SATA ที่เสียบฮาร์ดไดรฟ์ใช่มั้ย หรือคุณหมายถึงแทนที่ฮาร์ดไดรฟ์ทั้งหมดด้วยอันอื่น ฉันคิดว่ามันเป็นอดีต แต่เพียงตรวจสอบอีกครั้ง
Xen2050

มันเป็นอดีต
ultrajohn

0

มีปัญหาเดียวกัน - ในกรณีของฉันนี้เกิดจากอะแดปเตอร์เพาเวอร์แบบ 4 พินกับ SATA ไม่ได้เสียบปลั๊กอย่างอบอุ่น


0

ข้อผิดพลาดนี้เป็นอันตรายและสามารถทำลาย HD ของคุณ

เพื่อแก้ปัญหา:

  1. เปลี่ยนสายเคเบิล SATA
  2. หากข้อผิดพลาดยังคงมีอยู่ให้เสียบสายเคเบิล SATA บนซ็อกเก็ตเมนบอร์ดอื่น (ซ็อกเก็ตปัจจุบันอาจถูกออกซิเดชั่น)
  3. หากข้อผิดพลาดยังคงมีอยู่ปัญหาควรอยู่ที่หน่วยจ่ายไฟ (PSU) ของคุณ

http://eliasoenal.com/2012/10/31/power-supply-failures-can-be-pretty-annoying-to-find/


0

ฉันมีปัญหาเดียวกัน. ฉันลองทุกอย่าง แต่เฉพาะบนพอร์ต j- ไมครอนบน asus p5k ของฉันฉันไม่มีข้อผิดพลาด

แต่เมื่อฉันนำไดรฟ์ไปยังแหล่งจ่ายไฟอื่นมันใช้งานได้และข้อผิดพลาดก็หายไป จากนั้นฉันก็นำไดรฟ์กลับไปยังแหล่งจ่ายไฟดั้งเดิม แต่เป็นตัวเชื่อมต่อพลังงานใหม่และใช้งานได้เช่นกัน


0

ฉันรู้ว่ากระทู้นี้เก่า แต่เพิ่งพบปัญหาเดียวกันมาที่นี่จาก google

  • เริ่มata3.01: failed command: READ FPDMA QUEUEDต้นการใช้งาน KUBUNTU 16.04 livecd
  • WINDOWS 7 จะทำงานผิดปกติใช้งานได้สักพัก แต่ค้างหลังจากดูยูทูปแล้ว

การเปลี่ยนสาย SATA ไม่ได้ทำอะไรเลย
แทนที่ PSU และปัญหาได้หายไป


0

ข้อผิดพลาดนี้ไม่น่าจะเกิดความเสียหายกับฮาร์ดไดรฟ์ของคุณ แต่มีแนวโน้มสูงที่จะทำให้ระบบไฟล์ของคุณเสียหาย เริ่มต้นด้วยการพิจารณาว่าไดรฟ์ตัวใดกำลังโยนข้อผิดพลาด สิ่งนี้มักถูกกำหนดได้ง่าย ๆ ด้วยวิธีการต่าง ๆ เช่น:

1) การออกคำสั่งdmesg | grep ata3และค้นหายี่ห้อและรุ่นของฮาร์ดไดรฟ์ (เนื่องจาก ata3 เป็นพอร์ตที่โยนข้อผิดพลาดในสถานการณ์ของคุณปรับตาม) สิ่งนี้จะให้ผลลัพธ์คล้ายกับสิ่งนี้:

dmesg | grep ata3
[    4.756081] ata3: SATA max UDMA/133 abar m2048@0xf7f26000 port 0xf7f26200 irq 135
[    5.071981] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    5.077850] ata3.00: HPA detected: current 1953523055, native 1953525168
[    5.077959] ata3.00: ATA-8: SAMSUNG HD103SJ, 1AJ10001, max UDMA/133
[    5.077960] ata3.00: 1953523055 sectors, multi 16: LBA48 NCQ (depth 32), AA
[    5.084057] ata3.00: configured for UDMA/133

ภาพรวมอย่างรวดเร็วระบุว่าไดรฟ์ที่เชื่อมต่อกับ ata3 คือ SAMSUNG HD103SJ

2) ออกคำสั่งด้านล่าง:

find -L /sys/bus/pci/devices/*/ata*/host*/target* -maxdepth 3 -name "sd*" 2>/dev/null | egrep block |egrep --colour '(ata[0-9]*)|(sd.*)'

สิ่งนี้จะให้ทั้งพอร์ตและชื่ออุปกรณ์ที่ไฮไลต์ไว้ในบรรทัดเดียวกันดังที่แสดงด้านล่าง:

เอาท์พุต

ง่ายที่จะเห็นว่าอุปกรณ์ที่เชื่อมต่อกับ ata3 ได้รับการกำหนดชื่ออุปกรณ์ sdb แล้ว

3) ติดตั้ง lsscsi ด้วยsudo apt install lsscsiและออกคำสั่งlsscsi

$ lsscsi
[0:0:0:0]    cd/dvd  ATAPI    iHAS124   F      CL9M  /dev/sr0 
[1:0:0:0]    disk    ATA      WDC WD2003FZEX-0 1A01  /dev/sda 
[2:0:0:0]    disk    ATA      SAMSUNG HD103SJ  0001  /dev/sdb 
[3:0:0:0]    disk    ATA      ST6000VN0033-2EE SC60  /dev/sdc 

โปรดทราบว่ารายการแรกของแต่ละบรรทัดด้านบนคือ scsi_host, channel, target_number และ LUN มันถูกวางไว้ในวงเล็บและแต่ละองค์ประกอบแยกลำไส้ใหญ่ เมื่อมีอุปกรณ์ SCSI หลายรายการจะถูกเรียงลำดับจากน้อยไปหามาก

เพียงแค่เพิ่ม 1 ไปยังหมายเลขแรกในแต่ละบรรทัดของเอาต์พุตให้พอร์ต ATA แก่คุณ คุณสามารถหารายละเอียดเพิ่มเติมได้ที่lsscsi นี่และที่นี่

เนื่องจากในกรณีของคุณเราพบข้อผิดพลาดทั้งใน 3.00 และ 3.01 คุณมีไดรฟ์มากกว่าหนึ่งตัวที่เชื่อมต่อกับพอร์ต ATA เดียวกัน คุณจะต้องตรวจสอบการเชื่อมต่อกับ ata3.00 และ ata3.01 อย่างระมัดระวังนี่อาจเป็นกล่องไดรฟ์แบบหลายช่องที่เชื่อมต่อกับสายเคเบิลเดียวกัน เนื่องจากไดรฟ์ทั้งสองกำลังส่งข้อผิดพลาดการเปลี่ยนสายเคเบิลไปยังช่องเสียบหลายไดรฟ์ดังกล่าวข้างต้นควรกำจัดปัญหาสำหรับไดรฟ์ทั้งสอง อุปกรณ์เหล่านี้มักจะมีแหล่งพลังงานภายนอกซึ่งอาจเป็นผู้ร้ายและจำเป็นต้องเปลี่ยน แต่สายเคเบิล (เป็นจุดอ่อนที่สุด) เป็นสาเหตุของปัญหา

แหล่งที่มา:

ประสบการณ์

https://linux.die.net/man/8/lsscsi

http://sg.danny.cz/scsi/lsscsi.html

https://serverfault.com/questions/244944/linux-ata-errors-translating-to-a-device-name/868943#868943

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.