ปัญหาความสนุกมากมายกับตัวควบคุม RAID และ SATA


1

ฉันซื้อการ์ดจู่โจม 3ware ที่ใช้แล้วออกจากอีเบย์ไม่กี่เดือนหลังและตั้งค่าสีดำคาเวียร์คาเวียร์ 1TB สี่ตัวใน RAID5 การโจมตีด้วยฮาร์ดแวร์สามารถจัดการการเขียนได้ประมาณ 5MB / s โดยไม่ต้องเขียนแคชและฉันไม่มี UPS ดังนั้นการทิ้งการเขียนแคชไว้จึงดูเหมือนเป็นความคิดที่ไม่ดี ดังนั้นฉันจึงยืมไดรฟ์ 2TB สำรองจากที่ทำงานคัดลอกข้อมูลของฉันไปที่นั้นและดำเนินการตั้งค่าการโจมตี mdadm ในการติดตั้ง Debian 6 ใหม่ สิ่งนี้ทำงานได้ดี * เป็นเวลาประมาณสองสัปดาห์จากนั้นฉันเริ่มอ่านข้อผิดพลาด mdadm กล่าวว่าสองไดรฟ์ล้มเหลว ดังนั้นฉันจึงปิดตัวลงบูตเข้าสู่ตัวติดตั้งเดเบียนและเริ่มอ่าน syslog

สิ่งแรกที่ฉันเห็นคือสิ่งเหล่านี้:

18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.579972] kswapd0: การจัดสรรหน้าล้มเหลว คำสั่ง: 5, โหมด: 0x4020
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.579978] Pid: 47, comm: kswapd0 ไม่บริสุทธิ์ 2.6.32-5-686 # 1
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.579981] โทรติดตาม:
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.579994] []? __alloc_pages_nodemask + 0x484 / 0x4d9
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580000] []? __get_free_pages + 0xC / 0x17
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580037] []? __kmalloc + 0x30 / 0x128
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580049] []? pskb_expand_head + 0x4f / 0x157
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580059] []? __pskb_pull_tail + 0x3F / 0x1fb
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580071] []? sock_wfree + 0x17 / 0x4b
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580084] []? dev_queue_xmit + 0xe4 / 0x38e
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580096] []? neigh_resolve_output + 0x1df / 0x227
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580109] []? ip_finish_output2 + 0x187 / 0x1c2
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580121] []? ip_local_out + 0x15 / 0x17
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580132] []? ip_queue_xmit + 0x31d / 0x378
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580145] []? bictcp_cong_avoid + 0x14 / 0x2c9
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580157] []? tcp_write_xmit + 0x3e7 / 0x874
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580167] []? tcp_ack + 0x1611 / 0x1802
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580178] []? tcp_transmit_skb + 0x595 / 0x5cc
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580189] []? tcp_write_xmit + 0x7a3 / 0x874
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580200] []? tcp_ack + 0x1611 / 0x1802
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580210] []? tcp_established_options + 0x1d / 0x8b
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580221] []? tcp_current_mss + 0x38 / 0x53
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580232] []? __tcp_push_pending_frames + 0x1E / 0x50
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580243] []? tcp_data_snd_check + 0x1b / 0xd2
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580254] []? tcp_rcv_established + 0xd2 / 0x626
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580266] []? tcp_v4_do_rcv + 0x15f / 0x2cf
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580276] []? tcp_v4_rcv + 0x3d2 / 0x602
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580288] []? ip_local_deliver_finish + 0x10C / 0x18c
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580299] []? ip_rcv_finish + 0x2c4 / 0x2d8
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580310] []? netif_receive_skb + 0x3bb / 0x3d6
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580340] []? e1000_clean_jumbo_rx_irq + 0x4f8 / 0x5bb [e1000]
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580356] []? e1000_clean + 0x29f / 0x40d [e1000]
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580370] []? e1000_clean_jumbo_rx_irq + 0x579 / 0x5bb [e1000]
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580382] []? net_rx_action + 0x96 / 0x194
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580395] []? __do_softirq + 0xaa / 0x156
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580406] []? do_softirq + 0x31 / 0x3c
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580416] []? irq_exit + 0x26 / 0x58
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580429] []? do_IRQ + 0x78 / 0x89
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580440] []? common_interrupt + 0x30 / 0x38
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580452] []? free_hot_cold_page + 0x182 / 0x1a3
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580463] []? __pagevec_free + 0x4E / 0x58
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580473] []? release_pages + 0xe7 / 0x124
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580484] []? __pagevec_release + 0x15 / 0x1d
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580495] []? invalidate_mapping_pages + 0x6a / 0x98
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580505] []? shrink_icache_memory + 0xd7 / 0x1d3
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580515] []? shrink_slab + 0xe6 / 0x13f
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580525] []? kswapd + 0x3d8 / 0x54f
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580536] []? isolate_pages_global + 0x0 / 0x1bc
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580550] []? autoremove_wake_function + 0x0 / 0x2d
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580564] []? สมบูรณ์ + 0x28 / 0x36
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580574] []? kswapd + 0x0 / 0x54f
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580584] []? kthread + 0x61 / 0x66
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580595] []? kthread + 0x0 / 0x66
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580606] []? kernel_thread_helper + 0x7 / 0x10
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580612] Mem-Info:
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580618] DMA ต่อซีพียู:
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580625] CPU 0: สวัสดี: 0, btch: 1 usd: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580632] CPU 1: สวัสดี: 0, btch: 1 usd: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580639] CPU 2: สวัสดี: 0, btch: 1 usd: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580647] CPU 3: สวัสดี: 0, btch: 1 usd: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580654] ปกติต่อซีพียู:
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580660] CPU 0: สวัสดี: 186, btch: 31 usd: 157
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580668] CPU 1: สวัสดี: 186, btch: 31 usd: 93
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580676] CPU 2: สวัสดี: 186, btch: 31 usd: 91
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580683] CPU 3: สวัสดี: 186, btch: 31 usd: 167
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580690] HighMem ต่อซีพียู:
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580697] CPU 0: สวัสดี: 186, btch: 31 usd: 155
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580704] CPU 1: สวัสดี: 186, btch: 31 usd: 173
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580711] CPU 2: สวัสดี: 186, btch: 31 usd: 85
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580718] CPU 3: สวัสดี: 186, btch: 31 usd: 165
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580730] active_anon: 22503 inactive_anon: 10669 isolated_anon: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580733] ​​active_file: 25150 inactive_file: 287773 isolated_file: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580737] ไม่สามารถคาดเดาได้: 0 สกปรก: 0 writeback: 52 ไม่แน่นอน: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580741] ฟรี: 20455 slab_reclaimable: 8509 slab_unreclaimable: 7454
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580744] แมป: 5500 shmem: 1407 pagetables: 627 เด้ง: 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580759] DMA ฟรี: 3588kB นาที: 64kB ต่ำ: 80kB แยกได้: 80kB สูง: 96kB active_anon: 0kB ไม่ได้ใช้งาน: 016B active_file: 1116kB ไม่ใช้งานไฟล์: 288kB ไม่ใช้งาน: 0kB ): 0kB ปัจจุบัน: 15784kB mlocked: 0kB สกปรก: 0kB เขียนกลับ: 0kB แมป: 0kB เขียนได้: 0kB เล่าเรื่อง: 0kB เขียนทับ: 0kB เขียนทับได้: 0kB เขียนทับ: 0kB เคอร์เนล: 0kB pagetables ไม่
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580781] lowmem_reserve []: 0 861 2015 2015
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580810] ปกติฟรี: 42680kB นาที: 3720kB ต่ำ: 4648kB สูง: 4648kB สูง: 5580kB active_anon: 12kB ไม่ใช้งาน: 780kB ไม่ใช้งานไฟล์: 46720kB ไม่ใช้งาน ): 0kB ปัจจุบัน: 881880kB mlocked: 0kB สกปรก: 0kB writeback: 0kB แมป: 76kB shtem: 0kBbbackback: 0kBbback: 0kB slag_reclaimable: 33860kB slab_unreclaimable: 29288kB pagetables ไม่
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580833] lowmem_reserve []: 0 0 9234 9234
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580862] HighMem ฟรี: 35552kB นาที: 512kB ต่ำโดดเดี่ยว: 1756kB ต่ำ: 1756kB สูง: 3004kB active_anon: 90000kB ไม่ใช้งาน active_anon: 41896kB ไม่ใช้งานไฟล์: 52764kB ไม่ใช้งาน ): 0kB ปัจจุบัน: 1182056kB mlocked: 0kB สกปรก: 0kB writeback: 208kB แมป: 21924kBkable: 0kBk_table: 0kB slab_reclaimable: 0kB pagetables: 0kB pagetables: 23924kBb ที่ได้ 0: 0 ไม่
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580885] lowmem_reserve []: 0 0 0 0
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580908] DMA: 13 * 4kB 4 * 8kB 13 * 16kB 1 * 32kB 1 * 64kB 1 * 128kB 2 * 256kB 1 * 512kB 0 * 1024kB 0 * 1024KB
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.580956] ปกติ: 8286 * 4kB 356 * 8kB 85 * 16kB 160 * 32kB 2 * 64kB 0 * 128kB 0 * 256kB 0 * 512kB 0 * 512kB 0 * 1024kB 0 * 1024kB 0 * 1024kB 0 * 1024kB
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.581007] HighMem: 1248 * 4kB 2476 * 8kB 620 * 16kB 8 * 32kB 5 * 64kB 0 * 128kB 0 * 512kB 0 * 512kB 0 * 1024kB 0 * 1024kB 0 * 1024kB 0 * 1024kB 0 * 1024kB 0 * 1024 kB
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.581062] 315224 หน้าเพจรวมทั้งหมด
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.581068] 947 หน้าในการแลกเปลี่ยนแคช
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.581075] สลับสถานะแคช: เพิ่ม 7675 ลบ 6728 ค้นหา 14833/15430
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.581082] การแลกเปลี่ยนฟรี = 3900340kB
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.581089] การแลกเปลี่ยนทั้งหมด = 3905528kB
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.594263] RAM 524144 หน้า
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.594268] 297858 หน้า HighMem
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.594270] สงวนไว้ 5625 หน้า
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.594272] แบ่งปัน 123757 หน้า
18 พฤษภาคม 10:31:14 เคอร์เนลโอซิริส: [937288.594275] 454801 หน้าไม่แชร์

ดูเหมือนว่านี่อาจเป็นข้อผิดพลาดของเคอร์เนลและไม่ทำให้เกิดปัญหาใด ๆ

เหตุการณ์บันทึกถัดไปอยู่ที่นี่:

18 พฤษภาคม 13:13:03 เคอร์เนลโอซิริส: [946997.132469] ata4: exception Emask 0x10 SAct 0x0 SERr 0x10000 การกระทำ 0xe ถูกแช่แข็ง
18 พฤษภาคม 13:13:03 เคอร์เนลโอซิริส: [946997.132507] ata4: SError: {PHYRdyChg}
18 พฤษภาคม 13:13:03 เคอร์เนลโอซิริส: [946997.132536] ata4: ฮาร์ดรีเซ็ตลิงค์
18 พฤษภาคม 13:13:06 เคอร์เนลโอซิริส: [947000.544016] ata4: COMRESET ล้มเหลว (errno = -19)
18 พฤษภาคม 13:13:06 เคอร์เนลโอซิริส: [947000.544044] ata4: รีเซ็ตล้มเหลว (errno = -19), ลองใหม่ใน 7 วินาที
18 พฤษภาคม 13:13:08 เคอร์เนลโอซิริส: [947002.255353] 3w-9xxx: scsi0: AEN: คำเตือน (0x04: 0x0019): ไดรฟ์ถูกลบ: พอร์ต = 2
18 พฤษภาคม 13:13:08 เคอร์เนลโอซิริส: [947002.255525] 3w-9xxx: scsi0: AEN: คำเตือน (0x04: 0x0019): ไดรฟ์ถูกลบ: พอร์ต = 3
18 พฤษภาคม 13:13:13 เคอร์เนลโอซิริส: [947007.132027] ata4: ฮาร์ดรีเซ็ตลิงค์
18 พฤษภาคม 13:13:18 เคอร์เนลโอซิริส: [947012.040156] 3w-9xxx: scsi0: AEN: INFO (0x04: 0x001A): ไดรฟ์ที่ใส่: พอร์ต = 3
18 พฤษภาคม 13:13:19 เคอร์เนลโอซิริส: [947012.896015] ata4: การเชื่อมโยงช้าในการตอบสนองโปรดอดทน (พร้อม = -19)
18 พฤษภาคม 13:13:20 เคอร์เนลโอซิริส: [947013.913066] 3w-9xxx: scsi0: AEN: INFO (0x04: 0x001A): ไดรฟ์ที่ใส่: พอร์ต = 2
18 พฤษภาคม 13:13:20 เคอร์เนลโอซิริส: [947014.352032] ata4: ลิงค์ SATA ขึ้น 1.5 Gbps (SStatus 113 SControl 310)
18 พฤษภาคม 13:13:20 เคอร์เนลโอซิริส: [947014.377670] ata4.00: กำหนดค่าสำหรับ UDMA / 100
18 พฤษภาคม 13:13:20 เคอร์เนลโอซิริส: [947014.377680] ata4: EH เสร็จสมบูรณ์

ไม่มีใครสัมผัสร่างกายเครื่องในเวลานั้นดังนั้นฉันจึงตีความว่านี่เป็นคอนโทรลเลอร์ที่ล้มเหลว - เข้าใจได้ง่ายเมื่อพิจารณาถึงความเก่าและซื้อมา

ฉันข้ามคืนคอนโทรลเลอร์ใหม่และติดตั้งในวันถัดไป สมาร์ทรายงานว่าไม่มีข้อผิดพลาดในไดรฟ์และการทดสอบสั้น ๆ ที่ผ่านมาทั้งหมดดังนั้นฉันจึงได้ทำการmdadm --assemble --forceเคลียร์ค่าสถานะความผิดพลาดจากไดรฟ์ทั้งหมดและเริ่มต้นอาร์เรย์โดยไม่มีปัญหา fsck กล่าวว่าระบบไฟล์สะอาดและติดตั้งโดยไม่มีปัญหา

ดังนั้นฉันจึงพูดว่า "เยี่ยมมาก!" และรีบูต เครื่องกระโดดไปที่หน้าจอ netboot โดยไม่สนใจฮาร์ดไดรฟ์ที่สามารถบู๊ตได้ (โปรดทราบว่า / boot ไม่ได้อยู่ในอาร์เรย์ mdadm - อาร์เรย์เป็นเพียง / home)

นี่คือที่ฉันติดอยู่ ฉันไม่รู้ว่าทำไมไบออสไม่ต้องการบูตจากไดรฟ์นี้ ไม่มีด้วงไม่มีอะไร มันค่อนข้างน่าผิดหวังที่จะมีระบบฟังก์ชั่นเต็มรูปแบบในสภาพแวดล้อมแบบ chrooted บนตัวติดตั้งแล้วไม่สามารถบูตได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.