การทดสอบซอฟต์แวร์ RAID5 โดยการดึง HDD สด ความคิดที่ไม่ดี?


3

ฉันกำลังใช้งาน Ubuntu Server 10.10 โดยมีซอฟต์แวร์ RAID5 และ LVM ทำงานอยู่ด้านบน ฉันมี HDD 2TB สี่ตัว ฉันยังมีบูตไดรฟ์แยกต่างหากพร้อมสแนปช็อตระบบเต็มรูปแบบที่เพิ่มขึ้นซึ่งทำงานทุกสี่ชั่วโมงและทุกวันสัปดาห์เดือนและปี ดังนั้นแม้ว่าอาเรย์ RAID จะล้มเหลวโดยสิ้นเชิงฉันข้อมูลของฉันจะไม่สูญหาย แต่มันก็ยากที่จะตั้งค่าระบบทั้งหมดของฉันใหม่

ฉันทดสอบซอฟต์แวร์ RAID5 ของฉันในวันอื่น ๆ โดยการดึง HDD ในขณะที่ระบบดับการบูทต่ำลงนำ HDD กลับมารีบูตแล้วสร้างใหม่หลังจากบอก mdadm เพื่อเพิ่มไดรฟ์ที่ใส่เข้าไปใหม่ หลังจากการสร้างใหม่เป็นเวลา 10 ชั่วโมงก็ประสบความสำเร็จและตอนนี้อุปกรณ์ RAID5 ของซอฟต์แวร์สะอาดอีกครั้ง!

ตอนนี้ฉันต้องการทำแบบทดสอบอื่น คุณจะบอกว่าเป็นอันตรายหรือไม่ที่จะดึง HDD หนึ่งตัวออกมาในขณะที่เครื่องกำลังทำงานและอาจจะอ่าน / เขียน? ฉันจะดึงสาย SATA ไม่ใช่สายไฟเพื่อที่ฉันจะไม่เสี่ยงกับการทำลายฮาร์ดไดรฟ์ แต่ฉันจะมีข้อมูลสูญหายหรือไม่ ฉันมีการสำรองข้อมูลซ้ำซ้อนบน HDD อื่น ๆ ดังนั้นจึงไม่มีความเสี่ยงต่อการสูญหายของข้อมูลอย่างถาวร แต่ฉันไม่ต้องการติดตั้งและกำหนดค่าระบบทั้งหมดใหม่อีกครั้ง

การทดสอบไม่ปลอดภัยหรือไม่ อะไรที่เลวร้ายที่สุดที่สามารถเกิดขึ้นได้


ปรับปรุง:

ฉันเป็นโปสเตอร์ดั้งเดิม เนื่องจากฉันสร้างคำถามนี้โดยไม่มีบัญชีและเนื่องจากถูกย้ายไปยังไซต์ StackExchange อื่นฉันจึงสูญเสียความเป็นเจ้าของคำถาม

ดังนั้นฉันจึงทำการทดสอบ ฉันดึงสายเคเบิล SATA ของหนึ่งในสี่ของฮาร์ดไดรฟ์และระบบทำงานได้อย่างสวยงาม

นี่เป็นภาพหน้าจอของอินเทอร์เฟซ RAID ของ Webmin:

Webmin

และนี่คือภาพหน้าจอของอีเมลที่ฉันได้รับจากเซิร์ฟเวอร์ของฉัน:

ได้รับอีเมลแล้ว

ดังนั้นเพื่อตอบคำถามของฉันเองมันปลอดภัยที่จะทำในกรณีเฉพาะของฉัน


โชคดี! นั่นไม่ใช่ไดรฟ์ hot-swap ใช่ไหม
ewwhite

กระดานหลักไม่ใช่แบบแลกเปลี่ยนความร้อน ไดรฟ์เป็นเพียงไดรฟ์ฮิตาชิปกติ 7,600 รอบต่อนาที

1
ที่จริงแล้วคุณควรตรวจสอบให้แน่ใจว่าระบบกำลังเขียนถึงการโจมตี และการทดสอบอื่น ๆ ก็คือการลดพลังงานสำหรับทั้งระบบในขณะที่กำลังเขียน มันเป็นความคิดที่ดีที่จะมีระบบสำรองข้อมูลเพื่อให้ผู้อื่นสามารถทำงานต่อไปได้ในขณะที่คุณทำการกู้คืน
ott--

@drew headover ไปที่Server Faultและลงทะเบียนบัญชีของคุณผ่าน OpenID เดียวกับที่คุณใช้ในบัญชีSuper Userของคุณ เมื่อคุณทำเช่นนั้นแล้วคุณควรจะสามารถควบคุมคำถามของคุณได้
Sathyajith Bhat

คำตอบ:


2

การทดสอบอาร์เรย์ RAID โดยทั่วไปนั้นเป็นความคิดที่ไม่ดี แน่นอนว่ามีข้อยกเว้น (ถ้าคุณไม่รู้ว่ากรณีของคุณเป็นข้อยกเว้นก็ไม่ใช่) แต่การยกเลิกการเชื่อมต่อไดรฟ์ที่ไม่ใช่ "hot swap" นั้นเป็นความคิดที่ไม่ดีอยู่เสมอและตั้งใจทำเช่นนั้น ยิ่งเลวร้ายลง


ฉันเชื่อว่าไดรฟ์ SATA ทั้งหมดนั้นสามารถถอดเปลี่ยนได้อย่างรวดเร็วโดยการออกแบบ (ฉันเพิ่งพิสูจน์ตัวเองใน Wikipedia)
Alex

ความคิดที่ไม่ดีโดยเฉพาะถ้าพวกเขาไม่ร้อนชนิดถอดเปลี่ยนได้
ชาดแฮร์ริสัน

@alex คุณต้องพิจารณาการตั้งค่า RAID ด้วย ลองแลกเปลี่ยน RAID 0 ที่ร้อนแรง (จริงๆแล้วอย่า)
ชาดแฮร์ริสัน

1
@ อเล็กซ์ใช่สมมติว่าพวกเขาทำตามสเป็ค ... ซึ่งไม่ได้เกิดขึ้นบ่อยเท่าที่ควร
Chris S

0

คุณได้ทดสอบแล้วว่าซอฟต์แวร์ RAID ทำในสิ่งที่ควรจะเป็น หากคุณดึงสายเคเบิล SATA บนดิสก์ที่ใช้งานอยู่ในขณะที่ไม่ควรทำอันตรายใด ๆ เป็นไปได้ว่าคุณยังอาจทำให้อุปกรณ์อิเล็กทรอนิกส์ของดิสก์เสียหายได้ ฉันสมมติว่าไดรฟ์ไม่ใช่ hot-swap เนื่องจากคุณกำลังพูดถึงการถอดสายเคเบิล หากเป็นแบบ hot-swap คุณจะต้องถอดไดรฟ์ออกแล้วเลื่อนออก

ดังนั้น "ที่เลวร้ายที่สุดที่อาจเกิดขึ้น" ก็คือคุณจะฆ่าไดรฟ์หรือคุณจะฆ่าคอนโทรลเลอร์ดิสก์ออนบอร์ด ซึ่งไม่เป็นผลลัพธ์ที่ดี

ฉันอยากจะแนะนำไม่ทำการทดสอบสด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.