วิธีการกู้คืนจากความล้มเหลวของไดรฟ์ในการกำหนดค่า RAID 5


15

เช้านี้ไดรฟ์ล้มเหลวบนเซิร์ฟเวอร์ฐานข้อมูลของเรา ไดรฟ์อาร์เรย์ (3 ดิสก์) ได้รับการตั้งค่าในการกำหนดค่า RAID 5

ในขณะที่เรารอการเปลี่ยนไดรฟ์เรากำลังเตรียมกลยุทธ์การกู้คืน ผู้ใช้ยังคงทำงานบนระบบต่อไปแม้ว่าจะช้ามาก (ไม่รู้ทำไม)

มีวิธีใดที่จะติดตั้งไดรฟ์ใหม่ - ข้อมูลสำหรับไดรฟ์นี้จะถูกสร้างใหม่โดยอัตโนมัติจากพาริตี้หรือมีกระบวนการอื่นที่เราควรปฏิบัติตามหรือไม่

แก้ไข: นี่คือคอนโทรลเลอร์ RAID ของฮาร์ดแวร์ (ขอบคุณสำหรับคำตอบจนถึงชื่นชม)


4
โดยวิธีการเวลาที่จะตัดสินใจว่าจะทำอย่างไรถ้าไดรฟ์ล้มเหลวในเซิร์ฟเวอร์ที่สำคัญคือก่อนที่ไดรฟ์ล้มเหลวในเซิร์ฟเวอร์ที่สำคัญ
David Schwartz

คำตอบ:


15

ระบบทำงานช้ามากเนื่องจากต้องสร้างข้อมูลที่หายไปซึ่งเกี่ยวข้องกับ CPU และ I / O เพิ่มเติม

หากคุณมีดิสก์ที่ขาดหายไปในการกำหนดค่า RAID-5 คุณมีกลยุทธ์การกู้คืนไม่มี ถ้าดิสก์อื่นลงไปคุณจะสูญเสียข้อมูลของคุณ เรียกใช้อย่าเดินไปที่ผู้ขายที่ใกล้ที่สุดซึ่งคุณสามารถรับชิ้นส่วนที่ใช้งานร่วมกันได้ซึ่งครอบคลุมโดยการรับประกันของผู้ผลิตที่จัดส่งโดยผู้ให้บริการด่วนในวันเดียวกัน หากผู้ขายที่คุณซื้ออาร์เรย์อยู่ในขั้นตอนการรับชิ้นส่วนให้รับทั้งสองส่วนแล้วเก็บส่วนที่เหลือไว้เป็นอะไหล่

หากคุณมีการใช้งาน RAID-5 สำหรับระบบที่ใช้งานจริงคุณควรพิจารณาทิ้งดิสก์สำรองไว้ในอาร์เรย์เป็นอะไหล่สำรอง

เพิ่ม - หากบันทึกของคุณไม่ได้อยู่ในไดรฟ์ข้อมูลแยก (ดิสก์แยกทางกายภาพ) ให้ย้ายไปยังชุดดิสก์แยกต่างหากแม้จะเป็นคู่มิเรอร์เดียว สิ่งนี้จะเป็นผลการดำเนินงานที่ดีหากฐานข้อมูลของคุณมีภาระที่สำคัญเนื่องจากการช่วงชิงในปริมาณการบันทึกมีผลเสียต่อประสิทธิภาพการทำงาน

หากเป็นไปได้คุณสามารถทำให้ฐานข้อมูลของคุณแข็งแกร่งขึ้นโดยทำสิ่งต่อไปนี้:

  1. ปิดฐานข้อมูล
  2. สำรองฐานข้อมูล
  3. ย้ายบันทึกไปยังชุดดิสก์ที่แยกจากกันทางกายภาพ (ตรวจสอบให้แน่ใจว่าคุณกำหนดค่าฐานข้อมูลใหม่เพื่อให้ทราบว่ามีการย้ายบันทึกไปที่ใด)
  4. รีสตาร์ทฐานข้อมูลและแอปพลิเคชัน

หากคุณมีบันทึกในโวลุ่มแยกต่างหากคุณสามารถกู้คืนและย้อนไปข้างหน้าจากการสำรองข้อมูลในกรณีที่ดิสก์ล้มเหลวไม่ส่งผลต่อบันทึก บันทึกฐานข้อมูลควรอยู่ในดิสก์ไดรฟ์ที่แยกต่างหากสำหรับ (ในหมู่อื่น ๆ ) ด้วยเหตุผลดังต่อไปนี้:

  • รูปแบบการใช้งานของไฟล์บันทึกนั้นมีความต่อเนื่องกันเป็นส่วนใหญ่และต่อท้ายรายการไฟล์เข้ากับท้ายไฟล์ ซึ่งหมายความว่ารายการบันทึกจำนวนมากสามารถเขียนได้อย่างรวดเร็วเนื่องจากมีหัวดิสก์เล็ก ๆ หากิจกรรม

  • หากพวกเขากำลังแบ่งปันดิสก์ทางกายภาพกับปริมาณงานที่เข้าถึงแบบสุ่มมาก (เช่นตารางธุรกรรมและดัชนี) พวกเขาจะช้าลงอย่างไม่เป็นสัดส่วนในขณะที่หัวหน้าค้นหากิจกรรมขัดขวางการเขียนตามลำดับ

  • การมีบันทึกในโวลุ่มแยกต่างหากมักจะเป็นผลงานที่ชนะและต้องการคู่มิเรอร์เดียวสำหรับบันทึกเพื่อรองรับปริมาณงานที่ค่อนข้างมาก ซึ่งหมายความว่าฮาร์ดแวร์ในการทำนั้นค่อนข้างถูกดังนั้นจึงมีค่าใช้จ่ายเล็กน้อยสำหรับประสิทธิภาพที่ยอดเยี่ยมและความน่าเชื่อถือที่ได้รับ

  • หากอาร์เรย์ข้อมูลของคุณไม่ทำงานบันทึกจะไม่สูญหาย หากคุณมีกลยุทธ์การสำรองข้อมูลที่เหมาะสมคุณสามารถเรียกคืนจากการสำรองข้อมูลและย้อนกลับจากบันทึก ซึ่งหมายความว่าอาเรย์ทั้งหมดสามารถลงไปบนเซิร์ฟเวอร์ได้โดยไม่เกิดความผิดพลาดเพียงจุดเดียว ทั้งบันทึกและข้อมูลอาร์เรย์ต้องล้มเหลวพร้อมกันเพื่อทำให้ข้อมูลสูญหาย


ขอบคุณสำหรับคำตอบโดยเฉพาะอธิบายว่าทำไมระบบทำงานช้า
Philip Fourie

จับได้เห็นชัดตรงเผง. ฉันยังขอแนะนำให้ปิดเครื่องจนกว่าคุณจะได้รับไดรฟ์สำรองนั้นเข้าที่ เช่นเดียวกับไนเจลกล่าวว่าคุณไม่มีกลยุทธ์การกู้คืน สูญเสียไดรฟ์อื่นหลวมทุกอย่าง
สตู ธ อมป์สัน

สวัสดีไนเจลขอบคุณที่สละเวลาและแบ่งปันความเชี่ยวชาญของคุณ มันเป็นคำแนะนำที่ดีมาก ฉันจะรายงานในภายหลังเกี่ยวกับผลลัพธ์ของการกู้คืน
Philip Fourie

5

1) สำรองข้อมูล

ตอนนี้ไม่มีข้อมูลสูญหาย หากการสำรองข้อมูลของคุณไม่ใช่การสำรองข้อมูลล่าสุด

2) อ่านคู่มือโทรผู้ขาย ฯลฯ

ระบบ RAID ที่แตกต่างกันมีขั้นตอนที่แตกต่างกันสำหรับการเปลี่ยนดิสก์และทำผิดคุณเสี่ยงต่อการทำลายอาร์เรย์ทั้งหมด โดยไม่ทราบว่าฮาร์ดแวร์ / ซอฟต์แวร์ RAID ชนิดใดที่คุณมีเราสามารถเดาขั้นตอนที่จำเป็นเท่านั้น

นอกจากนี้ประสิทธิภาพการทำงานที่ช้าเป็นเพราะ RAID 5 อยู่ในสถานะเสื่อมโทรม (เช่น: ดิสก์ตายหนึ่ง) มีประสิทธิภาพการอ่านที่น่ากลัว วิธีที่น่ากลัวขึ้นอยู่กับวิธีการจัดเก็บพาริตี้และดิสก์ที่เสียชีวิต แต่ข่าวที่ "ดี" คือประสิทธิภาพที่ช้าเมื่อดิสก์หนึ่งแผ่นหายไปเป็นปัญหาที่ทราบกันแล้วและไม่ทำให้เกิดความตื่นตระหนก


4

ก่อนอื่นฉันจะอ่านคู่มือสำหรับฮาร์ดแวร์ / ซอฟต์แวร์ที่คุณใช้ - ส่วนสำหรับการกู้คืนความล้มเหลว :)

ควรเป็นเรื่องง่าย ๆ ในการเปลี่ยนดิสก์และสร้างอาร์เรย์ใหม่อีกครั้ง

จุดที่สำคัญที่สุดในกรณีเช่นนี้คือควรเปลี่ยนดิสก์โดยเร็วที่สุดเนื่องจากหากดิสก์อื่นล้มเหลวคุณอาจสูญเสียข้อมูล คุณควรระบุสาเหตุของความล้มเหลว - เพราะดิสก์เริ่มเก่าหรือไม่ คุณควรเปลี่ยนอันอื่นด้วยหรือไม่ หรือเป็นเพราะไฟกระชากความร้อนหรือการสั่นสะเทือน?


1
อาจสูญเสียข้อมูลหรือไม่ ข้อมูลทั้งหมดในอาร์เรย์หายไปอย่างแน่นอนที่สุด! ไปที่คุกไม่ผ่านเลย (สำรองไว้แน่นอน)
Stu Thompson

1

เท่าที่ฉันเข้าใจ RAID5 เมื่อคุณเปลี่ยนไดรฟ์ที่ล้มเหลวมันจะถูกสร้างใหม่โดยอัตโนมัติจากข้อมูลที่เก็บไว้ในอีกสองรายการ ไม่ว่าคุณจะสามารถ 'hot-swap' ไดรฟ์ใหม่เข้าที่ขึ้นอยู่กับระบบของคุณหรือไม่คุณอาจต้องปิดเครื่องก่อน ไม่ว่าจะด้วยวิธีใดพิจารณาจากราคาที่ค่อนข้างต่ำของไดรฟ์และความสำคัญของข้อมูลของคุณ (สะท้อนจากการตัดสินใจที่จะใช้ RAID5 ในตอนแรก) คุณควรมีไดรฟ์สำรองนั่งในลิ้นชักพร้อมสำหรับเหตุการณ์ดังกล่าว .

ฉันเพิ่งสร้างพีซีพัฒนาใหม่สำหรับตัวเองและตั้งค่าไดรฟ์ข้อมูลหลักภายใต้ RAID5 ฉันสั่งไดรฟ์มากกว่าที่จำเป็นอีกหนึ่งชุดเพื่อให้ฉันมีอะไหล่พร้อมสำหรับช่วงเวลาฉุกเฉินนั้น (ฉันหวังว่าจะไม่เกิดขึ้น)

ตอนนี้คุณได้ถามคำถามแล้วฉันคิดว่าฉันควรจะอ่านเรื่องนี้ให้มากขึ้น


สำหรับปริมาณข้อมูลขนาดเล็กคู่มิเรอร์จะดีกว่าเนื่องจากโดยทั่วไปจะมีความเร็วในการเข้าถึงข้อมูลแบบลำดับที่ดีกว่า RAID-5 ขนาดเล็ก หากคุณต้องการ hot-swap ลองดูระบบอ่าว hot-swap บางแห่งใน scsi4me.com
ConcernedOfTunbridgeWells

0

ทั้งหมดขึ้นอยู่กับระบบ คู่มือพูดว่าอย่างไร? ฮาร์ดแวร์ของคุณรองรับ hotplugging ไดรฟ์ใหม่จากตัวควบคุมไปยังช่องไดรฟ์อย่างสมบูรณ์หรือไม่? คุณมีการสำรองข้อมูลล่าสุดหรือไม่


0

โพสต์ของ NXC สรุปได้ดีมาก ในกรณีที่คุณไม่ได้เปลี่ยนไดรฟ์ที่มีข้อผิดพลาดก่อนที่จะล้มเหลวครั้งที่สองยังคงมีโอกาสที่จะกู้คืนได้เกือบทุกอย่าง (บางครั้งทุกอย่าง) โดยบริการกู้คืนแบบพิเศษ ข้อมูลยังอยู่ในดิสก์และดิสก์ที่ล้มเหลวสามารถนำกลับมาใช้งานได้ในห้องปฏิบัติการเฉพาะทางด้วยอุปกรณ์ที่เหมาะสม อย่างไรก็ตามราคาสำหรับบริการนี้ค่อนข้างสูง มีดิสก์สำรองและการสำรองข้อมูลที่เหมาะสม (ตามคำแนะนำของ NXC) เป็นวิธีที่จะไปในอนาคต

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.