DL380 G5, RAID5, ext3, RAID ล้มเหลว


9

เรามีเซิร์ฟเวอร์ HP DL380G5 เก่าโดยมีดิสก์ 5 300GB SCSI 3.5 '' ในอาร์เรย์ RAID5 ในช่องภายนอกจัดรูปแบบเป็นโลจิคัลวอลุ่มพร้อมระบบไฟล์ ext3 ที่โฮสต์ข้อมูลผู้ป่วยทางคลินิกที่ละเอียดอ่อน 1.2 TB

ดิสก์สองแผ่นแสดงความล้มเหลวในการคาดเดาใน hpacucli ดังนั้นฉันจึงแทนที่หนึ่งในนั้นก่อนและเห็นว่ามันก็โอเค แต่ฉันไม่เห็นว่ามันยังระบุว่า "พร้อมสำหรับการสร้างใหม่" ฉันเปลี่ยนอย่างที่สองอย่างไม่ระมัดระวังและตอนนี้ก็บอกว่า RAID ล้มเหลว

ฉันคืนดิสก์เก่ากลับมาลองรีบูตเซิร์ฟเวอร์ แต่ตอนนี้ทำให้ฉันเข้าสู่โหมดการกู้คืนระหว่างการบู๊ตและบอกว่ามันไม่สามารถหาโลจิคัลวอลุ่มได้

ฉันสามารถทำอะไรได้บ้างเพื่อพยายามกู้คืนสิ่งนี้? เราไม่มีข้อมูลสำรองโชคไม่ดี ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมจริงๆ!

ฉันคิดว่าจะคืนไดรฟ์เก่าทั้งสองกลับมามีโอกาสที่จะฟื้นฟู RAID หรือไม่


ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
Michael Hampton

4
ฉันคิดว่ากลุ่มของคุณจะเริ่มทำการสำรองข้อมูลทันที หากเคยมีคำถามเกี่ยวกับความจำเป็นหรือค่าใช้จ่ายสิ่งนี้ควรเป็นคำเตือนที่ค่อนข้างชัดเจน
Jonathon Reinhart

คำตอบ:


25

ฉันขอโทษ. แต่นี่เป็นข้อผิดพลาดของโอเปอเรเตอร์

คุณมีดิสก์ที่ล้มเหลวสองตัวในอาเรย์ RAID5 และคุณลบดิสก์ได้มากกว่าอาเรย์ที่จะคงอยู่

การทำเช่นนี้โดยไม่มีการสำรองข้อมูลเป็นความผิดพลาดที่ใหญ่กว่า

คุณควรติดต่อ บริษัท กู้คืนข้อมูลเพื่อพยายามดึงข้อมูลจาก Logical Drive ที่เสียหาย


1
ดูเหมือนว่าเขาจะรู้ว่ามันเป็นข้อผิดพลาดของผู้ให้บริการ…นั่นไม่ใช่เหตุผลที่จะไม่ถามสิ่งที่เขาสามารถทำได้ตอนนี้
StarWeaver

@StarWeaver ใช่ ... การติดต่อ บริษัท กู้คืนข้อมูลเป็นขั้นตอนต่อไปที่เหมาะสม
ewwhite

11

อย่าเปิดระบบอีกครั้ง ปิดเครื่องเรียกใช้บริการกู้คืนข้อมูล มีบริการจำนวนหนึ่งที่อนุญาตให้กู้คืนความล้มเหลวประเภทนี้จากระยะไกลได้ ณ จุดนี้สิ่งที่คุณทำได้คือทำให้แย่ลงไปอีก

ซึ่งมักเกี่ยวข้องกับการเชื่อมต่อไดรฟ์ทั้งหมดกับ HBA ที่รู้จักกันดี (ไม่ใช่การ์ด RAID หรือตัวควบคุมอื่น!) และการเริ่มต้นอิมเมจลินุกซ์ที่สามารถดาวน์โหลดได้ด้วยเครื่องมือการจัดการระยะไกล จากนั้น บริษัท จะเข้าถึงระบบจากระยะไกลประเมินสถานะของดิสก์และกู้คืนข้อมูลเมตา RAID ใด ๆ ที่เหลือ การใช้ซอฟต์แวร์ที่เป็นกรรมสิทธิ์พวกเขาสามารถรวบรวมดิสก์ RAID เสมือนอีกครั้ง (รายละเอียดทางเทคนิค: สิ่งที่มักจะเสียบเข้ากับระบบลินุกซ์อุปกรณ์มาตรฐานของแมป) สิ่งนี้จะทำให้ RAID อ่านอย่างเดียวในซอฟต์แวร์ (ที่ไม่มีตัวเร่ง RAID SoC) ขั้นตอนต่อไปคือการตรวจสอบข้อมูลไม่เสียหายเกินกว่าการใช้งานและการโคลนดิสก์เสมือนไปยังดิสก์ใหม่เพื่อทำการกู้คืนข้อมูลให้เสร็จสมบูรณ์ หลังจากนั้นคุณสามารถกังวลเกี่ยวกับการสำรองและเรียกใช้ระบบ

ในขณะที่ฉันจะไม่ตั้งชื่อบริการใด ๆ ที่นี่ส่วนใหญ่หาได้ง่ายและสำหรับบริการระยะไกล (ช่วยให้คุณประหยัดเวลาในการจัดส่ง RAID ไดรฟ์ + ไดรฟ์กู้คืนไปยังพวกเขาและรอการกู้คืน + โคลนและ แล้วพวกเขาก็ส่งมันกลับ) คุณจะได้รับประโยชน์จากข้อมูลที่ไม่เคยออกจากสถานที่ของคุณ


ข่าวดีเล็กน้อย: ตราบใดที่คอนโทรลเลอร์ RAID (หรือคุณ) ไม่ได้เขียนข้อมูลใหม่ลงดิสก์ใด ๆ และการเตือนล่วงหน้าล้มเหลวไม่ใช่คำเตือนล้มเหลวมีโอกาส 99.9999% ในทางปฏิบัติ ทีมกู้คืนข้อมูลที่ดีสามารถกู้คืนข้อมูลทั้งหมดและรวดเร็วพอสมควร


5

เรื่องการกู้คืนไดรฟ์เก่า

เนื่องจาก RAID ของคุณนั้นตายไปแล้วอย่างสมบูรณ์คุณมีความสูญเสียเพียงเล็กน้อยโดยการอ้างอิงไดรฟ์ก่อนเกิดความผิดพลาดสองตัว

ทำการติดตั้งในช่องต้นฉบับ

โปรดจำไว้ว่าพวกเขาไม่ได้ล้มเหลวล่วงหน้าดังนั้นจึงมีโอกาสพอสมควรที่พวกเขาจะทำงานได้นานพอที่จะช่วยเหลือข้อมูลของคุณได้

มีโอกาสที่การจู่โจมจะไม่เกิดขึ้นและมีโอกาสเล็กน้อยที่ผู้ควบคุมจะขอให้ "รีเซ็ต" การจู่โจม (เลือกไม่ / ยกเลิก) และโอกาสเล็ก ๆ ที่ผู้ควบคุมการจู่โจมอาจรีเซ็ตการจู่โจมโดยอัตโนมัติซึ่งจะลบล้างค่าใด ๆ เพิ่มโดย บริษัท กู้ข้อมูล

ดังนั้นลำดับความสำคัญสูงสุดของคุณถ้าการจู่โจมเกิดขึ้นคือการลบข้อมูลออก นั่นหมายความว่ามีอย่างน้อย 1.2 TB พื้นที่ที่มีอยู่และพร้อมที่จะคัดลอกข้อมูลออกและเครื่องมือที่เหมือนrobocopyหรือxcopy32หรือในกรณีลินุกซ์ของคุณrsync พร้อมที่จะทำงาน คุณไม่ต้องการเสียเวลาอ่านหน้าคนและหาไวยากรณ์ถ้าไดรฟ์ของคุณเสียเวลาในนาทีสุดท้าย


เมื่อข้อมูลของคุณปลอดภัยแล้วสร้างการจู่โจมใหม่เป็น raid6 ด้วยไดรฟ์ใหม่ คุณจะลดความจุ 300GB แต่เพิ่มความทนทานสองระดับ หรือเพิ่มไดรฟ์เพิ่มเติมและพิจารณา raid10 มากกว่า 6 ไดรฟ์ หรือพิจารณาเลิกใช้เครื่องนี้โดยสมบูรณ์ G5 มีอายุมากกว่า 10 ปีและไม่เหมาะสำหรับงานการผลิตที่สำคัญอีกต่อไป

และไม่พยายามใส่บู๊ต แต่ตั้งค่าโซลูชันการสำรองข้อมูลที่เหมาะสมด้วย จะมีในครั้งต่อไป


2
เพื่อชี้แจง - มีโอกาสเล็กน้อย แต่ไม่เป็นศูนย์ที่การทำเช่นนี้จะทำให้ บริษัท กู้ข้อมูลเชิงพาณิชย์ประสบความสำเร็จในการช่วยเหลือคุณได้ยากขึ้น โดยส่วนตัวแล้วฉันจะพยายามรวบรวมการจู่โจมอีกครั้งและถ้านั่นไม่ได้ผล
Criggie
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.