มีการตรวจสอบไฟล์ที่ออกแบบมาโดยเฉพาะสำหรับการกู้คืนไฟล์เดียว (ไฟล์เก็บถาวร) ที่มีข้อมูลเสียหายหรือไม่? สิ่งที่ง่ายเหมือนแฮชที่สามารถใช้กู้คืนไฟล์ได้
ฉันกำลังพยายามที่จะสำรองข้อมูลบางอย่างของบ้านและไฟล์ธุรกิจ (ไม่ใช่ไฟล์มีเดีย) โดยการบีบอัดพวกเขาและออกเดทพวกเขา ไฟล์เก็บถาวรที่ใหญ่ที่สุดในปัจจุบันทำงานประมาณ 250GB หลังจากสร้างไฟล์เก็บถาวรแล้วฉันได้ทำการตรวจสอบ MD5 กับมันแล้วถ่ายโอนไฟล์เก็บถาวรไปยังไดรฟ์อื่นจากนั้นใช้ MD5 เพื่อตรวจสอบว่าไฟล์ถูกถ่ายโอนอย่างถูกต้องและเก็บ MD5 แฮชด้วยคลังเก็บสำหรับการตรวจสอบในอนาคต ฉันวางแผนที่จะพยายามสำรองข้อมูลสำรองเหล่านี้ปีละ 1-2 ครั้งและเก็บไว้ใน HDD และเทปตามที่งบประมาณอนุญาต
รูปแบบไฟล์เก็บถาวรปัจจุบันคือ "Zipx" ที่มีการตั้งค่าสูงสุด
เมื่อพิจารณาจากปริมาณข้อมูลประมาณ 1-2 TB ต่อปีในปัจจุบันฉันมองว่ามีความเสียหายของข้อมูลที่จะจัดการ โดยเฉพาะอย่างยิ่งไฟล์เหล่านี้อยู่ในไดรฟ์ผู้บริโภค เพิ่มในการสำรองข้อมูลที่จบลงด้วยการถ่ายโอนจากจากไดรฟ์ไปยังไดรฟ์ไปยังเทปและกลับมาอีกครั้งว่าไฟล์เก็บถาวรขนาด 250GB เริ่มต้นนั้นสามารถเขียนและอ่านข้อมูลได้หลายเทราไบต์ และการตรวจสอบ MD5 หลังจากการถ่ายโอนแต่ละครั้งจะเพิ่มจำนวนมากเนื่องจากการตรวจสอบ MD5 คือ I / O จำกัด การตรวจสอบ MD5 ในการเก็บถาวร 250GB ใช้เวลานานโดยการเก็บถาวรทั้งหมดและ MD5s ถูกผูกไว้เพื่อไม่ได้รับการตรวจสอบบ่อยเท่าที่พวกเขาต้องการ
ดังนั้นสมมติฐานคือ:
- ข้อมูลจะเสียหาย
- เราจะไม่รู้เกี่ยวกับมันจนกว่าจะเกิดขึ้นจริง
- เนื่องจากข้อ จำกัด ด้านงบประมาณและการขาด "ภารกิจวิกฤติ" เราจึงไม่มีสำเนาสำรองถาวรที่เหมือนกันหลายชุดเท่านั้นมีการทำซ้ำข้อมูลสำรองต่างกัน
- เราต้องการลดจำนวนสำเนาสำรองของเราให้น้อยที่สุดในขณะที่ป้องกันความเสียหายของข้อมูล
- หากไฟล์หนึ่งหรือสองไฟล์ในไฟล์เก็บถาวรเสียหายและเราสูญเสียข้อมูลเมื่อเราพยายามกู้คืน ชีวิตจะดำเนินต่อไป นี่ไม่ใช่ภารกิจที่สำคัญ
- คลังข้อมูลเป็นข้อมูลสำรองสำรองและหวังว่าจะไม่ใช้งานมากกว่าสองสามครั้งในทศวรรษหรือน้อยกว่า การสำรองข้อมูลสดไม่มีการบีบอัด
ด้วยสมมติฐานเหล่านี้เราจะป้องกันความเสียหายของข้อมูลได้อย่างไร
การเก็บแฮช MD5 อนุญาตให้ใครบางคนเท่านั้นที่รู้ว่าข้อมูลปัจจุบันตรงกับข้อมูลดั้งเดิมหรือไม่ ไม่อนุญาตให้บุคคลใดบุคคลหนึ่งหรือช่วยเหลือในทางใดทางหนึ่งเพื่อซ่อมแซมข้อมูล นั่นคือถ้าฉันต้องการเรียกคืนจากการสำรองข้อมูลและมีข้อมูลเสียหายในไฟล์หรือไฟล์ที่ฉันต้องการ MD5 นั้นไร้ประโยชน์อย่างมีประสิทธิภาพ
ดังนั้นจะมีการตรวจสอบที่ออกแบบมาเป็นพิเศษเพื่อไม่เพียง แต่ตรวจสอบข้อมูล แต่ซ่อมแซมด้วยหรือไม่ ชอบ ECC สำหรับหน่วยความจำ แต่สำหรับไฟล์?
บันทึก: ฉันเจอแล้ว parchive แต่ดูเหมือนจะไม่เป็นปัจจุบันและใช้งานได้อย่างน่าเชื่อถือ ในขณะที่ฉันอาจไม่ชอบวิธีที่พวกเขาใช้สิ่งต่าง ๆ แต่โดยทั่วไปแล้วสิ่งที่ฉันกำลังมองหา แต่ไม่สามารถหา มีบางสิ่งที่คล้ายกับ parchive ที่พร้อมใช้งาน "การผลิต" หรือไม่?
ปรับปรุง: ดูเหมือนว่า บางรูปแบบเก็บถาวร ทำการสนับสนุนการกู้คืนแม้ว่ากระแสหลักเดียวเท่านั้นที่ดูเหมือนว่าจะเป็น WinRAR มันจะเป็นไปไม่ได้ที่จะถูกล็อคในรูปแบบเพียงอย่างเดียวสำหรับตัวเลือกนี้เนื่องจากรูปแบบที่ได้รับความนิยมมากที่สุด (75% +/- ในรายการที่เชื่อมโยง) ดูเหมือนจะไม่สนับสนุนการกู้คืน