รูปแบบไฟล์เก็บถาวรใดที่ให้การป้องกันการกู้คืนจากความเสียหายของไฟล์


10

ฉันใช้ HDD ภายนอกของฉันเพื่อสำรองไฟล์โดยใส่ลงในไฟล์เก็บถาวรขนาดใหญ่

ฉันมีไฟล์เล็ก ๆ หลายพันไฟล์และเก็บไว้ในคลังเก็บขนาด 500MB ถึง 4.2GB ก่อนที่จะส่งไปยัง HDD ภายนอก แต่ความล้มเหลวของฮาร์ดดิสก์หนึ่งครั้งจะทำลายการเก็บถาวรทั้งหมดหรือไฟล์เดียวในการเก็บถาวรหรือไม่ ฉันกลัวว่าบิตที่ถูกเปิดหนึ่งครั้งอาจทำให้ส่วนใหญ่ของไฟล์เก็บถาวรไม่มีประโยชน์

สิ่งต่าง ๆ เช่นการตรวจสอบ CRC สามารถแจ้งเตือนคุณถึงการมีอยู่ของความเสียหาย แต่ฉันสนใจในความสามารถในการกู้คืนไฟล์ที่ไม่เสียหายจากไฟล์เก็บถาวรที่เสียหาย รูปแบบไฟล์เก็บถาวรใดที่จะให้ความสามารถที่ดีที่สุดในการกู้คืนจากความล้มเหลวดังกล่าวไม่ว่าจะผ่านการออกแบบดั้งเดิมของโครงสร้างไฟล์เก็บถาวรหรือการมีอยู่ของเครื่องมือการกู้คืนเพิ่มเติม ความสามารถนี้มีความแตกต่างระหว่างไฟล์ zip และ iso หรือไม่?


ฉันรู้ว่าอย่างน้อยหนึ่งในโปรแกรมที่ฉันใช้สำหรับการซิงโครไนซ์ไฟล์รองรับการคัดลอกแบบมัลติเธรดซึ่งฉันเชื่อว่าช่วยลดความล่าช้าในการคัดลอกไฟล์ขนาดเล็กจำนวนมาก นอกจากนี้แม้ว่าฉันจะต้องทดสอบเพื่อให้แน่ใจว่าฉันมีข้อสงสัยว่าการสร้างที่เก็บถาวรของไฟล์ขนาดเล็กจำนวนมากจะใช้เวลานานกว่าการสร้างที่เก็บถาวรสำหรับไฟล์ขนาดใหญ่หลาย ๆ ไฟล์แม้ว่าจะไม่มีการบีบอัดก็ตาม ฉันจำไม่ได้ว่านี่เป็นปัญหาเฉพาะ Windows หรือไม่ iirc มีโซลูชันซอฟต์แวร์บางตัวสำหรับ Linux ที่สามารถจัดการไฟล์ขนาดเล็กจำนวนมากในบล็อก แต่ฉันจำรายละเอียดไม่ได้
JAB

โปรดเปิดคำถามอีกครั้ง ฉันได้สร้างข้อความใหม่แล้วและควรชัดเจนยิ่งขึ้นในตอนนี้ "ดีที่สุด" มักจะอิงตามความคิดเห็น แต่ความต้องการที่จะดีที่สุดที่นี่ค่อนข้างชัดเจน ห้องเล็ก ๆ สำหรับผู้มีความมั่นใจส่วนตัว IMHO โปรดลบความคิดเห็นนี้หลังจากเปิดใหม่
Marcel

คำตอบ:


8

ระบุว่าเกิดความเสียหายเป็นส่วนหนึ่งของไดเรกทอรีเก็บใด ๆ ที่อาจเกิดขึ้นอาจทำให้เก็บทั้งหมดไร้ประโยชน์ทางออกที่ดีที่สุดของคุณจะเพิ่มขั้นตอนที่แยกต่างหากเพื่อการสำรองข้อมูลของคุณเพื่อสร้างสิ่งที่เรียกว่าไฟล์ที่เท่าเทียมกัน ในกรณีที่บล็อกข้อมูลในไฟล์ต้นฉบับได้รับความเสียหายสามารถสร้างขึ้นใหม่ได้โดยการรวมข้อมูลจากไฟล์พาริตีกับบล็อกที่ถูกต้องจากไฟล์ต้นฉบับ

ตัวแปรจะมีความเสียหายเท่าใดที่คุณต้องการซ่อมแซม หากคุณต้องการป้องกันการพลิกเพียงครั้งเดียวไฟล์พาริตีของคุณจะมีขนาดเพียง 1 บิต หากคุณต้องการบางสิ่งบางอย่างในขนาดเซกเตอร์ดิสก์แล้วแน่นอนว่าคุณจะต้องเสียค่าใช้จ่ายมากขึ้น

มีทฤษฎีใหญ่อยู่เบื้องหลังเรื่องนี้ (ดูการแก้ไขข้อผิดพลาดไปข้างหน้า ) และมันถูกใช้อย่างกว้างขวางในทางปฏิบัติ ตัวอย่างเช่นนี่คือวิธีที่ซีดีสามารถทนต่อการขีดข่วนในระดับหนึ่งและวิธีที่โทรศัพท์มือถือสามารถรักษาคุณภาพการโทรที่เหมาะสมผ่านการเชื่อมต่อที่สูญเสียไป

เรื่องสั้นสั้น ๆ ลองดู.parไฟล์


1
ขอบคุณขณะค้นหาไฟล์พาริตี้ฉันพบบันทึกการกู้คืนของ WinRAR ง่ายขึ้นในการใช้งานทุกวัน ฉันจะลองใช้ QuickPar ด้วย
sevenkul

2
ข้อมูลการแก้ไขข้อผิดพลาดหนึ่งบิตไม่เพียงพอที่จะซ่อมแซมข้อผิดพลาดแบบหนึ่งบิตในไฟล์ข้อมูล n-bit ของคุณ คุณสามารถตรวจพบข้อผิดพลาดดังกล่าวด้วยบิตเดียว แต่เพื่อซ่อมแซมคุณต้องมี log n bits เป็นอย่างน้อย
Thom Smith

4

Bup [1] สำรองข้อมูลและเพิ่มความซ้ำซ้อนของพาริตีโดยอัตโนมัติ ความล้มเหลวของดิสก์ที่ร้ายแรงนั้นยังคงเป็นสิ่งหนึ่งดังนั้นเราจึงสามารถใช้กับ git-annex ได้

git-annex [2] จัดการไฟล์ที่เก็บไว้ในที่เก็บหลายแห่งซึ่งบางไฟล์อาจถูกเก็บไว้ในคอมพิวเตอร์ของคุณ thumb-drive, ssh login, บริการคลาวด์หรือที่เก็บสำรองข้อมูล bup [3] ทำให้การไหลของข้อมูลของไฟล์ค่อนข้างโปร่งใส โดยการร้องขอหรือโดยอัตโนมัติลงในพื้นที่เก็บข้อมูลใดก็ตามที่คุณได้ตั้งค่า นอกจากนี้ยังเป็นโครงการซอฟต์แวร์โอเพนซอร์ซที่ให้เงินทุนสนับสนุนจำนวนมากซึ่งเขียนขึ้นใน Haskell โดยมีเวอร์ชันที่ใช้งานบนหลายแพลตฟอร์มรวมถึง linux, mac, windows และ android

[1] https://github.com/bup/bup

[2] http://git-annex.branchable.com/

[3] http://git-annex.branchable.com/special_remotes/bup/


3

แต่ความล้มเหลวของฮาร์ดดิสก์ตัวหนึ่งจะทำลายไฟล์เก็บถาวรทั้งหมดหรือไฟล์เดียวในไฟล์เก็บถาวร?

หากไม่มีทางเลือกอื่นในการทำสำเนาทุกอย่างเป็นไฟล์เก็บถาวรขนาดใหญ่คุณอาจต้องทำการตัดสินใจระหว่างการใช้งานไฟล์บีบอัดหรือไฟล์บีบอัดที่ไม่มีการบีบอัด

เนื้อหาของไฟล์เก็บถาวรที่ไม่มีการบีบอัดเช่นtarballsยังสามารถตรวจจับได้ด้วยซอฟต์แวร์กู้คืนไฟล์แม้ว่าไฟล์เก็บถาวรจะไม่สามารถอ่านได้อีกต่อไป (เช่นเนื่องจากส่วนหัวที่เสียหาย)

การใช้ที่เก็บถาวรที่บีบอัดอาจเป็นอันตรายได้เนื่องจากบางคนอาจปฏิเสธที่จะแตกไฟล์ถ้าเกิดข้อผิดพลาดในการตรวจสอบซึ่งอาจเกิดขึ้นได้แม้ว่าไฟล์เก็บถาวรจะมีการเปลี่ยนแปลงเพียงเล็กน้อย

แน่นอนหนึ่งสามารถลดความเสี่ยงโดยไม่จัดเก็บหลายร้อยไฟล์ลงในที่เก็บบีบอัดหนึ่ง แต่หลายร้อยของไฟล์บีบอัดลงในหนึ่งเก็บถาวรที่ไม่มีการบีบอัด

gzip *
tar cf archive.tar *.gz

แม้ว่าฉันไม่เคยเห็นไฟล์ gzipped จำนวนมากใน tarball ในสัตว์ป่ามาก่อน สิ่งที่ตรงกันข้ามเท่านั้นที่เป็นที่นิยม (เช่นไฟล์ tar.gz)

มีความแตกต่างระหว่างไฟล์ zip และ iso หรือไม่?

ZIP เป็นไฟล์บีบอัดที่เก็บถาวร (ส่วนใหญ่ แต่ไม่จำเป็น) และ ISO เป็นรูปแบบที่ระบุข้อมูลดิบที่คัดลอกในระดับต่ำจากออปติคัลดิสก์ลงในไฟล์ หลังสามารถมีทุกอย่างแท้จริง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.