วิธีการสำรองข้อมูลโวลุ่มหน่วยเก็บข้อมูลที่เข้ารหัสลับนอกสถานที่หรือไม่


0

ให้ฮาร์ดไดรฟ์ที่มีโวลุ่ม Core Storage ที่เข้ารหัส (แต่ไม่ใช่รหัสผ่านการถอดรหัสเนื่องจากบริการสำรองข้อมูลไม่ควรเข้าถึง) วิธีการสำรองข้อมูลในลักษณะที่จะช่วยให้สามารถผลักดันไปยังผู้ให้บริการที่เก็บข้อมูลบนคลาวด์ (เช่น Amazon S3) และสำหรับการสำรองข้อมูลที่เพิ่มขึ้นในอนาคต (เพราะคุณไม่ต้องการที่จะผลักดันให้เต็ม 1TB ทุกวันเมื่อมีการเปลี่ยนแปลงเพียงไม่กี่บล็อก)

คำตอบ:


1

โซลูชันที่เสนอ:

คุณมีอินสแตนซ์ Amazon EC2 ที่มีที่เก็บบล็อกยืดหยุ่นขนาดใหญ่พอที่จะเก็บภาพทั้งหมดที่คุณต้องการสำรองข้อมูล:

backup-host.yourdomain.com:
/mnt/EBS/my-desktop-backup/coreimage.dmg
/mnt/EBS/my-laptop-backup/coreimage.dmg

ที่ไหน:

/dev/ebs-disk-001 -> /mnt/EBS/my-desktop-backup
/dev/ebs-disk-002 -> /mnt/EBS/my-laptop-backup
etc.
etc.

หรือ

backup-host.yourdomain.com:
/mnt/EBS/my-desktop-backup_coreimage.dmg
/mnt/EBS/my-laptop-backup_coreimage.dmg

ที่ไหน:

/dev/ebs-disk-001 -> /mnt/EBS

การสำรองข้อมูลครั้งแรกของคุณจะใช้เวลานานในการซิงค์ แต่ถ้าคุณใช้ rsync ในการซิงค์จากนั้นในที่สุดคุณก็สามารถให้ภาพจากระยะไกลได้ทันกับการเปลี่ยนแปลงของภาพในเครื่องของคุณ

เมื่อถูกดักจับแล้วคุณสามารถเริ่มสแนปชอต EBS ที่ด้านข้างของ Amazon สำหรับไดรฟ์ข้อมูล EBS ที่มีภาพที่เข้ารหัสของคุณ

ล้างและทำซ้ำสำหรับแต่ละช่วงเวลาการสำรองข้อมูล + สแน็ปช็อตที่คุณต้องการสำรองข้อมูลไปยังเซิร์ฟเวอร์ระยะไกลโดยคำนึงถึงรายการ / ข้อกำหนดต่อไปนี้:

  • อิมเมจเข้ารหัสต้องถูกถอดออก
  • สำเนารูปภาพระยะไกลจำเป็นต้องซิงค์กับรูปภาพในเครื่องที่ไม่ได้ต่อเชื่อม 100%
  • สแน็ปช็อตจะต้องดำเนินการด้วยการซิงค์โวลุ่ม EBS ระยะไกลบัฟเฟอร์ของระบบไฟล์จะถูกลบทิ้งและจะไม่มีการเปลี่ยนแปลงใด ๆ

ด้วยสิ่งนี้คุณจะสามารถสำรองข้อมูลแบบเพิ่มขึ้นโดยใช้เทคโนโลยีคลาวด์ของ Amazon

S3 มีข้อ จำกัด ที่ร้ายแรงซึ่งไม่เหมาะกับความต้องการของคุณสำหรับวัตถุประสงค์เฉพาะนี้

อินสแตนซ์ EC2 หากได้รับการสนับสนุนอย่างเต็มที่จาก EBS สามารถปิดได้เมื่อคุณไม่ได้ทำการซิงค์ระยะไกล นั่นคือเมื่อการสำรองข้อมูลของคุณเริ่มต้นขึ้นคุณสามารถเปิดใช้งานอินสแตนซ์นั้นผ่าน EC2 API ของ Amazon และรับชื่อแบบไดนามิกหรือที่อยู่ IP เมื่อมันยืนยันว่ามันขึ้นก็สามารถเริ่มสำรองข้อมูล rsync เมื่อเสร็จแล้วสามารถปิดภาพจากระยะไกลและเริ่มต้นการดำเนินการภาพรวมปริมาณ Amazon EBS

แก้ไข:

rsync มีระดับบล็อก / บล็อกแตกต่างกันสำหรับไฟล์ขนาดใหญ่ คุณสามารถระบุขนาดของบล็อกต่าง:

--block-size=SIZE

นอกจากนี้คุณยังสามารถระบุสตรีมข้อมูลที่ถูกส่งไปยังเซิร์ฟเวอร์ระยะไกลที่จะบีบอัดช่วยให้คุณประหยัดการรับส่งข้อมูล

Caveats เกี่ยวกับ S3 vs EBS:

ยกเว้นว่าโซลูชันที่คุณใช้รองรับรองรับการแยกไฟล์ขนาดใหญ่ออกเป็นส่วน ๆ และส่งแบบขนาน Amazon S3 จะบีบข้อมูลที่มีขนาดต่ำกว่า 400KB / วินาทีหลังจากขนาดที่กำหนด

ฉันใช้การสำรองข้อมูลส่วนต่าง rsync บนเซิร์ฟเวอร์ของฉันเป็น S3 เป็น tarballs ที่ถูกบีบอัด แม้แต่ที่ tarball ขนาดประมาณ 500MB S3 จะเค้น เพื่อแก้ไขปัญหานี้คุณต้องแยกไฟล์ที่คุณส่งเป็นส่วน ๆ มิฉะนั้นการสำรองข้อมูลไปยัง S3 จะใช้เวลานาน

ในขณะที่อินสแตนซ์ EC2 ที่มีปริมาณ EBS จะเร็วขึ้นและไม่จำเป็นต้องแยกไฟล์ทำให้การสำรองและการคืนค่าง่ายขึ้น


1
ดังนั้น rsync จะแตกต่างและอัปโหลดเฉพาะส่วนที่มีการเปลี่ยนแปลงหรือไม่
Thilo

@ Thilo ใช่นั่นคือหนึ่งในผลประโยชน์ที่สำคัญของ rsync และคุณอาจต้องการตรวจสอบ Arq หรือโซลูชันสำรองอื่น ๆ สำหรับ S3
nohillside

@patrix: ใช่ฉันค่อนข้างสนใจ Arq แต่ฉันไม่สามารถหาเอกสารเกี่ยวกับวิธีจัดการกับไฟล์ขนาดใหญ่ที่เปลี่ยนแปลงเพียงเล็กน้อยทุกครั้ง
Thilo

@Thilo อยู่ในย่อหน้าที่สองใต้ "Wayback Machine" บนhaystacksoftware.com/arq : "เฉพาะการเปลี่ยนแปลงที่จะอัปโหลดสำหรับการสำรองข้อมูลแต่ละครั้งลดการใช้เครือข่ายและพื้นที่เก็บข้อมูล" แต่ฉันยอมรับว่าการเปลี่ยนแปลงอาจหมายถึงระดับไฟล์เช่นกัน อาจขอการสนับสนุนโดยตรง และหยุดการสนทนาที่นี่ทันทีก่อนที่ผู้ดำเนินรายการจะกระโดดใน :-) ส่ง Ping ให้ฉันในการแชทหากจำเป็น
nohillside

ตามที่ระบุไว้ในคำตอบของฉันฉันจะแนะนำกับ S3 ได้ลองใช้มันเป็นแบ็กเอนด์สำรองมีเชิงลบหลายประการที่จะใช้มันโดยเฉพาะอย่างยิ่งถ้าคุณตั้งใจจะทำ rsync / block ต่างกัน ฉันจะอธิบายอย่างละเอียดในคำตอบ ซอฟต์แวร์ ARQ ดูน่าสนใจ แต่ฉันคิดว่าคำถามคือวิธีการสำรองข้อมูลระบบไฟล์ที่เข้ารหัสในรูปแบบที่เข้ารหัสไม่ใช่ไฟล์แต่ละไฟล์
Wing Tang Wong
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.