ฉันมีอินสแตนซ์ EC2 ที่เรียกใช้เว็บเซิร์ฟเวอร์ที่เก็บไฟล์ที่ผู้ใช้อัพโหลดไปยัง S3 ไฟล์จะถูกเขียนหนึ่งครั้งและไม่เคยเปลี่ยนแปลง แต่จะถูกเรียกใช้เป็นครั้งคราวโดยผู้ใช้ เราน่าจะสะสมข้อมูลประมาณ 200-500GB ต่อปี เราต้องการให้แน่ใจว่าข้อมูลนี้ปลอดภัยโดยเฉพาะอย่างยิ่งจากการลบโดยไม่ตั้งใจและต้องการให้สามารถกู้คืนไฟล์ที่ถูกลบโดยไม่คำนึงถึงเหตุผล
ฉันได้อ่านเกี่ยวกับฟีเจอร์การกำหนดรุ่นสำหรับที่เก็บ S3 แล้ว แต่ฉันไม่พบว่าการกู้คืนเป็นไปได้สำหรับไฟล์ที่ไม่มีประวัติการแก้ไขหรือไม่ ดูเอกสาร AWS ที่นี่เกี่ยวกับการกำหนดเวอร์ชัน:
http://docs.aws.amazon.com/AmazonS3/latest/dev/ObjectVersioning.html
ในตัวอย่างเหล่านั้นพวกเขาจะไม่แสดงสถานการณ์ที่ข้อมูลถูกอัปโหลด แต่ไม่เคยแก้ไขแล้วลบออก ไฟล์ถูกลบในสถานการณ์นี้กู้คืนได้หรือไม่?
จากนั้นเราคิดว่าเราสามารถสำรองไฟล์ S3 ไปยัง Glacier โดยใช้การจัดการวงจรชีวิตของวัตถุ:
http://docs.aws.amazon.com/AmazonS3/latest/dev/object-lifecycle-mgmt.html
แต่ดูเหมือนว่าสิ่งนี้จะไม่ได้ผลสำหรับเราเนื่องจากไม่ได้คัดลอกวัตถุไฟล์ไปยังกลาเซียร์ แต่ย้ายไปยังกลาเซียร์ (ยิ่งแม่นยำยิ่งขึ้นดูเหมือนว่ามันเป็นคุณลักษณะของวัตถุที่เปลี่ยนแปลงแต่ทว่า ... )
ดังนั้นจึงดูเหมือนว่าไม่มีวิธีโดยตรงในการสำรองข้อมูล S3 และการถ่ายโอนข้อมูลจาก S3 ไปยังเซิร์ฟเวอร์ในพื้นที่อาจใช้เวลานานและอาจมีค่าใช้จ่ายในการโอนที่สำคัญตลอดเวลา
สุดท้ายเราคิดว่าเราจะสร้างที่เก็บข้อมูลใหม่ทุกเดือนเพื่อทำหน้าที่สำรองข้อมูลเต็มรูปแบบทุกเดือนและคัดลอกข้อมูลของที่เก็บข้อมูลต้นฉบับไปที่ที่เก็บข้อมูลใหม่ในวันที่ 1 จากนั้นใช้สิ่งที่ซ้ำซ้อน ( http://duplicity.nongnu.org/) ) เราจะซิงโครไนซ์ถังสำรองทุกคืน ในตอนท้ายของเดือนเราจะใส่เนื้อหาของฝากข้อมูลสำรองลงในที่เก็บข้อมูลของ Glacier และสร้างที่เก็บข้อมูลสำรองใหม่โดยใช้สำเนาใหม่ปัจจุบันของที่เก็บข้อมูลต้นฉบับ ... และทำซ้ำขั้นตอนนี้ ดูเหมือนว่าจะใช้งานได้และลดค่าใช้จ่ายในการจัดเก็บ / ถ่ายโอนให้น้อยที่สุด แต่ฉันไม่แน่ใจว่าซ้ำซ้อนช่วยให้สามารถถ่ายโอนข้อมูลแบบถังต่อถังโดยตรงโดยไม่ต้องนำข้อมูลลงไปยังไคลเอนต์ควบคุมก่อน
ดังนั้นฉันเดาว่ามีคำถามสองสามข้อที่นี่ ก่อนอื่นการกำหนดรุ่น S3 อนุญาตการกู้คืนไฟล์ที่ไม่เคยแก้ไขหรือไม่ มีวิธี "คัดลอก" ไฟล์จาก S3 ไปยัง Glacier ที่ฉันพลาดหรือไม่? ความซ้ำซ้อนหรือไฟล์การถ่ายโอนเครื่องมืออื่น ๆ ระหว่าง S3 กลุ่มโดยตรงโดยตรงเพื่อหลีกเลี่ยงค่าใช้จ่ายในการถ่ายโอน? ในที่สุดฉันจะปิดเครื่องหมายในแนวทางของฉันในการสำรองข้อมูล S3 หรือไม่
ขอบคุณล่วงหน้าสำหรับข้อมูลเชิงลึกที่คุณสามารถให้ได้!
ปรับปรุง
Amazon เพิ่งประกาศว่าการกำหนดเวอร์ชันในขณะนี้ทำงานกับกฎวงจรชีวิต