ฉันเริ่มเห็นลูกค้าที่มีข้อมูลหลายร้อยเทราไบต์ (ในการติดตั้ง SQL Server) ในขณะที่ปริมาณข้อมูลทั้งหมดในองค์กรบางแห่งเข้าใกล้เศษส่วนที่มีความหมายของเพตาไบต์ฉันต้องการเพิ่มฐานความรู้แบบกลุ่มเพื่อดูว่าผู้คนกำลังจัดการกับข้อมูลขนาดใดที่กำลังทำอยู่เพื่อปกป้องข้อมูล
ปัญหาที่เห็นได้ชัดคือการจัดเก็บข้อมูลสำรองจำนวนมากของข้อมูลจำนวนมากนั้นมีราคาแพงโดยใช้หน่วยเก็บข้อมูลระดับองค์กรแม้แต่ใน RAID-5
ตัวเลือกที่ฉันเห็นมีดังนี้:
- สร้างสำเนามิรเรอร์ของข้อมูลในศูนย์ข้อมูลอื่นและจัดส่งความแตกต่างอย่างต่อเนื่อง (ใช้กลไกใดก็ได้ที่มีอยู่สำหรับแหล่งข้อมูลของคุณเช่นบันทึกการจัดส่งหรือการทำมิเรอร์ฐานข้อมูลด้วย SQL Server)
- ใช้การสำรองข้อมูลปกติโดยใช้อัลกอริทึมการบีบอัดที่หนักหน่วง (อาจเหมาะสมเฉพาะในกรณีที่ข้อมูลที่ยืมมานั้นถูกบีบอัดอย่างหนัก )
- ใช้การสำรองข้อมูลทีละน้อยของส่วนที่สำคัญ / การเปลี่ยนแปลงของข้อมูล
- อย่าสำรองข้อมูลและไว้วางใจกับผู้ทุจริต
ฉันเห็นตัวเลือก # 4 ถูกนำมาใช้เป็นค่าเริ่มต้นและในฐานะผู้เชี่ยวชาญ HA / DR มันน่ากลัวจริงๆ แต่ฉันจะแนะนำอะไรให้เป็นทางเลือก ฉันคิดว่า # 1 เป็นวิธีที่ดีที่สุด แต่ "ฉันไม่คิดอย่างนั้น" เป็นคำตอบปกติเมื่อมีทางเลือกอื่นนอกเหนือจาก # 4 และ # 3 อาจแนะนำ
แน่นอนว่ามันขึ้นอยู่กับอัตราการเปลี่ยนแปลงและความสำคัญของข้อมูล ไม่จำเป็นต้องตอบเพราะฉันเคยรับผิดชอบคุณลักษณะ HA ทั้งหมดของ SQL Server ในขณะที่ฉันทำงานที่ Microsoft ดังนั้นฉันจึงมีความเชี่ยวชาญในอาร์กิวเมนต์ 'มันขึ้นอยู่กับ' - นั่นคือวลีที่ฉัน :-)
ฉันสนใจที่จะได้ยินทางเลือกใด ๆ ที่ฉันพลาดไปหรือได้ยินว่าทุกคนอยู่ในเรือลำเดียวกันและไม่มีทางเลือกอื่นที่จะใช้เงินจำนวนมากในการจัดเก็บมากขึ้น
ขอขอบคุณล่วงหน้า - เครดิตจะถูกให้กับทุกคำตอบที่คิดออกมาอย่างดี