การจัดเก็บข้อมูลระยะยาวของข้อมูลทางธุรกิจที่สำคัญ


16

นี่เป็นสิ่งที่ยุ่งยากมากและในระดับหนึ่งก็ไม่ใช่ปัญหาทางเทคนิคและอาจไม่ใช่ของที่นี่

Server Fault สำหรับผู้ดูแลระบบ ... ที่จัดการหรือบำรุงรักษาคอมพิวเตอร์ในระดับมืออาชีพ

และฉันก็ทำ .. และนี่คือหนึ่งในภารกิจของฉัน .. อย่างไรก็ตาม

ลองนึกภาพคุณมี A4 + สองหน้าจำนวน A4 ข้อมูลของ บริษัท ธุรกิจที่สำคัญทั้งหมด
คุณจำเป็นต้องสำรองข้อมูลอย่างใด โซลูชันที่เสนอมีดังนี้:

  1. PDF -> ที่เก็บข้อมูลออนไลน์
  2. PDF -> DVD / BluRay / Tape
  3. PDF -> ไดรฟ์ HDD / SSD / แฟลชพกพา
  4. ซื้อ / เช่า / เช่า / 'ขโมย' เครื่องถ่ายเอกสารขนาดใหญ่และทำสำเนา
  5. ???

ปัญหาทันทีกับด้านบน:

  1. เกิดอะไรขึ้นถ้าพันธมิตรที่จัดเก็บข้อมูลเกิดความวุ่นวาย
  2. ดีวีดีเน่าเมื่อเวลาผ่านไป เทปในทำนองเดียวกัน
  3. สิ่งเหล่านี้ก็เหมือนกันหมดเวลา
  4. เเพง. ช้า. หนัก. ไม่เป็นมิตรกับต้นไม้

คำถาม):

มาตรฐานทองคำสำหรับการเก็บรักษาข้อมูลระยะยาวและขนาดกลางคืออะไร? คุณแก้ไขปัญหาที่คล้ายกันในที่ทำงานหรือไม่

หลังจากโหลดครั้งแรกมีความต้องการที่จะเพิ่มลงในคอลเลกชันประมาณ 100 หน้าต่อเดือน การสืบค้นควรเป็นไปได้อย่างง่ายดาย แต่อาจไม่บ่อยนัก
เป็นการดีที่ฉันต้องการรับประกันว่าโซลูชันจะสามารถใช้งานได้นานหลังจากที่ฉันออกจาก บริษัท และไม่ต้องใช้จำนวนมากในการดูแลรักษาดังนั้นการเก็บดีวีดีจำนวนมากไม่เพียง แต่ไม่เหมาะ แต่ยังไม่เหมาะ ทางออกที่ดีในระยะยาว

ในขณะที่การทำสำเนากระดาษนั้นเป็นวิธีที่ง่ายที่สุด แต่ก็ไม่ได้เป็นมิตรกับสิ่งแวดล้อมมากที่สุด นอกจากนี้ยังไม่สามารถจัดการจัดการค้นหาดัชนีและอื่น ๆ ได้ยาก รวมกับของหนักและเก็บได้ยาก

ฉันค่อนข้างชอบแนวคิดในการมีทุกสิ่งที่เก็บไว้ทางอิเล็กทรอนิกส์ แต่กลไกที่แท้จริงของการทำเช่นนี้ต้องมีความโปร่งใสและใช้งานง่าย ฉันไม่ต้องการที่จะรับผิดชอบเรื่องนี้ตลอดไปและเป็นวันที่ให้การสนับสนุนผู้ใช้ในสำนักงานเมื่อพวกเขาจัดการและทำเอกสารหาย ฉันยังไม่ต้องการพึ่งพาผู้จัดเก็บข้อมูลรายเดียวหาก Dropbox (เรามีโซลูชันการสำรองข้อมูลออนไลน์ ATM แต่ไม่ใช่ Dropbox) กำลังจะหยุดงานหรือประสบเหตุการณ์ภัยพิบัติจำนวนธุรกิจเท่าใด ใครกำลังใช้บริการของพวกเขาจะขึ้นลำห้วย

มีความยืดหยุ่นด้านงบประมาณที่นี่ แต่ฉันสงสัยว่ามีค่าใช้จ่ายมากกว่าการสำรองข้อมูลออนไลน์ปัจจุบันของเรา (ซึ่งก็คือ 2,500 ดอลล่าร์สหรัฐ / ปี) จะดูได้ไม่ดีเท่าที่ควรเมื่อเทียบกับเพียงวางไว้ในกล่องรองเท้าใต้เตียง ซึ่งไม่ต้องสงสัยเลยว่าจะเกิดอะไรขึ้นถ้าฉันไม่ทำอะไรเลยและลาออกในวันพรุ่งนี้

ความคิดใด ๆ

-Edit-

เหตุผลในการทำเช่นนี้คือสองเท่า

1) ให้การสำรองข้อมูลสำคัญทางธุรกิจที่มีความปลอดภัยอย่างสมเหตุสมผลในกรณีที่สำนักงานถูกไฟไหม้

2) เพื่อให้เป็นไปตามกฎหมายว่าด้วยการเก็บข้อมูลของ WRT กฎหมายภาษีของสหราชอาณาจักรสำหรับธุรกิจและอื่น ๆ

แก้ไข 2:

มีกลไกในการจัดทำดัชนีเอกสารจะมีประโยชน์เลือดเกินไป ..


ฉันเคาะสคริปต์อย่างรวดเร็วสำหรับการทำ PDF-> Txt ด้วย ghostscript และ gocr เพียงพิจารณาการพ่นทุกอย่างลงใน SQLlite db เพื่อสร้างดัชนีที่น่าสนใจสำหรับข้อมูล
Tom O'Connor

ความซ้ำซ้อน (ของสื่อดิจิทัล) และการคงความซ้ำซ้อนตลอดทั้งปีอาจเป็นเพื่อนที่ดีที่สุดของคุณ
Vortico

คำตอบ:


5

การเก็บข้อมูลในรูปแบบ PDF อาจปลอดภัยเนื่องจากมีเครื่องมือฟรีสำหรับอ่าน ปริมาณข้อมูลที่คุณพูดถึงค่อนข้างเล็ก (1,200 หน้า / ปี) ดังนั้นแม้ที่ความละเอียดการสแกน 300 dpi คุณเพียงแค่พูดถึงเรื่องของสิบกิกะไบต์ต่อปี

แม้ว่าปัญหาอุปกรณ์จัดเก็บข้อมูลทางกายภาพจะไม่หายไปไหน สื่อใดก็ตามที่คุณใช้ในการจัดเก็บข้อมูลอิเล็กทรอนิกส์ (เทปออปติคัล ฯลฯ ) ในที่สุดจะต้องได้รับการอัปเดตเป็นสื่อใหม่ วางแผนและงบประมาณสำหรับ "การเตะข้อมูลบนถนน" เป็นรูปแบบใหม่เนื่องจากรูปแบบใหม่จะแทนที่รูปแบบเก่ากว่า

ฉันอาจดูสื่อออพติคอลเป็นตัวเลือกแรกเพราะคุณมีข้อมูลน้อยมาก ฉันวางแผนที่จะเบิร์นซ้ำซ้อน 3 เท่าของทุกอย่างและทำให้สื่อสดชื่นทุก 2 - 3 ปี

ถ้าสื่อออปติคัลมีขนาดเล็กเกินไปฉันจะใช้เทป LTO และรีเฟรชสื่อทุกๆ 4 - 5 ปี แม้ว่าจะมีราคาค่อนข้างสูงสำหรับข้อมูลจำนวนเล็กน้อยเช่นนั้น


ดีวีดี? หรือบลูเรย์ BR เป็นรูปแบบที่สมเหตุสมผลสำหรับข้อมูลหรือยัง
Tom O'Connor

1
@ Tom O'Connor: พวกเขาดูเหมือนฉัน ฉันจะดูค่าใช้จ่ายในการตัดสินใจ ตอนนี้มี Blu-ray "archives grade" ว่างดังนั้นจากมุมมองทางเทคนิคดูเหมือนว่าจะเป็นรูปแบบที่ใช้งานได้ (ผู้ผลิตบอกว่าสื่อ Blu-Ray นั้นมีชีวิตที่ "ได้รับการจัดอันดับ" เป็นเวลา 200 ปีไม่ได้ให้ความมั่นใจอะไรกับฉันมากกว่าผู้ที่กล่าวว่าสื่อดีวีดีที่เก็บถาวรมีอายุการใช้งาน "อันดับ" 100 ปี ... )
Evan Anderson

ฉันมีแผ่นซีดี Kodak GOLD ตั้งแต่ประมาณปี 1998 หรือประมาณนั้นและพวกมันยังสามารถอ่านได้ ฉันยังมีอิสระบางตัวที่ชั้นย้อมแยกออกจากกัน
Tom O'Connor

ฉันไม่ได้แนะนำว่าไม่มีความแตกต่างในการเก็บถาวรกับสื่อที่ไม่ใช่การเก็บถาวร ฉันแค่บอกว่าสื่อบันทึกชั้นประถมศึกษาปี Blu-Ray และสื่อเก็บดีวีดีเกรดดูเหมือนจะไม่แตกต่างกันมากสำหรับฉัน การเปรียบเทียบระดับการเก็บถาวรกับ "แกนหมุน 100 สำหรับ $ 20.00" สื่อเป็นเรื่องที่แตกต่างกันโดยสิ้นเชิง
Evan Anderson

รายการหนึ่งที่ไม่ได้กล่าวถึงคืออุปกรณ์จัดเก็บข้อมูลแบบโซลิดสเตต (ไดรฟ์ USB ขนาดเล็ก): ใหญ่กว่าออปติคอลเล็กกว่า LTO USB มีแนวโน้มที่จะอยู่ในระดับต่ำอย่างน้อยหนึ่งหรือสองทศวรรษและไดรฟ์หัวแม่มือขนาด 16GB หรือ 32GB (หรือสองหรือสาม) นั้นค่อนข้างถูกในแง่ของต้นทุนการเก็บถาวร เนื่องจากมันจะเขียน - อ่านแล้ว - หลายครั้งคุณไม่ต้องกังวลเกี่ยวกับเซลล์ SSD ที่ชำรุดดังนั้นคุณสามารถเก็บไม้ไว้ได้ 5 ปีหรือมากกว่านั้นในห้องนิรภัยที่ทนไฟ
voretaq7

6

มีระบบเฉพาะที่ใช้ดีวีดีภายในและย้ายข้อมูลไปยังสื่อใหม่ทุก ๆ ครั้ง ค้นหาการสงวนรักษาแบบดิจิทัล

เนื่องจากความต้องการพื้นที่เก็บข้อมูลเพิ่มขึ้นอย่างรวดเร็วจึงแนะนำให้เปลี่ยนเป็นสื่อประเภทใหม่ที่ใหญ่กว่าทุก ๆ สองสามปี

สมมติว่าคุณได้รับข้อมูลในรูปแบบกระดาษคุณต้อง:

  1. รายการข้อมูลที่รายการจดหมาย นี่อาจหมายถึงการให้บาร์โค้ดที่เป็นเอกลักษณ์แต่ละแผ่น
  2. สแกนมัน ใช้ตัวระบุบาร์โค้ดเป็นชื่อไฟล์ เก็บกระดาษ
  3. เก็บข้อมูล ใส่ข้อมูลลงในระบบการเก็บถาวรที่ปลอดภัยการแก้ไข ไฟล์เซิร์ฟเวอร์จะไม่ดีพอเพราะบางสิ่งอาจเกิดขึ้นกับไฟล์หากสามารถเข้าถึงได้จากการเขียน
  4. ทำให้สามารถอ่านได้สำหรับระบบอื่น

ในกรณีลูกค้าเป็นใบแจ้งหนี้ทั้งหมดสำหรับองค์กรขนาดใหญ่ที่ต้องโอนไปยังระบบออนไลน์ (SAP) ที่เก็บข้อมูลเก็บถาวรได้ทำซ้ำหลายครั้งในขณะนี้ ขณะนี้พวกเขากำลังย้ายไปยังบลูเรย์

ในทางกลับกันทุกวันนี้ทุกอย่างเข้าสู่ดิสก์ดังนั้นบางสิ่งในแนวนี้อาจเป็นหนทางไปของคุณ: http://www.eurostor.com/german/iTernity.D.php


โปรดทราบว่า DVD-R (et al) ส่วนใหญ่ใช้เวลาเพียงไม่กี่ปีก่อนที่จะลดระดับ สิ่งของ "การเก็บถาวร" ราคาแพงจะอยู่ได้นานขึ้นหากเก็บไว้ตามคำแนะนำ
Chris S

เช่นดิสก์เซิร์ฟเวอร์ระบบไฟล์หรือรูปแบบเอกสารส่วนใหญ่ การเก็บถาวรหมายถึงการย้ายข้อมูล ลองอ่านไฟล์ PDF ใน 20 ปี คุณจำได้ไหมว่ามาตรฐานเมื่อ 10 ปีที่แล้ว? เราไม่มีอะไรที่ใกล้เคียงกับกระดาษจริงๆ ยกเว้นการคัดลอกและวาง ...
Posipiet

เอกสารข้อความล้วนค่อนข้างอ่านได้ง่าย
Bart Silverstrim

มีเครื่องมือฟรีสำหรับอ่าน PDF ตราบใดที่พวกเขา "วานิลลาธรรมดา" ฉันจะไม่กังวลเกินไป TIFF ก็เป็นตัวเลือกที่ดีเช่นกัน
Evan Anderson

3

โซลูชันของเรา: สแกนเป็น PDF -> สำรองข้อมูลลงเทป

เรามีเครื่องสแกนเอกสารทำหน้าที่ ~ 30 หน้า / นาทีและสร้างไฟล์ OCRed PDF เราสำรองข้อมูลเหล่านั้นไว้ที่ Tape (LTO4 โดยเฉพาะ) ซึ่งมีอายุการเก็บข้อมูล 50 ถึง 100 ปี (การค้นหาเทปไดรฟ์อาจเป็นเรื่องยากในกรอบเวลา


2
ฉันต้อง google 8 "ฟลอปปี้ ....
Holocryptic

ฉันเก็บเทปสำรองข้อมูลของฉันจาก Mac OS 7.5 แต่ดิสก์เสียหายสื่อสำรองข้อมูลของโปรแกรมจะหายไป ฉันจัดการเพื่อติดตั้ง Mac ใหม่ แต่ฉันไม่สามารถอ่านเทปได้เพราะฉันไม่มีโปรแกรมสำรองข้อมูล และตรงไปตรงมาฉันจำชื่อของมันไม่ได้ ใช่เทปอาจมีอายุ 100 ปี แต่ผู้อ่านไม่ได้
Posipiet

@ Holocryptic: เพียงไม่กี่เดือนที่ผ่านมาฉันโยนกล่องที่ปิดสนิทของ Verbatim ฮาร์ดดิสก์เซกเตอร์ 8 "ฟลอปปี้ดิสก์
user9517

1
@ Holocryptic: NSFW! กี่ !!
Bart Silverstrim

@Pipipiet ฉันคิดว่าฉันปิดบังความจริงที่ว่าไดรฟ์ไม่ได้อยู่ตลอดไป แต่มี บริษัท ที่เชี่ยวชาญในการกู้คืนข้อมูลจากสื่อที่ใช้กันทั่วไป
Chris S

3

ฉันคิดว่าการบริการธารน้ำแข็งใหม่ของอเมซอนนั้นเป็นข้อเสนอที่น่าสนใจในพื้นที่นี้

Amazon Glacier ได้รับการปรับให้เหมาะสมกับข้อมูลที่มีการเข้าถึงไม่บ่อยนักและช่วงเวลาในการค้นคืนที่เหมาะสมหลายชั่วโมง ด้วย Amazon Glacier ลูกค้าสามารถจัดเก็บข้อมูลขนาดใหญ่หรือขนาดเล็กได้อย่างน่าเชื่อถือเพียงแค่ $ 0.01 ต่อกิกะไบต์ต่อเดือนซึ่งเป็นการประหยัดที่สำคัญเมื่อเทียบกับโซลูชั่นในสถานที่


2
ค่าใช้จ่ายในการสืบค้นมีจำนวนมหาศาลอย่างมหาศาล
Tom O'Connor

2

ขั้นตอนที่หนึ่งสำรองข้อมูล: OCR เอกสารจากนั้นจัดเรียงคำทั้งหมดเป็นชุดนวนิยายเกี่ยวกับโบสถ์คาทอลิกโอปุสเดอีและเทมพลาร์ คุณควรมีข้อมูลอินพุตที่เพียงพอสำหรับนวนิยายประมาณ 10 เรื่องและประมาณปีละหนึ่งเรื่องตลอดไป รักษาตารางการค้นหาที่เก็บคำต้นฉบับในเอกสารต้นฉบับ (ตามลำดับแหล่งที่มา) และเป็นตำแหน่งสุดท้ายในนวนิยาย เก็บคำที่ซ้ำกันในหนึ่งรายการในตาราง รักษาความปลอดภัยของข้อตกลงการเผยแพร่และได้รับการตีพิมพ์นวนิยายหลายล้านเล่ม ใช้รายได้จากการขายหนังสือเพื่อให้ทุนแก่ OCR และการดำเนินการจัดเรียงคำใหม่ ทำลายเอกสารต้นฉบับและขายเป็นเครื่องนอนหนูแฮมสเตอร์ บางครั้งอาจจำเป็นต้องวางใบสั่งซื้อสำหรับการตรึงกางเขนการต่อต้านสสารหรือตั๋วเครื่องบินไปยังสถานที่แปลกใหม่หากคุณพบว่าคุณขาดคำศัพท์จากเอกสารที่คุณป้อน

ขั้นตอนที่สองการกู้คืน / การเข้าถึง: ไม่จำเป็นต้องจัดเก็บสำเนาข้อมูล - สิ่งที่คุณต้องมีคือตารางการค้นหาและร้านหนังสือมือสอง

เนื่องจากตารางการค้นหาเป็นเพียงจุดเดียวของความล้มเหลวคุณจะต้องสำรองข้อมูลนี้ ด้วยระบบการเข้ารหัสแบบ Huffman ซึ่งจะมีขนาดค่อนข้างเล็กเมื่อเทียบกับเอกสารอินพุตของคุณดังนั้นอาจคัดลอกไปยัง DVD ได้ สำหรับการสำรองข้อมูลนอกสถานที่ให้นั่งด้านหน้าล็อกไฟและอ่านตารางการค้นหาในขณะที่ถ่ายวิดีโอด้วยตัวคุณเอง วางชิ้นส่วนประสิทธิภาพวิดีโอของคุณลงบนฟิวชั่นของศิลปะและเทคโนโลยีลงใน Tate Modern Gallery บนจอแสดงผลถาวร


1

บิตเร็วเกินไปที่จะซื้อ แต่ดูเหมือนว่า HDS ได้เกิดขึ้นกับถาวรกลไกการจัดเก็บข้อมูลที่อยู่บนพื้นฐานของควอทซ์ - ใช้เวลาอ่าน


1
ฉันได้ยินมาว่าการเรียกร้องความคงทนหลายต่อหลายครั้งจนฉันไม่เคยเชื่อเลยและไม่มีพวกเราคนใดที่จะมีชีวิตอยู่ได้นานพอที่จะได้เห็นมัน การคาดคะเนความคงทนเป็นสิ่งที่ไร้ค่าอย่างแท้จริงและพิสูจน์แล้วว่าผิด
John Gardeniers

-2

ฉันต้องนำเสนอ Humyo.com (ซื้อโดย Trend Micro - ชื่อกลางของใครคือความปลอดภัย)

พวกเขาเข้ารหัสข้อมูลผู้ใช้ทั้งหมดและเซิร์ฟเวอร์ของพวกเขาตั้งอยู่ในธนาคารแห่งประเทศอังกฤษในหลุมฝังศพ

ค่อนข้างปลอดภัย :)


1
ฉันพนันได้เลยว่าพวกเขาไม่ได้อยู่ในธนาคารแห่งประเทศอังกฤษ ไม่มีที่ว่างในนั้นมันเต็มไปด้วยนายธนาคาร
Tom O'Connor

5
เทรนด์ไมโครมีชื่อกลาง bloatware ...
ทอมคอนเนอร์

ฉันเห็นด้วยกับคุณใน Trend Micro แต่พวกเขาเป็นเจ้าของเท่านั้นคุณทำงานกับซอฟต์แวร์ของ
Humyo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.