ฉันเป็นนักศึกษาปริญญาเอกสาขาธรณีฟิสิกส์และทำงานกับข้อมูลภาพจำนวนมาก (หลายร้อย GB, ไฟล์นับหมื่น) ฉันรู้svn
และgit
ค่อนข้างดีและให้คุณค่ากับประวัติโครงการรวมกับความสามารถในการทำงานร่วมกันได้อย่างง่ายดายและมีการป้องกันความเสียหายของดิสก์ ฉันพบว่าgit
มีประโยชน์อย่างมากสำหรับการสำรองข้อมูลที่สอดคล้องกัน แต่ฉันรู้ว่า git ไม่สามารถจัดการข้อมูลไบนารีจำนวนมากได้อย่างมีประสิทธิภาพ
ในการศึกษาระดับปริญญาโทของฉันฉันทำงานกับชุดข้อมูลที่มีขนาดใกล้เคียงกัน (รวมถึงรูปภาพ) และมีปัญหามากมายในการติดตามเวอร์ชันต่าง ๆ บนเซิร์ฟเวอร์ / อุปกรณ์ที่แตกต่างกัน การกระจาย 100GB ผ่านเครือข่ายไม่สนุกและทำให้ฉันเสียเวลาและความพยายาม
ฉันรู้ว่าคนอื่น ๆ ในสาขาวิทยาศาสตร์ดูเหมือนจะมีปัญหาคล้ายกัน แต่ฉันไม่สามารถหาทางออกที่ดีได้
ฉันต้องการใช้สิ่งอำนวยความสะดวกในการจัดเก็บของสถาบันของฉันดังนั้นฉันต้องการสิ่งที่สามารถใช้เซิร์ฟเวอร์ "โง่" ฉันยังต้องการสำรองข้อมูลเพิ่มเติมในฮาร์ดดิสก์แบบพกพาเพราะฉันต้องการหลีกเลี่ยงการถ่ายโอนหลายร้อย GB ผ่านเครือข่ายทุกที่ที่ทำได้ ดังนั้นฉันต้องการเครื่องมือที่สามารถจัดการมากกว่าหนึ่งตำแหน่งระยะไกล
สุดท้ายฉันต้องการสิ่งที่นักวิจัยคนอื่นสามารถใช้ได้ดังนั้นมันไม่จำเป็นต้องง่ายสุด ๆ แต่ควรจะเรียนรู้ได้ในเวลาไม่กี่ชั่วโมง
ฉันได้ประเมินโซลูชั่นที่แตกต่างกันมากมาย แต่ดูเหมือนว่าไม่มีใครเหมาะสมกับค่าใช้จ่าย:
- svnค่อนข้างไม่มีประสิทธิภาพและต้องการสมาร์ทเซิร์ฟเวอร์
- hg bigfile / largefileสามารถใช้รีโมตเดียวได้
- git bigfile / mediaสามารถใช้รีโมตเดียวได้ แต่ก็ไม่ได้มีประสิทธิภาพมากนัก
- ห้องใต้หลังคาดูเหมือนจะไม่มีบันทึกหรือความสามารถที่แตกต่างกัน
- bupดูดีมาก แต่ต้องการเซิร์ฟเวอร์ "สมาร์ท" ให้ใช้งานได้
ฉันได้ลองgit-annex
แล้วซึ่งทำทุกอย่างที่ฉันต้องการเพื่อทำ (และอื่น ๆ อีกมากมาย) แต่มันยากมากที่จะใช้และไม่มีเอกสารที่ดี ฉันใช้มันหลายวันและไม่สามารถไปรอบ ๆ มันได้ดังนั้นฉันสงสัยว่าเพื่อนร่วมงานคนอื่นจะสนใจ
นักวิจัยจัดการกับชุดข้อมูลขนาดใหญ่ได้อย่างไรและกลุ่มการวิจัยอื่น ๆ ใช้งานอย่างไร
เพื่อความชัดเจนฉันสนใจในวิธีการที่นักวิจัยคนอื่นจัดการกับสถานการณ์นี้ไม่ใช่เฉพาะชุดข้อมูลนี้ ดูเหมือนว่าฉันเกือบทุกคนควรมีปัญหานี้ แต่ฉันไม่รู้จักใครที่ได้แก้ปัญหาแล้ว ฉันควรสำรองข้อมูลดั้งเดิมไว้และลืมทุกสิ่งที่ควบคุมเวอร์ชันนี้หรือไม่? นั่นคือสิ่งที่คนอื่นกำลังทำอยู่?