ตัวเลือกการโฮสต์สำหรับข้อมูลที่เปิดเผยต่อสาธารณะ


12

ดังนั้นคุณตัดสินใจที่จะสนับสนุนแนวคิดของการวิจัยที่ทำซ้ำได้และต้องการทำให้ข้อมูลของคุณพร้อมใช้งานออนไลน์เพื่อให้ผู้คนเห็นและใช้งาน คำถามคือคุณโฮสต์ที่ไหน

ความชอบครั้งแรกของฉันคือแน่นอนพื้นที่เว็บส่วนตัวที่ฉันมีบนเซิร์ฟเวอร์มหาวิทยาลัย แต่สิ่งเหล่านี้ไม่ได้มีอยู่จริง - ถ้าฉันออกไปไดเรกทอรีจะยังคงเปิดอยู่ในช่วงเวลาสั้น ๆ ก่อนที่มันจะหายไป แทบจะไม่มีการตั้งค่าที่เหมาะสมสำหรับการทำให้ข้อมูลพร้อมใช้งานสำหรับผู้ใช้และทำงานในอนาคต

คุณใช้สิ่งที่ชอบ GitHub หรือ SourceForge? หรือบริการอื่น ๆ ?

ข้อมูลที่เป็นปัญหาคือผลลัพธ์ของการจำลองที่น่าสนใจแคบมาก - ดังนั้นฉันไม่คิดว่าจะมีบางอย่างเช่น InfoChimps หรือที่เก็บข้อมูลสาธารณะอีกแห่งหนึ่งที่เหมาะสำหรับมัน นี่คือน้อย "คุณสามารถเรียนรู้สิ่งต่าง ๆ ด้วยรหัสนี้!" และอื่น ๆ "คุณสามารถทำซ้ำรูปที่ 3 ในเอกสารนี้"


1
เกี่ยวข้องอาจซ้ำกัน: stats.stackexchange.com/questions/10045/…
Matt Parker

1
มีความเกี่ยวข้องอย่างยิ่ง - การเพิ่มรายละเอียดบางอย่างที่แนะนำว่าทำไมฉันไม่คิดว่ามันซ้ำซ้อน
Fomite

@EpiGrad: คุณมีความคิดแบบไหน? หากเป็นซอร์สโค้ดที่เกี่ยวข้องกับโครงการวิจัยของคุณคุณสามารถแนบไปกับเอกสารพิมพ์arXivของคุณได้
Piotr Migdal

@PiotrMigdal เป็นการดีที่ฉันต้องการข้อมูลที่สามารถออกไปเที่ยวเป็นเวลาหลายปีนานพอสำหรับการเผยแพร่กระดาษอ้างอิงตามปกติและอื่น ๆ ฉันจะแนบไปกับการพิมพ์arXivถ้าเฉพาะสาขาของฉันใช้มัน)
Fomite

@EpiGrad แล้วบางทีสถานที่ที่ดีที่จะค้นหาข้อมูลเปิดเป็นแง่มุมของวิทยาศาสตร์เปิด - การmichaelnielsen.org/blog/open-science
Piotr Migdal

คำตอบ:


4

ทางเลือกหนึ่งที่ง่ายคือGitHub

ฉันใช้บิตเพื่อแบ่งปันข้อมูลและรหัสการวิเคราะห์ข้อมูล ตัวอย่างที่ดีของการแบ่งปันรหัสและข้อมูลอื่น ๆ บนเว็บไซต์มีอยู่ในคำถามนี้

ประโยชน์ของ GitHub

  • ง่ายต่อการอัพโหลดเมื่อคุณคุ้นเคยกับ git และทำไมไม่ใช้ git สำหรับความต้องการในการควบคุมเวอร์ชันของคุณ
  • คุณสามารถใช้จิสต์สำหรับไฟล์เดี่ยวอย่างง่าย
  • เป็นเรื่องง่ายสำหรับผู้อื่นในการดาวน์โหลดไฟล์เดียวหรือหลายไฟล์เป็นไฟล์เก็บถาวร
  • มีพื้นที่เก็บข้อมูลฟรีเพียงพอ
  • ซอร์สโค้ดสามารถเรียกดูได้บนอินเทอร์เน็ต
  • และอื่น ๆ...

แน่นอน GitHub ไม่เหมาะสำหรับข้อมูล ฉันสามารถเห็นข้อดีของการใช้ที่เก็บข้อมูลถาวรของสถาบันหรือเครื่องมือเฉพาะอื่น ๆ สำหรับการเก็บถาวรที่รุนแรงยิ่งขึ้น


1
นี่เป็นทางออกที่ฉันได้ไปด้วย ส่วนหนึ่งของปัญหาเกี่ยวกับที่เก็บข้อมูลของสถาบันคือสิ่งที่สถาบันฉันกำลังตกอยู่ในสภาพคล่องและข้อมูลไม่สำคัญพอสำหรับคลังข้อมูลขนาดใหญ่แห่งใดแห่งหนึ่ง
Fomite

4

ตัวเลือกอื่นน่าจะเป็นDataverseซึ่งมีให้บริการในรูปแบบของซอฟต์แวร์และเป็นโอเพ่นซอร์ส ฉันไม่ได้ลองเลย


2

ความเป็นไปได้ทางหนึ่งสำหรับผู้ที่อยู่ในมหาวิทยาลัยคือการใช้พื้นที่เก็บข้อมูลดิจิทัลของมหาวิทยาลัยซึ่งโฮสต์โดยห้องสมุดวิทยาเขต (สำหรับฉันเป็นโลจิคัลโลคัสสำหรับชุดข้อมูลที่มาพร้อมสิ่งพิมพ์

ที่เก็บดิจิตอลที่เป็นที่นิยม (ฟรี) คือDSpaceซึ่งในความเข้าใจของฉันสามารถโฮสต์ชุดข้อมูลได้ แต่นี่เป็นบริการที่คนในสถาบันของคุณต้องเป็นเจ้าภาพ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.