การควบคุม R และเวอร์ชั่นสำหรับนักวิเคราะห์ข้อมูลเดี่ยว
นักวิเคราะห์ข้อมูลหลายคนที่ฉันเคารพใช้การควบคุมเวอร์ชัน ตัวอย่างเช่น: http://github.com/hadley/ ดูความคิดเห็นในhttp://permut.wordpress.com/2010/04/21/revision-control-statistics-bleg/ อย่างไรก็ตามฉันกำลังประเมินว่าการใช้ระบบควบคุมเวอร์ชันเช่น git จะคุ้มค่าหรือไม่ ภาพรวมโดยย่อ: ฉันเป็นนักวิทยาศาสตร์สังคมที่ใช้ R เพื่อวิเคราะห์ข้อมูลสำหรับงานวิจัย ปัจจุบันฉันไม่ได้ผลิตแพ็คเกจ R โดยทั่วไปรหัส R ของฉันสำหรับโครงการจะมีโค้ดสองสามพันบรรทัดสำหรับการป้อนข้อมูลการทำความสะอาดการจัดการการวิเคราะห์และการสร้างผลลัพธ์ โดยทั่วไปแล้วสิ่งพิมพ์จะเขียนด้วย LaTeX สำหรับการควบคุมเวอร์ชันมีประโยชน์มากมายที่ฉันได้อ่าน แต่พวกเขาดูเหมือนจะไม่ค่อยเกี่ยวข้องกับนักวิเคราะห์ข้อมูลเดี่ยว สำรองข้อมูล:ฉันมีระบบสำรองข้อมูลอยู่แล้ว การแยกและกรอกลับ:ฉันไม่เคยรู้สึกว่าจำเป็นต้องทำเช่นนี้ แต่ฉันสามารถดูว่ามันจะมีประโยชน์อย่างไร (เช่นคุณกำลังเตรียมบทความวารสารหลายบทความตามชุดข้อมูลเดียวกันคุณกำลังเตรียมรายงานที่อัพเดตรายเดือน ฯลฯ ) การทำงานร่วมกัน:ส่วนใหญ่เวลาที่ฉันวิเคราะห์ข้อมูลด้วยตัวเองดังนั้นฉันจะไม่ได้รับประโยชน์จากการทำงานร่วมกันของการควบคุมเวอร์ชัน นอกจากนี้ยังมีค่าใช้จ่ายที่อาจเกิดขึ้นหลายอย่างที่เกี่ยวข้องกับการใช้การควบคุมเวอร์ชัน: ใช้เวลาในการประเมินและเรียนรู้ระบบควบคุมเวอร์ชัน ความซับซ้อนที่เพิ่มขึ้นในระบบการจัดการไฟล์ปัจจุบันของฉัน อย่างไรก็ตามฉันยังรู้สึกว่าฉันขาดอะไรไป คำแนะนำทั่วไปเกี่ยวกับการควบคุมเวอร์ชันดูเหมือนว่าจะมีการกล่าวถึงต่อนักวิทยาศาสตร์คอมพิวเตอร์มากกว่านักวิเคราะห์ข้อมูล ดังนั้นโดยเฉพาะเกี่ยวกับนักวิเคราะห์ข้อมูลในสถานการณ์ที่คล้ายกับที่ระบุไว้ข้างต้น: การควบคุมเวอร์ชันคุ้มค่ากับความพยายามหรือไม่? ข้อดีและข้อเสียของการใช้การควบคุมเวอร์ชันคืออะไร กลยุทธ์ที่ดีในการเริ่มต้นด้วยการควบคุมเวอร์ชันสำหรับการวิเคราะห์ข้อมูลด้วย R คืออะไร (ตัวอย่างเช่นแนวคิดเวิร์กโฟลว์ซอฟต์แวร์ลิงก์ไปยังคู่มือ)