โครงสร้างโครงการโครงงานการเรียนรู้เครื่องหลาม / วิทยาศาสตร์ข้อมูล


10

ฉันกำลังมองหาข้อมูลเกี่ยวกับวิธีการจัดโครงการการเรียนรู้ของเครื่องหลาม สำหรับงูหลามโครงการปกติมีcookiecutterและ R ProjectTemplate

นี่คือโครงสร้างโฟลเดอร์ปัจจุบันของฉัน แต่ฉันกำลังผสม Jupyter Notebooks กับรหัส Python จริง ๆ และดูเหมือนจะไม่ชัดเจน

.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools

ฉันทำงานในโฟลเดอร์สคริปต์และปัจจุบันเพิ่มฟังก์ชั่นทั้งหมดในไฟล์ภายใต้ my_module แต่นั่นทำให้เกิดข้อผิดพลาดในการโหลดข้อมูล (สัมพัทธ์ / พา ธ สัมบูรณ์) และปัญหาอื่น ๆ

ฉันไม่สามารถหาแนวทางปฏิบัติที่เหมาะสมหรือตัวอย่างที่ดีในหัวข้อนี้นอกเหนือจากโซลูชันการแข่งขัน kaggle และโน้ตบุ๊คบางรุ่นที่มีฟังก์ชั่นทั้งหมดย่อในตอนเริ่มต้นของโน้ตบุ๊กดังกล่าว


ดูว่าสิ่งนี้ช่วยได้หรือไม่ (ไม่มีประสบการณ์ส่วนตัว)
Emre

คำตอบ:


4

ฉันไม่คิดว่ามีแนวทางปฏิบัติที่ดีที่สุดในพื้นที่ที่กำลังพัฒนานี้ แต่นอกเหนือจาก cookiecutter มีแนวคิดที่น่าสนใจแสดงในการสอนในการประชุม SciPy 2016: http://isaacslavitt.com/2016/07/20/ ข้อมูลทางวิทยาศาสตร์ที่เป็นซอฟแวร์พูดคุย /

โดยส่วนตัวแล้วฉันพยายามลดจำนวนโฟลเดอร์ย่อยในโครงการเว้นแต่ว่าฉันมีวิธีที่ดีมากในการแยกแยะพวกเขาและมีเหตุผลที่ดีที่จะแยกพวกเขาออกจากกัน องค์กรที่ไม่ดีเกือบจะไม่ดีเท่าที่ไม่มีในองค์กร ฉันคิดว่าวิธีปฏิบัติที่ดีที่สุดอาจขึ้นอยู่กับกรณีการใช้งาน - ไม่ใช่ทุกโครงการที่ต้องใช้จำนวนสำเร็จรูปที่เท่ากัน


3

มหาวิทยาลัยวอชิงตันได้เปิดตัวแม่แบบโครงการสำหรับโครงการขนาดเล็กทางวิทยาศาสตร์หลาม (รวมถึงโครงงานวิทยาศาสตร์ข้อมูล) shablonaที่เรียกว่า นั่นคือสิ่งที่คุณต้องการมากขึ้นหรือน้อยลง?

https://github.com/uwescience/shablona

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.