โครงการวิทยาศาสตร์ข้อมูลอธิบายทีละขั้นตอน?


10

ฉันกำลังมองหาเว็บไซต์หรือหนังสือที่มีตัวอย่างการปฏิบัติหลายขั้นตอนอธิบายวิธีการเลือกคุณสมบัติที่เกี่ยวข้องขั้นตอนการเลือกรุ่น ฯลฯ

คำตอบ:


2
  • หากคุณต้องการหนังสือที่เน้นการใช้งานลองพิจารณาการเรียนรู้ด้วยเครื่องแบบจำลองของ Christopher Bishop เขามีหนังสือทางเทคนิคที่ได้รับการยกย่องอย่างดี

  • หากคุณกำลังมองหาโค้ดจำนวนมากวิธีการเขียนโปรแกรมน่าจะเป็นและวิธีเบย์สำหรับแฮ็กเกอร์เป็นตัวเลือก

  • อีกหนังสือเบื้องต้นกับก้มสถิติมากขึ้นคือการรู้เบื้องต้นเกี่ยวกับการเรียนรู้ทางสถิติกับการประยุกต์ใช้ในการวิจัย อีกครั้งผู้แต่งมีเวอร์ชันทางเทคนิคที่เป็นที่นิยมของหนังสือเล่มนี้


1

ฉันมีคำถามเดียวกันเมื่อสองสามสัปดาห์ก่อน

ฉันเองพบว่าPythonของ O'Reilly สำหรับการวิเคราะห์ข้อมูลมีประโยชน์มากในการเรียนรู้พื้นฐาน หนังสือเล่มนี้สมมติว่าคุณมีประสบการณ์การเขียนโปรแกรมหลาม แต่ก็มีภาคผนวกอยู่ด้านหลังเพื่อให้เข้าใจพื้นฐาน

ผู้เขียนให้ตัวอย่างหลากหลายในโลกแห่งความเป็นจริง (ไม่ใช่ Monty Python) ในตอนแรกที่คุณสามารถสร้างได้ภายในสองสามบทแรกจากนั้นจะมีรายละเอียดเกี่ยวกับแต่ละสิ่งเมื่อหนังสือดำเนินไปสร้างความรู้ของคุณ

ฉันพบคำแนะนำง่าย ๆ และเป็นขั้นเป็นตอน อาจารย์ของฉันซึ่งเป็นผู้นำของฉันในทุกสิ่งนี้รู้สึกประทับใจที่ฉันเรียนรู้ได้อย่างรวดเร็ว

ฉันเคยได้ยินสิ่งดีๆเกี่ยวกับ Kaggle


1

วิทยาศาสตร์ข้อมูลในคลาวด์ด้วย Microsoft Azure Machine Learning และ Rเป็นหนังสือเรียนฟรีที่ทำงานผ่านตัวอย่างในรายละเอียดที่ยอดเยี่ยม อย่านำออกโดยเครื่องมือเฉพาะที่ใช้เพราะคุณไม่ต้องการให้พวกเขาได้รับประโยชน์จากหนังสือ

อีกสิ่งหนึ่งที่ฉันชอบคือการเขียนโปรแกรม Collective Intelligenceซึ่งมีรายละเอียดของโครงการจำนวนมากรวมถึงส่วนการขูดเว็บที่หนังสือส่วนใหญ่เกลื่อนกลาด



1

สถานที่หนึ่งที่คุณอาจพบ explainations ขั้นตอนโดยขั้นตอนบางอย่างที่น่าสนใจคือการกวดวิชา Kaggle และผู้ชนะของการสัมภาษณ์ บ่อยครั้งที่ผู้คนจะโพสต์สรุปรายละเอียดของวิธีการของพวกเขา


ลิงก์ของคุณเสีย
Pierre

@ เปียร์ - เพียงแค่แก้ไข
anthr

0

หนึ่งในหนังสือที่ดีที่สุดที่ฉันได้พบคือการเรียนรู้ด้วยเครื่องใน Pythonจาก Sebastian Raschka ตัวอย่างง่ายๆคำอธิบายทีละขั้นตอนและจำนวนคณิตศาสตร์ที่ถูกต้อง

โครงสร้างของหนังสือครอบคลุมกระบวนการทั้งหมดตั้งแต่การล้างข้อมูลไปจนถึงการประกอบและการประเมินผล


0

มองไปที่ :

https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/

นี่คือการสอนทีละขั้นตอนซึ่งจะทำให้คุณมีความคิดเกี่ยวกับกระบวนการทั้งหมดของการสำรวจข้อมูลการวิเคราะห์ข้อมูลและการสร้างแบบจำลองการทำนาย

คำอธิบายเกี่ยวกับการสำรวจข้อมูลและวิศวกรรมฟีเจอร์ (วิธีการเลือกคุณสมบัติที่เกี่ยวข้อง) อยู่ที่นี่:

https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

ดูชุดข้อมูล 5 ชุดแรกที่นี่ซึ่งมีแบบฝึกหัดและทำงานเพื่อให้ได้รับประสบการณ์การใช้งานจริง:

https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/

ยังได้ดู:

http://machinelearningmastery.com/machine-learning-in-python-step-by-step/

ที่ซึ่งเขาใช้หลายรุ่นในชุดข้อมูลเดียวซึ่งจะทำให้คุณมีความเข้าใจระดับพื้นฐานของโมเดลที่แตกต่างกัน

เพื่อความเข้าใจเพิ่มเติมเกี่ยวกับการเลือกแบบจำลองให้ดูที่:

https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection

ลิงค์ด้านบนมีคำตอบจากคนที่ทำงานในสาขานี้

ในการรับข้อมูลเชิงลึกเกี่ยวกับชุดข้อมูลที่แตกต่างกันคุณสามารถเข้าสู่ kaggle และผ่านการแข่งขันและดูชุดข้อมูลที่หลากหลายซึ่งคุณสามารถเข้าถึงรหัสของผู้คนในเมล็ดได้ ฟอรัมใน Kaggle มีประโยชน์เมื่อผู้คนพูดคุยเกี่ยวกับการใช้แบบจำลองที่แตกต่างกันสำหรับปัญหาและวิธีการของพวกเขา

https://www.kaggle.com/

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.