จะเรียนรู้วิทยาศาสตร์ข้อมูลด้วยตนเองได้อย่างไร? [ปิด]


16

ฉันเป็นนักพัฒนาเว็บที่เรียนรู้ด้วยตนเองและสนใจที่จะสอนตัวเองด้านวิทยาศาสตร์ข้อมูล แต่ฉันไม่แน่ใจว่าจะเริ่มอย่างไร โดยเฉพาะอย่างยิ่งฉันสงสัยว่า:

  1. มีสาขาใดบ้างในวิทยาศาสตร์ข้อมูล (เช่นปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง, การวิเคราะห์ข้อมูล ฯลฯ )
  2. มีคลาสเรียนออนไลน์ที่ผู้คนสามารถแนะนำได้หรือไม่?
  3. มีโปรเจ็กต์ที่ฉันสามารถฝึกฝนได้หรือไม่ (เช่นชุดข้อมูลแบบเปิด)
  4. มีใบรับรองที่ฉันสามารถสมัครหรือกรอกได้หรือไม่?

คำตอบ:


15

ยินดีต้อนรับสู่เว็บไซต์ Martin! นั่นเป็นคำถามที่ค่อนข้างกว้างดังนั้นคุณอาจจะได้คำตอบที่หลากหลาย นี่คือสิ่งที่ฉันต้องใช้

  1. วิทยาศาสตร์ข้อมูลเป็นสาขาสหวิทยาการโดยทั่วไปคิดว่าจะรวมสถิติคลาสสิกการเรียนรู้ของเครื่องและวิทยาศาสตร์คอมพิวเตอร์ (อีกครั้งนี้ขึ้นอยู่กับผู้ที่คุณถาม แต่อื่น ๆ อาจรวมถึงระบบธุรกิจอัจฉริยะที่นี่และการสร้างภาพข้อมูลบทความวิกิพีเดียด้านวิทยาศาสตร์ข้อมูล ) นักวิทยาศาสตร์ข้อมูลที่ดียังมีทักษะในการเลือกคุณลักษณะเฉพาะของโดเมนที่ใช้งานได้เช่นกัน ตัวอย่างเช่นนักวิทยาศาสตร์ข้อมูลที่ทำงานเกี่ยวกับการวิเคราะห์ประวัติโรงพยาบาลมีประสิทธิภาพมากขึ้นหากพวกเขามีพื้นฐานด้านสารสนเทศชีวการแพทย์
  2. มีตัวเลือกมากมายขึ้นอยู่กับประเภทของการวิเคราะห์ที่คุณสนใจหลักสูตรหลักสูตรของ Andrew Ng เป็นทรัพยากรแรกที่กล่าวถึงมากที่สุดและถูกต้อง หากคุณสนใจในการเรียนรู้ของเครื่องนั่นเป็นจุดเริ่มต้นที่ยอดเยี่ยม หากคุณต้องการสำรวจเชิงลึกเกี่ยวกับคณิตศาสตร์องค์ประกอบของการเรียนรู้ทางสถิติของ Tibshiraniนั้นยอดเยี่ยม แต่เป็นข้อความขั้นสูง มีหลักสูตรออนไลน์หลายหลักสูตรที่เปิดสอนนอกเหนือจากหลักสูตรของ Ng แต่คุณควรเลือกหลักสูตรเหล่านี้ด้วยประเภทของการวิเคราะห์ที่คุณต้องการมุ่งเน้นและ / หรือโดเมนที่คุณวางแผนจะทำงาน
  3. Kaggle เริ่มด้วย kaggle หากคุณต้องการดำน้ำในปัญหาการวิเคราะห์ในโลกแห่งความจริง ขึ้นอยู่กับระดับความเชี่ยวชาญของคุณมันอาจเป็นการดีที่จะเริ่มต้นใช้งานที่เรียบง่าย Project Eulerเป็นทรัพยากรที่ยอดเยี่ยมสำหรับปัญหาการฝึกฝนแบบใช้ครั้งเดียวที่ฉันยังคงใช้เป็นงานการอุ่นเครื่อง
  4. สิ่งนี้อาจขึ้นอยู่กับโดเมนที่คุณต้องการทำงานอย่างไรก็ตามฉันรู้ว่า Coursera เสนอใบรับรองวิทยาศาสตร์ข้อมูลหากคุณเรียนจบหลักสูตรที่เกี่ยวข้องกับวิทยาศาสตร์ข้อมูล นี่อาจเป็นจุดเริ่มต้นที่ดี

โชคดี! หากคุณมีคำถามเฉพาะอื่น ๆ อย่าลังเลที่จะถามฉันในความคิดเห็นและฉันจะทำอย่างดีที่สุดเพื่อช่วย!


1
กลับมาที่นี้แน่นอนแอนดรูอึ้งของเป็นอย่างหนัก ฉันควรจะพูดถึงว่าฉันไม่เก่งคณิตศาสตร์ ฉันได้ยินมาว่าหลักสูตรข้อมูลวิทยาศาสตร์อื่น ๆนั้นง่ายกว่าสำหรับการเรียนรู้เชือก คุณคิดอย่างไร?
Martin

5

ฉันเป็นนักวิทยาศาสตร์ข้อมูลที่เรียนรู้ด้วยตนเองและฉันจะพยายามอย่างดีที่สุดเพื่ออธิบายให้คุณรู้ว่าควรทำอย่างไร


มีสาขาใดบ้างในวิทยาศาสตร์ข้อมูล (เช่นปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง, การวิเคราะห์ข้อมูล ฯลฯ )

Data Science เป็นโดเมนที่กว้างมาก มันเกี่ยวกับศาสตร์แห่งข้อมูล ดังนั้นเขตข้อมูลใด ๆ ที่ใช้ข้อมูลในการตัดสินใจอยู่ภายใต้โดเมนนี้ บางฟิลด์ประกอบด้วย:

  • AI
  • การจดจำรูปแบบและการวิเคราะห์
  • Bio-สถิติ
  • การเรียนรู้เชิงสถิติ
  • การเรียนรู้ของเครื่อง
  • Data Aesthetics (หรือการเปิดเผยข้อมูล)
  • ข้อมูลวารสารศาสตร์

มีคลาสเรียนออนไลน์ที่ผู้คนสามารถแนะนำได้หรือไม่?

ผมได้ตอบคำถามที่คล้ายกัน ดังนั้นฉันจะพูดได้ที่นี่:

เริ่มต้นด้วยหลักสูตรการเรียนรู้ของเครื่อง Coursera มันทำงานได้ดีมากในการแนะนำนักเรียนให้รู้จักโดเมนของ Machine Learning และช่วยให้คุณวางรากฐานที่มั่นคงในแนวคิด

ในกรณีที่คุณรู้สึกว่าวิชาคณิตศาสตร์นั้นมีความโง่เขลาเล็กน้อยในหลักสูตรนั้นคุณสามารถเรียนหลักสูตรนี้สอนโดยอาจารย์คนเดียวกันและมีความเข้มข้นทางคณิตศาสตร์มากกว่าในอดีต

ตอนนี้คุณจะมีสัญชาตญาณที่ชัดเจนเกี่ยวกับแนวคิดพื้นฐานของการเรียนรู้ของเครื่อง ตอนนี้ใช้หลักสูตรนี้ซึ่งสามารถพูดได้ว่าเป็นการติดตามหรือเสริมสำหรับหลักสูตรของ Andrew Ng

ทรัพยากรนี้จาก IAPRนี้มีหมายเหตุเชิงลึกเกี่ยวกับแนวคิด ML จำนวนมากเช่นการตรวจสอบข้ามการกำหนดมาตรฐานและอื่น ๆ

นอกจากนี้คุณยังสามารถดูรายการทรัพยากรที่น่าอัศจรรย์เหล่านี้ที่ รวบรวมไว้ในบล็อกบน Quora

ตอนนี้สำหรับการดำน้ำในแนวคิดขั้นสูงของเครือข่ายประสาทและการเรียนรู้ลึกคุณสามารถใช้ประโยชน์จากหนังสือฟรีเล่มนี้

ในที่สุด e-book ฟรี: องค์ประกอบของการเรียนรู้ทางสถิติเป็นหนังสือที่ยอดเยี่ยมสำหรับผู้เริ่มต้นใน ML หรือการเรียนรู้ทางสถิติ

ฉันยังตรวจสอบที่เก็บข้อมูลอ้างอิงวิทยาศาสตร์ข้อมูลโดย Quoraด้วย


มีโปรเจ็กต์ที่ฉันสามารถฝึกฝนได้หรือไม่ (เช่นชุดข้อมูลแบบเปิด)

ฉันเริ่มทำโครงการด้วยชุดข้อมูลเปิดของอินเดีย อย่างไรก็ตามฉันขอแนะนำให้คุณตรวจสอบการสนทนาที่น่าตื่นตาตื่นใจนี้ที่นี่และหลังจากทำโครงการเหล่านั้นคุณสามารถเริ่มต้นด้วย Kaggle


มีใบรับรองที่ฉันสามารถสมัครหรือกรอกได้หรือไม่?

ในความคิดของฉันไม่มีข้อมูลรับรองวิทยาศาสตร์ใด ๆ ใช่มีการรับรอง Big Data จำนวนมากอยู่ที่นั่น แต่ฉันไม่เห็นว่ามันมีประโยชน์สำหรับนักวิทยาศาสตร์ด้านข้อมูลรุ่นดังนั้นฉันขอแนะนำให้คุณอย่าไล่พวกเขาอย่างน้อยก็จนกว่าคุณจะมั่นใจเพียงพอกับ ML และทักษะด้านข้อมูลของคุณ


1

ฉันขอแนะนำให้เริ่มต้นจากความเชี่ยวชาญพิเศษของ Coursera ในศาสตร์ข้อมูล ความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลโดย Johns Hopkins เป็นความเชี่ยวชาญด้านการรันที่เก่าแก่ที่สุด ฉันไม่แนะนำหนังสือและ kaggle พวกเขาเท่านั้นที่ทำให้คุณสับสนในการเริ่มต้น โปรดทราบว่าการเขียนโค้ดเป็นส่วนที่ง่ายที่สุดของวิทยาศาสตร์ข้อมูลและคุณต้องเรียนรู้มากมาย สำหรับการทำความเข้าใจเกี่ยวกับฟิลด์Venn Diagramนี้เป็นการเริ่มต้นที่ดี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.