ฉันต้องการเรียนรู้เกี่ยวกับทฤษฎีความน่าจะเป็นทฤษฎีการวัดและการเรียนรู้ของเครื่องจักรในที่สุด ฉันจะเริ่มที่ไหน [ปิด]


9

ฉันต้องการเรียนรู้เกี่ยวกับทฤษฎีความน่าจะเป็นทฤษฎีการวัดและการเรียนรู้ของเครื่องจักรในที่สุด เป้าหมายสูงสุดของฉันคือการใช้การเรียนรู้ของเครื่องในซอฟต์แวร์

ฉันศึกษาแคลคูลัสและความน่าจะเป็นพื้นฐานในวิทยาลัย แต่มันก็สวยมาก คุณรู้หลักสูตรออนไลน์หรือหนังสือบางเล่มที่ฉันสามารถใช้เพื่อเรียนรู้เกี่ยวกับวิชาเหล่านี้ ฉันพบแหล่งข้อมูลมากมายบนเว็บ แต่พวกเขาดูเหมือนจะกำหนดเป้าหมายไปยังผู้ชมที่มีความเชี่ยวชาญ ฉันรู้ว่ามันต้องใช้เวลาพอสมควร แต่ฉันจะเริ่มได้ที่ไหนถ้าฉันต้องการเรียนรู้ตั้งแต่ต้น?



2
คำถามสามข้อนี้ดูเหมือนจะครอบคลุมไปด้วยข้อมูลที่ซ้ำกันที่ระบุโดย @General
whuber

คำตอบ:


13

ฉันคิดว่ามีการอ้างอิงที่ดีและเป็นที่นิยมอยู่สองประการสำหรับคุณ (ฉันเริ่มต้นด้วยสิ่งเหล่านี้รวมถึงมีภูมิหลังของอาจารย์ในสาขาวิทยาศาสตร์คณิตศาสตร์ประกันภัย):

  1. แนะนำการเรียนรู้เชิงสถิติ (พร้อมใบสมัครใน R) โดย Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani มันสามารถใช้ได้อย่างอิสระบนเว็บไซต์ที่ครอบคลุมสวยและง่ายต่อการเข้าใจกับตัวอย่าง pratical คุณสามารถเริ่มเรียนรู้หลาย ๆ อย่างแม้จะไม่มีพื้นฐานทางสถิติที่แข็งแกร่งมากการอ้างอิงนี้เหมาะสำหรับโปรไฟล์หลาย ๆ แบบและมีอัลกอริทึมยอดนิยมจำนวนมากพร้อมกับการนำไปใช้ใน R โดยไม่ต้องลึกเข้าไปในรายละเอียดทางคณิตศาสตร์

  2. องค์ประกอบของการเรียนรู้ทางสถิติโดยเทรเวอร์ Hastie, โรเบิร์ตทิบชิรา นี , เจอโรมฟรีดแมน เมื่อเปรียบเทียบกับหนังสือเล่มแรกหนังสือเล่มนี้จะเจาะลึกลงไปในแง่มุมทางคณิตศาสตร์หากคุณต้องการสำรวจเพิ่มเติมเกี่ยวกับอัลกอริทึมเฉพาะที่คุณพบว่ามีประโยชน์สำหรับคุณ ( ฟรีเช่นกัน)

และแน่นอนการตรวจสอบข้ามเป็นหนึ่งในแหล่งที่ดีที่สุดที่คุณสามารถเรียนรู้หลายสิ่งสำหรับฉัน: การปฏิบัติที่ดีที่สุดความเข้าใจผิดทางสถิติและการใช้ผิดวิธีและอื่น ๆ อีกมากมาย หลังจากเรียนหลายปีที่โรงเรียน / มหาวิทยาลัยรวมถึงการเรียนรู้เรื่อง seft ฉันพบว่าการเรียนรู้ของฉันนั้น จำกัด เกินไปเมื่อฉันไป Cross Validated เป็นครั้งแรก ฉันไปที่นี่ทุกวันตั้งแต่ครั้งแรกและเรียนรู้มากมาย


3
หากคุณชอบเอกสารอ้างอิงเหล่านี้อย่าลืมติดตามหลักสูตรออนไลน์ของ Stanford T. Hastie และ R. Tibshirani มักให้หลักสูตรที่เกี่ยวข้องกับการเรียนรู้ของเครื่อง
Marcel10

ฉันได้อ่านประมาณ 20% ของการเรียนรู้เชิงสถิติเบื้องต้นเกี่ยวกับแอปพลิเคชันในอาร์นี่คือสิ่งที่ฉันกำลังมองหา หนังสือที่ยอดเยี่ยมและเข้าใจง่าย ขอบคุณมาก! :)
สูงสุด

6

ต่อไปนี้เป็นหลักสูตรออนไลน์ฟรีสองสามข้อที่เราขอแนะนำ:

  • http://projects.iq.harvard.edu/stat110/home (ขึ้นอยู่กับความสะดวกสบายในปัจจุบันของคุณกับทฤษฎีความน่าจะเป็นหลักสูตรของ Blitzstein ได้รับความนิยมอย่างมากที่ Harvard แม้กระทั่งสำหรับผู้ที่ไม่ได้อยู่ในสถานะ / ความน่าจะเป็นฉันได้ดู การบรรยายเล็ก ๆ น้อย ๆ สำหรับการตรวจสอบของฉันเองและพบว่าพวกเขามีประโยชน์มาก)
  • https://www.coursera.org/learn/machine-learning (นี่เป็นเวอร์ชันปัจจุบันของหนึ่งในหลักสูตรออนไลน์ครั้งใหญ่ครั้งแรกของ Stanford โดย Andrew Ng ผู้ซึ่งจบลงด้วยการร่วมก่อตั้ง Coursera ฉันตั้งใจจะเรียนหลักสูตรนี้ แต่ไม่มีเวลา)

5

คุณไม่จำเป็นต้องมีทฤษฎีการวัด นักคณิตศาสตร์ใช้ทฤษฎีการวัดเพื่อปรับวิธีการทางคณิตศาสตร์อื่น ๆ เช่นการ จำกัด ขอบเขตของการประมาณอินทิกรัล วิศวกรส่วนใหญ่จะไม่ได้ศึกษาทฤษฎีการวัดพวกเขาเพียงแค่ใช้ผลลัพธ์ ความรู้ทางคณิตศาสตร์ที่จำเป็นสำหรับ ML นั้นมีลักษณะคร่าวๆโดยสามารถรวม Gaussian หลายตัวแปร - ถ้าคุณมั่นใจเกี่ยวกับสิ่งนั้นคุณอาจมีแคลคูลัสหลายตัวแปร, พีชคณิตเชิงเส้นและทฤษฎีความน่าจะเป็นที่จำเป็น

ฉันจะแนะนำ Think Stats โดย Allen Downey - ซึ่งมีวัตถุประสงค์เพื่อสอนความน่าจะเป็น / สถิติให้แก่โปรแกรมเมอร์ แนวคิดคือการยกระดับความเชี่ยวชาญด้านการเขียนโปรแกรมเพื่อทำแบบจำลองดังนั้นจึงเข้าใจทฤษฎีความน่าจะเป็น / วิธีการทางสถิติ บล็อก allen downey (เขาเขียนคนอื่น ๆ ) คิดว่าสถิติ (ฟรี) pdf )


4
ทฤษฎีการวัดมีประโยชน์ในกระบวนการสุ่มเวลาต่อเนื่อง ในความเป็นจริงกระดาษทุกชิ้นในการเงินเวลาต่อเนื่อง (การกำหนดราคาสินทรัพย์) เริ่มต้นด้วยคำอธิษฐานต่อไปนี้(F,Ω,P)
Aksakal

@ Aksakal ไม่เพียง แต่กระบวนการต่อเนื่องในความคิดของฉัน!
Metariat

5

เนื่องจากคุณสนใจการเรียนรู้ของเครื่องจักรฉันจะข้ามความน่าจะเป็นและการยืนและกระโดดเข้าสู่ ML หลักสูตรของ Andrew Ng เป็นจุดเริ่มต้นที่ดี คุณสามารถทำมันให้เสร็จภายในสองสัปดาห์

เล่นกับสิ่งที่คุณเรียนรู้มาสองสามสัปดาห์จากนั้นกลับไปที่รากและศึกษาความน่าจะเป็น หากคุณเป็นวิศวกรฉันก็งงกับวิธีที่คุณจะข้ามไปเรียนที่วิทยาลัย มันเคยเป็นวิชาบังคับในสาขาวิศวกรรม ทั้งนี้คุณสามารถจับขึ้นโดยการ MIT OCW แน่นอนที่นี่

ฉันไม่คิดว่าคุณต้องการทฤษฎีการวัด ไม่มีใครต้องการทฤษฎีการวัด ผู้ที่ทำเช่นนั้นพวกเขาจะไม่มาที่นี่เพื่อถามเพราะที่ปรึกษาของพวกเขาจะบอกพวกเขาว่าควรเรียนหลักสูตรใด หากคุณไม่มีที่ปรึกษาคุณก็ไม่จำเป็นต้องใช้มันแน่นอน ซ้ำซาก แต่จริง

สิ่งที่มีทฤษฎีการวัดคือคุณไม่สามารถเรียนรู้ได้โดย "การอ่านง่าย" คุณต้องทำแบบฝึกหัดและปัญหาโดยพื้นฐานแล้วทำได้ยาก นั่นเป็นไปไม่ได้จริงนอกห้องในความคิดของฉัน ทางเลือกที่ดีที่สุดที่นี่คือเข้าเรียนที่วิทยาลัยท้องถิ่นหากพวกเขาเสนอเช่นนี้ บางครั้งหลักสูตรความน่าจะเป็นระดับปริญญาเอกจะทำการวัดและความน่าจะเป็นในชั้นหนึ่งซึ่งน่าจะเป็นข้อตกลงที่ดีที่สุด ฉันจะไม่แนะนำให้เรียนวิชาทฤษฎีการวัดที่บริสุทธิ์ในแผนกคณิตศาสตร์เว้นแต่คุณจะต้องการทรมานตัวเองอย่างแท้จริงแม้ว่าในท้ายที่สุดคุณจะพึงพอใจอย่างมาก


2

สำหรับการเรียนรู้ของเครื่องจักรฉันคิดว่าการเรียนรู้ของเครื่อง: ศิลปะและวิทยาศาสตร์ของอัลกอริทึมที่ทำให้การรับรู้ข้อมูลโดย Peter Flach สามารถเป็นทรัพยากรที่ดีในการเริ่มต้น มันให้การแนะนำทั่วไปเกี่ยวกับการเรียนรู้ของเครื่องด้วยตัวอย่างที่ใช้งานง่ายและเหมาะสำหรับผู้เริ่มต้น ฉันชอบหนังสือเล่มนี้โดยเฉพาะอย่างยิ่งเนื่องจากบทสุดท้ายซึ่งเกี่ยวข้องกับการเรียนรู้ด้วยเครื่อง ในขณะที่เรียนรู้เกี่ยวกับการเรียนรู้ของเครื่องการทำความรู้จักกับโมเดลที่แตกต่างนั้นไม่เพียงพอและเราควรจะสามารถเปรียบเทียบอัลกอริทึมการเรียนรู้ของเครื่องที่แตกต่างกัน ฉันคิดว่าหนังสือเล่มนี้ทำให้ง่ายต่อการเข้าใจวิธีเปรียบเทียบอัลกอริทึมเหล่านั้น สไลด์การบรรยายสามารถพบได้ที่นี่


2

เพื่อเพิ่มคำแนะนำที่ดีเยี่ยมข้างต้นฉันจะบอกว่าถ้าคุณสนใจที่จะเข้าใจแนวคิดพื้นฐานเพิ่มเติมเกี่ยวกับความน่าจะเป็นและสถิติ "จากอัลกอริทึมถึง Z-Scores: ความน่าจะเป็นคอมพิวเตอร์ในสถิติ" เป็นไพรเมอร์ที่ยอดเยี่ยมสำหรับการใช้คอมพิวเตอร์ เข้าใจแนวคิดที่สำคัญที่สุดสำหรับผู้เริ่มต้น / กลางในทฤษฎีความน่าจะเป็นและกระบวนการสุ่ม ฉันจะสองด้วยเช่น "การแนะนำการเรียนรู้เชิงสถิติ" หรือ "องค์ประกอบของการเรียนรู้ทางสถิติ" (ESL) เพื่อเป็นการแนะนำการเรียนรู้ของเครื่อง (ML) ฉันคิดว่า ESL โดยเฉพาะนั้นน่าทึ่ง แต่มันก็ต้องใช้ความคิดทางคณิตศาสตร์ที่หนักหนากว่าแนวคิด ML ดังนั้นหากคุณพิจารณาตัวเองว่า "โอเค" ที่สถิติคุณอาจต้องการอ่านเมื่อคุณได้รับมากขึ้น ประสบการณ์กับ ML

หากคุณสนใจในการเรียนรู้ของเครื่องเพื่อประโยชน์ในการทำงานหรือการแก้ปัญหา แนะนำหลักสูตรวิทยาศาสตร์ข้อมูล / การเรียนรู้ของเครื่อง แอนดรูอึ้งไม่การแนะนำที่น่าตื่นตาตื่นใจกับกลไกการเรียนรู้ในหลักสูตรของเขาที่ Coursera ที่นี่ ฉันขอแนะนำให้คุณดาวน์โหลดชุดข้อมูลและเริ่มเล่นกับพวกเขา หากคุณยังไม่ได้ดาวน์โหลด R และ RStudio (ในความคิดของฉันเป็นมิตรกับผู้เริ่มต้นมากกว่า Python หรือ Matlab) และลงทะเบียนที่kaggleและทำปัญหาเบื้องต้นบางอย่างของพวกเขา พวกเขามีคำแนะนำที่ยอดเยี่ยมที่ช่วยให้คุณใช้ ML โดยที่ไม่รู้ว่าเกิดอะไรขึ้นจริง ๆ แต่มันให้ความคิดเกี่ยวกับขั้นตอนที่คุณต้องดำเนินการเพื่อใช้โซลูชัน ML อย่างแท้จริง

โดยส่วนตัวแล้วผมอยากแนะนำให้เริ่มต้นใช้เครื่องมือ ML โดยไม่รู้ตัวว่าทำอะไรอยู่ (ใช้ชุดข้อมูล Kaggle หรือคล้ายกัน) และการเรียนรู้แนวคิดพื้นฐานเช่น cross-validation, overfitting, การใช้เมทริกซ์ความสับสนมาตรการต่าง ๆ ของแบบจำลองที่ดีเป็นต้นสำหรับฉันมันสำคัญมากที่จะต้องรู้วิธีใช้อัลกอริทึมและรู้วิธีระบุว่าเมื่อใดที่ทำงาน / ไม่ทำงานมากกว่าที่จะเข้าใจวิธีการทำงานของอัลกอริทึม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.