สถิติสำหรับการเรียนรู้ของเครื่องจักรเอกสารที่จะเริ่ม?


10

ฉันมีพื้นหลังในการเขียนโปรแกรมคอมพิวเตอร์และทฤษฎีจำนวนเบื้องต้น แต่ไม่มีการฝึกอบรมทางสถิติที่แท้จริงและเมื่อเร็ว ๆ นี้ "ค้นพบ" ว่าโลกมหัศจรรย์ของเทคนิคทั้งหมดเป็นจริงโลกทางสถิติ ดูเหมือนว่าความจริงของเมทริกซ์, การสร้างเมทริกซ์, เมตริกซ์มิติสูง, งานแต่งงาน, การประมาณความหนาแน่น, การอนุมานแบบเบย์, พาร์ติชั่นมาร์คอฟ, การคำนวณ eigenvector, PageRank เป็นเทคนิคทางสถิติอย่างมากและอัลกอริทึม .

เป้าหมายของฉันคือการสามารถอ่านเอกสารที่พูดถึงสิ่งต่าง ๆ และนำไปใช้หรือสร้างอัลกอริทึมในขณะที่เข้าใจสัญลักษณ์ "การพิสูจน์" และการใช้ข้อโต้แย้งทางสถิติ ฉันเดาว่าสิ่งที่ยากที่สุดคือทำตามบทพิสูจน์ทั้งหมดที่เกี่ยวข้องกับเมทริกซ์

เอกสารพื้นฐานอะไรที่ทำให้ฉันเริ่มต้นได้ หรือตำราเรียนที่ดีกับแบบฝึกหัดที่ควรค่าแก่การทำงาน

โดยเฉพาะเอกสารบางอย่างที่ฉันอยากจะเข้าใจอย่างสมบูรณ์คือ:

  1. แน่นอนเมทริกซ์เสร็จสมบูรณ์ผ่านการเพิ่มประสิทธิภาพนูน, Candes, Recht, 2008
  2. การแปลง Cauchy อย่างรวดเร็วและการถดถอยเชิงเส้นที่รวดเร็วกว่า, Clarkson และคณะ, 2013
  3. เครื่องฉายภาพแบบสุ่มสำหรับรองรับ Vector Machines, Paul et al, 2013
  4. การประมาณความน่าจะเป็นมิติสูงด้วยโมเดลความหนาแน่นลึก, Rippel, Adams, 2013
  5. การรับการประมาณค่าข้อผิดพลาดที่ลดลงและขอบเขตของข้อผิดพลาดในการเข้าใช้งานสากลสำหรับการสร้างเมทริกซ์ระดับต่ำให้เสร็จสมบูรณ์, Király, Theran, 2013

1
คุณคุ้นเคยกับเมทริกซ์แล้วเช่นผ่านพีชคณิตเชิงเส้นประยุกต์หรือเป็นส่วนหนึ่งของสิ่งที่คุณต้องการเรียนรู้หรือไม่? ฉันจะบอกว่าครึ่งแรกของรายการที่คุณให้คือหัวข้อที่มีความสำคัญในสถิติมากกว่าเทคนิคทางสถิติสูง (ซึ่งทำให้ฉันไปในทิศทางตรงกันข้าม) มีคำถามหลายข้อเกี่ยวกับหนังสือแนะนำสำหรับการเรียนรู้การเรียนรู้ด้วยเครื่องเชิงสถิติ ฉันขอแนะนำให้คุณให้ตัวอย่างหนึ่งหรือสองของเอกสารเฉพาะที่คุณเจอซึ่งคุณต้องการทำความเข้าใจ ที่จะช่วยเน้นคำตอบที่คุณได้รับให้ดีขึ้น
พระคาร์ดินัล

2
ใช่คุ้นเคยกับเมทริกซ์ผ่านพีชคณิตเชิงเส้นและแนวคิดของปริภูมิเวกเตอร์พื้นฐานบรรทัดฐาน แต่ฉันไม่เข้าใจสิ่งต่าง ๆ อย่างเช่นการแยกตัวประกอบ LU แม้ว่าฉันจะค่อนข้างชัดเจนเกี่ยวกับการตั้งฉากแบบดั้งเดิมของ Gram-Schmidt และอัลกอริทึม QR ไม่ชัดเจนว่าทำไมพวกเขาถึงทำงานอย่างสมบูรณ์ นอกจากนี้ฉันไม่เข้าใจว่าผู้คนสามารถหาไอเก็นเวกเตอร์สำหรับเมทริกซ์แบบสุ่มได้อย่างไรโดยไม่ต้องใช้อัลกอริทึม eigenvector กับมัน
Cris Stringfellow

คำตอบ:


2

ฉันอยากจะแนะนำหลักสูตรการเรียนรู้ของ Andrew Ngs Machine Learning ใน Coursera มันครอบคลุมเนื้อหาที่ยอดเยี่ยมในทุกเรื่องพื้นฐาน หากคุณกำลังศึกษาอะไรเกี่ยวกับแบบจำลองความน่าจะเป็นของกราฟิกหลักสูตร Daphne Kollers ก็น่าจะดีเช่นกัน

นี่เป็นขุมสมบัติสำหรับทรัพยากรการศึกษาด้วยตนเองเช่นกันhttp://ragle.sanukcode.net/articles/machine-learning-self-study-resources/การบรรยายของ Herb Grossman นั้นยอดเยี่ยม

ฉันได้รับการแนะนำหนังสือเล่มนี้ด้วยhttps://www.openintro.org/stat/textbook.phpเนื่องจากฉันยังคงเรียนรู้ด้วยตนเองอยู่เสมอและสถิติไม่ใช่พื้นหลังของฉัน!

สองเซ็นต์ของฉันเป็นด้านคณิตศาสตร์ของสิ่งต่าง ๆ และเอกสารแม้ว่าจะไม่จมอยู่กับพื้นหลังคณิตศาสตร์มากเกินไป เรียนรู้พื้นฐานและการอ้างอิงเอกสารที่เอกสารที่คุณกล่าวถึงนั้นถูกสร้างขึ้นและดูง่ายขึ้น (บางทีคุณอาจต้องกลับไปอ่านบทความสองสามฉบับเพื่อรับสิ่งที่คุณเข้าใจได้ - นั่นคือสิ่งที่ฉันทำเอง) มีจำนวนมาก องค์ประกอบต่าง ๆ ของคณิตศาสตร์ใน ML และมันง่ายที่จะดูดลงในโพรงกระต่าย (อีกครั้งสิ่งที่ฉันทำเองมากกว่าหนึ่งครั้ง!)

ขอให้โชคดีมันเป็นสนามที่น่าสนใจจริงๆ!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.