คำถามของฉันมาจากข้อเท็จจริงต่อไปนี้ ฉันได้อ่านโพสต์บล็อกการบรรยายรวมถึงหนังสือเกี่ยวกับการเรียนรู้ของเครื่อง ความประทับใจของฉันคือผู้ปฏิบัติงานการเรียนรู้ด้วยเครื่องดูเหมือนจะไม่สนใจสิ่งต่าง ๆ ที่นักสถิติ / นักเศรษฐศาสตร์สนใจ โดยเฉพาะผู้ปฏิบัติงานการเรียนรู้ด้วยเครื่องเน้นความแม่นยำในการทำนายมากกว่าการอนุมาน
ตัวอย่างหนึ่งเกิดขึ้นเมื่อฉันเรียนรู้การใช้งานเครื่องจักรของ Andrew Ng บน Coursera เมื่อเขาพูดถึง Simple Linear Model เขาไม่ได้พูดถึงคุณสมบัติ BLUE ของตัวประมาณค่าหรือวิธีการที่ heteroskedasticity เขามุ่งเน้นไปที่การนำทางลาดลงและแนวคิดของการตรวจสอบข้าม / เส้นโค้ง ROC หัวข้อเหล่านี้ไม่ได้กล่าวถึงในชั้นเรียนเศรษฐมิติ / สถิติของฉัน
อีกตัวอย่างหนึ่งเกิดขึ้นเมื่อฉันเข้าร่วมการแข่งขัน Kaggle ฉันอ่านรหัสและความคิดของคนอื่น ส่วนใหญ่ของผู้เข้าร่วมเพียงแค่โยนทุกอย่างลงใน SVM / random forest / XGBoost
ยังมีอีกตัวอย่างหนึ่งที่เกี่ยวกับการเลือกแบบจำลองตามลำดับ เทคนิคนี้ใช้กันอย่างแพร่หลายอย่างน้อยออนไลน์และ Kaggle หนังสือเรียนรู้ด้วยเครื่องจักรคลาสสิกจำนวนมากยังครอบคลุมเช่นการเรียนรู้สถิติเบื้องต้น อย่างไรก็ตามตามคำตอบนี้ (ซึ่งค่อนข้างน่าเชื่อถือ) การเลือกรุ่นแบบขั้นตอนต้องเผชิญกับปัญหาจำนวนมากโดยเฉพาะอย่างยิ่งเมื่อมันลงมาที่ "การค้นพบรูปแบบที่แท้จริง" ดูเหมือนว่ามีความเป็นไปได้เพียงสองอย่างเท่านั้น: ผู้เรียนรู้การเรียนรู้ด้วยเครื่องทั้งสองไม่รู้จักปัญหาแบบขั้นตอนหรือพวกเขาทำ แต่พวกเขาไม่สนใจ
ดังนั้นนี่คือคำถามของฉัน:
- เป็นเรื่องจริงหรือเปล่าที่ผู้ฝึกการเรียนรู้ด้วยเครื่องจักรเน้นการทำนายและไม่สนใจสิ่งต่าง ๆ มากมายที่นักสถิติ / นักเศรษฐศาสตร์สนใจ
- ถ้ามันเป็นเรื่องจริงแล้วอะไรคือเหตุผลที่อยู่เบื้องหลัง เป็นเพราะการอนุมานนั้นยากกว่าในบางแง่มุม?
- มีเนื้อหามากมายเกี่ยวกับการเรียนรู้ของเครื่อง (หรือการทำนาย) ทางออนไลน์ หากฉันสนใจที่จะเรียนรู้เกี่ยวกับการอนุมานอย่างไรก็ตามมีแหล่งข้อมูลออนไลน์อะไรบ้างที่ฉันสามารถให้คำปรึกษาได้
อัปเดต : ฉันเพิ่งรู้ว่าคำว่า "การอนุมาน" อาจหมายถึงสิ่งต่างๆมากมาย สิ่งที่ฉันหมายถึงโดย "อนุมาน" หมายถึงคำถามเช่น
ไม่สาเหตุหรือที่เกิด ? หรือโดยทั่วไปความสัมพันธ์เชิงสาเหตุระหว่างคืออะไร?Y Y X X 1 , X 2 , ⋯ , X n
เนื่องจาก "แบบจำลองทั้งหมดผิด" แบบจำลองของเรามาจากแบบจำลองจริงอย่างไร
เมื่อได้รับข้อมูลตัวอย่างเราจะพูดอะไรเกี่ยวกับประชากรและเรามั่นใจว่าจะพูดเช่นนั้นได้อย่างไร
เนื่องจากความรู้ทางสถิติที่ จำกัด มากของฉันฉันไม่แน่ใจด้วยซ้ำว่าคำถามเหล่านั้นตกอยู่ในขอบเขตของสถิติหรือไม่ แต่คำถามเหล่านี้เป็นประเภทของคำถามที่ผู้เรียนรู้เกี่ยวกับเครื่องจักรดูเหมือนจะไม่สนใจ บางทีนักสถิติอาจไม่สนใจเลย ฉันไม่รู้
fortunes
แพ็คเกจบน CRAN เพียงแค่บอกว่าคุณไม่ได้อยู่คนเดียวกับความประทับใจความแม่นยำทางคณิตศาสตร์นั้นไม่ได้เป็นประเด็นหลักในการเรียนรู้ของเครื่อง