ภูมิหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่?


37

ฉันเริ่มต้องการพัฒนาทักษะของฉันเองและฉันก็รู้สึกทึ่งกับการเรียนรู้ของเครื่องจักร อย่างไรก็ตามเมื่อหกปีที่แล้วแทนที่จะทำตามนี้ฉันตัดสินใจที่จะศึกษาระดับปริญญาที่ไม่เกี่ยวข้องกับวิทยาศาสตร์คอมพิวเตอร์

ฉันได้พัฒนาซอฟต์แวร์และแอพพลิเคชั่นมาประมาณ 8-10 ปีแล้วดังนั้นฉันจึงมีความสามารถที่ดี แต่ฉันก็ไม่สามารถเจาะด้านคณิตศาสตร์ของการเรียนรู้ของเครื่อง / ความน่าจะเป็น / สถิติ

ฉันเริ่มมองหาสื่อการเรียนรู้และในหน้าแรกอาจมีสิ่งที่ทำให้ฉันสับสนและตั้งอุปสรรคในการเรียนรู้ของฉันทันที

  • ภูมิหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่? ฉันควรลองและเติมคำในช่องว่างของคณิตศาสตร์ก่อนที่จะเรียนต่อกับ ML หรือไม่? การเรียนรู้ด้วยตนเองสามารถใช้ได้กับนักพัฒนาที่ไม่มีพื้นฐานด้านวิทยาศาสตร์คอมพิวเตอร์หรือไม่?

คำถามที่เกี่ยวข้อง:


4
ฉันว่าคุณต้องเข้าใจพีชคณิตเชิงเส้นอย่างน้อยที่สุดและอาจเป็นไปได้สำหรับแอปพลิเคชันแบบเบย์ คุณต้องมีความสะดวกสบายในการแปลคณิตศาสตร์เป็นรหัสและยังสามารถปรับเปลี่ยนได้เมื่อเทียบกับรูปแบบสัญกรณ์ (ซึ่งไม่สอดคล้องกันทั้งหมด) ML ไม่ใช่เรื่องง่ายสำหรับนักวิทยาศาสตร์คอมพิวเตอร์ส่วนใหญ่เช่นกัน
John Moeller

3
ฉันไม่เชื่อว่าคำถามเกี่ยวข้องกันเลย ขอบคุณที่ทำให้ไซต์นี้เป็น stackexchange ที่น่าดึงดูดใจและปิดคำถาม ฉันไม่ได้พูดถึงใครแนะนำหนังสือให้ฉัน สิ่งนี้ไม่ซ้ำกันตาม "ความซ้ำซ้อนที่เป็นไปได้"
Layke

2
ฉันทำเธรดบนเมตา (8 ชั่วโมงที่ผ่านมา) ขอให้เปิดใหม่ meta.stats.stackexchange.com/questions/1442/…
Douglas Zare

1
ขอขอบคุณ. มันอาจยังคงปิดอยู่ว่าเป็น "อัตนัยเกินไป" หรือ "ไม่ใช่คำถามจริง" แต่ก็ไม่ซ้ำกันแน่นอน
Layke

1
Layke ดังที่อธิบายไว้ในเมตาดาต้าเริ่มต้นโดย @Douglas Zare เราหวังว่าคุณจะปิดคำถามนี้เพื่อเป็นประโยชน์แก่คุณเพราะมันจะช่วยให้คุณสามารถเข้าถึงเธรดที่เกี่ยวข้องซึ่งอาจตอบคำถามของคุณได้ทันที แต่เนื่องจากคุณได้แสดงความคิดเห็นว่าไม่ได้มีเจตนาที่จะซ้ำซ้อนคุณจะต้องแก้ไขคำถามของคุณเพื่อให้ชัดเจนในแง่ที่ว่ามันไม่ซ้ำซ้อนกับคำถามที่คล้ายกันในเว็บไซต์นี้หรือไม่? เรายินดีที่จะเปิดใหม่อีกครั้ง
whuber

คำตอบ:


23

Stanford (Ng)และCaltech (Abu-Mostafa)ได้เปิดคลาสการเรียนรู้ของเครื่องบน YouTube คุณไม่ได้เห็นการบ้าน แต่การบรรยายนั้นไม่ได้ขึ้นอยู่กับสิ่งเหล่านั้น ฉันขอแนะนำให้พยายามดูสิ่งเหล่านี้ก่อนเพราะสิ่งเหล่านั้นจะช่วยคุณค้นหาคณิตศาสตร์ที่คุณต้องเรียนรู้ ฉันเชื่อว่าชั้นเรียนที่คล้ายกันมากกับงานที่ได้รับมอบหมายสอนโดย Andrew Ng ใน Coursera ซึ่ง Ng ช่วยในการสร้าง

หนึ่งข้อยกเว้น: ถ้าฉันจำได้อย่างถูกต้องในช่วงต้นของการบรรยายที่สแตนฟอร์ด Ng จะทำการคำนวณบางอย่างที่เกี่ยวข้องกับอนุพันธ์ของร่องรอยของผลิตภัณฑ์ของเมทริกซ์ สิ่งเหล่านี้ค่อนข้างโดดเดี่ยวดังนั้นอย่ากังวลหากคุณไม่ทำตามการคำนวณเหล่านั้น ฉันไม่รู้ด้วยซ้ำว่าหลักสูตรใดจะครอบคลุมสิ่งเหล่านั้น

คุณต้องการมีความคุ้นเคยกับความน่าจะเป็นพีชคณิตเชิงเส้นการเขียนโปรแกรมเชิงเส้นและแคลคูลัสหลายตัวแปร อย่างไรก็ตามคุณต้องการน้อยกว่าสิ่งที่มีอยู่ในชั้นเรียนวิทยาลัยที่สมบูรณ์ในหลายวิชา


3
การมอบหมายงานของคาลเทค: work.caltech.edu/homeworks.html
Franck Dernoncourt

15

ขึ้นอยู่กับชนิดของแอปพลิเคชันคุณไม่จำเป็นต้องใช้คณิตศาสตร์ในฐานะผู้ฝึก ML

ในฐานะโปรแกรมเมอร์ที่สอนตัวเอง (~ 15 ปี) และการออกกลางคันของวิทยาลัยบ่อยครั้งโดยไม่มีพื้นฐานด้านคณิตศาสตร์ (แคลคูลัส III) หรือสถิติฉันเริ่มต้นด้วยการเรียนรู้ด้วยเครื่อง / การทำเหมืองข้อมูลด้วยทรัพยากรไม่กี่:

  • หนังสือ "Mastering Data Mining: ศิลปะและวิทยาศาสตร์ของการบริหารลูกค้าสัมพันธ์" โดย Berry และ Linoff

  • หนังสือ "เทคนิคการขุดข้อมูล" โดยผู้แต่งคนเดียวกัน

  • R โดยเฉพาะอย่างยิ่งและแพ็คเกจปาร์ตี้และ nnet

ฉันทำงานที่การตลาดและการปฏิบัติการที่ไม่หวังผลกำไร โดยเฉพาะอย่างยิ่งในตอนแรกฉันใช้ data mining เป็นหลักในการดึงดูดจดหมายโดยตรง

ต่อมาฉันก็เรียนพีชคณิตเชิงเส้น, การเรียนรู้ของเครื่องแอนดรูอึ้ง, รู้เบื้องต้นเกี่ยวกับวิธีการทางสถิติ (STAT 301) ที่ CSU, ฯลฯ

สำหรับคุณฉันขอแนะนำให้เริ่มจากหนังสือสองเล่มหลักสูตรของ Andrew Ng และต้นไม้ตัดสินใจ (แพ็คเกจปาร์ตี้ใน R) ขึ้นอยู่กับใบสมัครของคุณ


9

ฉันคิดว่านี่เป็นคำถามที่ดีจริง ๆ และหัวข้อสูงมาก; ฉันไม่แน่ใจว่ามีคำตอบหรือไม่ บทความล่าสุดกระตุ้นความขัดแย้ง (ดูที่นี่ ) โดยการแนะนำว่าวิทยาศาสตร์ข้อมูลเป็นเรื่องง่ายที่จะเรียนรู้ออนไลน์ สิ่งหนึ่งที่น่าสังเกตเกี่ยวกับกรณีศึกษาส่วนใหญ่ที่กล่าวถึงในบทความนั้นคือพวกเขามาจากภูมิหลังทางคณิตศาสตร์หรือคณิตศาสตร์

นี่เป็นจุดที่น่าสนใจเนื่องจากบ่งชี้ว่าในขณะที่หลักสูตรออนไลน์เช่น Coursera, Stanford และ edX มีประโยชน์ในการสอนทักษะวิทยาการคอมพิวเตอร์เฉพาะที่จำเป็นอาจเป็นไปได้ว่าภูมิหลังทางคณิตศาสตร์บางอย่างจำเป็นต่อการเข้าใจรูปแบบที่คุณใช้ . ในทางกลับกันข้อโต้แย้งที่รุนแรงพอ ๆ กันอาจทำให้คนเหล่านี้ต่างก็มีใจที่จะวิเคราะห์ด้วยและนี่คือสาเหตุที่พวกเขาทำงานในสาขาวิชาเชิงปริมาณรวมถึงสาเหตุที่พวกเขาหยิบเครื่องเรียนรู้ได้อย่างง่ายดายและชนะการแข่งขัน

ฉันคิดว่าพื้นฐานมีปัญหาการวิเคราะห์เกิดขึ้นที่นี่ ในขณะที่ทักษะทางคณิตศาสตร์นั้นมีประโยชน์ในการทำความเข้าใจรากน่าจะเป็นของอัลกอริทึมที่คุณใช้ แต่ก็มีข้อโต้แย้งที่เท่าเทียมกันที่จะทำให้ทักษะทางวิศวกรรมซอฟต์แวร์ที่ดีสามารถเพิ่มได้มากขึ้นโดยอนุญาตให้คุณทำการวิเคราะห์ระดับสูง เพื่อให้บรรลุเป้าหมายของคุณแม้ว่าคุณจะไม่เข้าใจว่าทำไมพวกเขาถึงทำอย่างนั้น โดยทั่วไปวิทยาศาสตร์ข้อมูล (และการเรียนรู้ด้วยเครื่องโดยสมาคม) เป็นสาขาที่น่าตื่นเต้นอย่างแม่นยำเนื่องจากความกว้างนี้ - คุณสามารถเป็นฐานข้อมูลและใช้กำลังดุร้ายเพื่อแก้ไขปัญหาหรือนักคณิตศาสตร์ที่ใช้การจำลองหรือนักวิทยาศาสตร์คอมพิวเตอร์ที่ใช้ประโยชน์จากวิศวกรรมที่ดี รหัสเพื่อรวบรวมอัลกอริทึมและวิธีการที่แตกต่างกันในวิธีที่เหมาะสมที่สุด

วิธีการทั้งหมดที่เพิ่มในการทำนายเป็นสิ่งที่ดีดังนั้นฉันพูดได้ว่าการเรียนคณิตศาสตร์บางอย่างอาจเป็นความคิดที่ดีที่จะให้โอกาสที่ดีที่สุดแก่คุณในการประสบความสำเร็จในสาขานี้ หากคุณต้องการจุดเริ่มต้นที่ดี MIT มีหลักสูตรพีชคณิตเชิงเส้นที่ยอดเยี่ยมพร้อมแอปพลิเคชั่นการคำนวณที่ดีที่ฉันพบว่าเข้าใจง่าย พวกเขายังมีหลักสูตรอื่น ๆ เกี่ยวกับกระบวนการสุ่มและแคลคูลัสหลายตัวแปรที่อาจเป็นที่สนใจในการสร้างความรู้ของคุณ


การที่คนที่ไม่มีความคิดเชิงวิเคราะห์ (หรือ abstracters หรือไม่ดี) ไม่ได้ช่วยด้วยการทำให้คณิตศาสตร์ง่ายขึ้นทำให้ฉันกังวล (+1) เสมอ ก็ชอบหลักสูตรพีชคณิตเชิงเส้น Strang แต่ไม่ใช่พีชคณิตเชิงเส้นเป็นคณิตศาสตร์แรกที่ถูกบดบังด้วยการคำนวณแรงเดรัจฉาน สำหรับวิทยาศาสตร์ข้อมูลนั้นเป็นเรื่องง่ายที่เชื่อมโยงกันอาจจะมีใครบางคนยกขึ้นมาแล้ว แต่ในการแข่งขันในตลาดหุ้นที่มีมารยาท 1 หรือ 2 ในพันบวกกับภาพรวมที่ USAully จะเอาชนะผู้เชี่ยวชาญ - ดังนั้นผู้ใดก็ตามที่สามารถรับหุ้น
phaneron

4

ภูมิหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่? - คำตอบและการเก็งกำไรสำหรับ ML ที่คิดว่าเป็นสถิติ ;-)

ประมาณปี 1990 ฉันหวังว่าพีชคณิตของคอมพิวเตอร์จะได้รับความช่วยเหลือฉันคิดว่ามันเป็น แต่มันค่อนข้าง จำกัด แต่แน่นอนว่ามันจะช่วยเร่งการเรียนรู้คณิตศาสตร์อย่างรวดเร็ว (ไม่จำเป็นต้องพัฒนาทักษะการยักย้ายถ่ายเทโดยการฝึกฝนหรือพยายามที่จะทำโดยการทำแบบฝึกหัดง่ายๆ) ฉันพบว่าพีชคณิตเชิงเส้นของ Fred Szabo กับ Mathematica เป็นตัวอย่างที่ยอดเยี่ยมของเรื่องนี้ (แต่ฉันได้เรียนวิชาพีชคณิตเชิงเส้นระดับทฤษฎีขั้นสูงแล้ว)

ฉันทำงานมาตั้งแต่ปี 2531 (ใช้ประโยชน์จากวิธีการสอนแบบเข้มข้นของคอมพิวเตอร์เพื่อ "ประสาน" ทฤษฎีและหลักการจากสถิติอย่างแม่นยำ) เพื่อให้ได้คำตอบที่ไม่มีหรืออย่างน้อยก็ไม่จำเป็น (สำหรับสถิติ) หนึ่งจะสามารถเข้าใจได้เร็วขึ้นและโดยทั่วไปด้วยทักษะและความเข้าใจทางคณิตศาสตร์เพิ่มเติม ฉันคิดว่าฉันเริ่มเข้าใกล้แล้ว แต่สิ่งหนึ่งต้องการการแสดงถึงความเป็นไปได้ในการสร้างแบบจำลองและการอนุมานที่ใช้ได้และมีประโยชน์มากกว่าแค่ปัญหาของเล่น

ฉันควรลองและเติมคำในช่องว่างของคณิตศาสตร์ก่อนที่จะเรียนต่อกับ ML หรือไม่?

นั่นเป็นความพยายามที่ยากลำบาก - ใน MHO เกือบทุกคนที่เข้าใจสถิติได้ที่นั่นด้วยความสะดวกสบายในการจัดการมาตรฐานและโดยเฉพาะอย่างยิ่งการเป็นตัวแทนทางคณิตศาสตร์มาตรฐานของรูปแบบการสร้างความน่าจะเป็นและการจำแนกลักษณะทางคณิตศาสตร์ของการอนุมาน ดังนั้นมันจึงไม่ใช่แค่รับพื้นฐาน แต่รู้สึกสบายใจกับคณิตศาสตร์ (สำหรับฉันแล้วทฤษฎีฟูริเยร์เป็นสิ่งจำเป็นสำหรับฉัน)

เหตุใดการนำเสนอเหล่านี้จึงยาก (ถึงแม้จะมีคณิตศาสตร์มาก)

Gerd Gigerenzer ได้พิสูจน์แล้วว่าไม่มีความท้าทายใด ๆ กับการทดสอบแบบบวก / ลบโรคง่าย ๆ โดยใช้ปัญหาบวก / ลบโดยใช้ความถี่ _natural” การอ้างอิงจากคำถามที่เชื่อมโยงดูเหมือนว่าจะใช้ประโยชน์ได้ดีจากhttp://www.autonlab.org/tutorials/prob18.pdf

เหตุใดจึงยากที่จะพูดคุยเรื่องนี้?

สำหรับการทดสอบ k (ซ้ำและแตกต่าง) - 2 ^ k

สำหรับการทดสอบที่รับค่า v - v ^ k

ดังนั้นสำหรับไบนารีที่ไม่รู้จัก - 2 * v ^ k ความน่าจะเป็นเส้นทางตัวอย่าง

สำหรับ p ไม่ทราบค่าไบนารีหลายค่า 2 ^ p * v ^ k

สำหรับ p ไม่ทราบเหตุผลหลายประการ Q ^ p * v ^ k

เราย้ายไปคณิตศาสตร์อย่างรวดเร็วด้วยจำนวนอนันต์ที่นับไม่ได้และนับไม่ถ้วนเพื่อจัดการกับสิ่งนี้ซึ่งถึงแม้จะมีความเชี่ยวชาญทางคณิตศาสตร์ก็จะนำไปสู่ความเข้าใจที่คลาดเคลื่อนและความขัดแย้งหลายประการ

นอกจากนี้ยังมีความเข้าใจผิดที่เป็นอันตรายแบบเชิงเส้นถึงแบบไม่เชิงเส้น (เช่นอันตรายซ่อนเร้นของการระบุ Winbugs แบบ noninformative Priors และ MCMC อื่น ๆ โดยไม่มีข้อมูลสำหรับการแจกจ่ายก่อน ) และการโต้ตอบและผลแบบสุ่ม ฯลฯ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.