อัลกอริทึมที่ยอดเยี่ยมการเรียนรู้ของเครื่องและไม่มีพีชคณิตเชิงเส้น


30

ฉันสอนหลักสูตรอัลกอริทึมขั้นสูงและต้องการรวมบางหัวข้อที่เกี่ยวข้องกับการเรียนรู้ของเครื่องซึ่งเป็นที่สนใจของนักเรียนของฉัน ด้วยเหตุนี้ฉันต้องการฟังความคิดเห็นของผู้คนเกี่ยวกับผลลัพธ์อัลกอริทึมที่น่าสนใจที่สุดในการเรียนรู้ของเครื่อง ข้อ จำกัด ที่อาจเกิดขึ้นได้ยากคือนักเรียนจะไม่เคยมีความรู้มาก่อนเกี่ยวกับพีชคณิตเชิงเส้นหรือหัวข้อหลักอื่น ๆ ในการเรียนรู้ของเครื่อง

นี่คือการกระตุ้นให้พวกเขาเกี่ยวกับหัวข้อและเพื่อให้พวกเขารู้ว่า ML เป็นพื้นที่การวิจัยที่น่าตื่นเต้นสำหรับผู้เชี่ยวชาญด้านอัลกอริทึม

แก้ไข: นี่เป็นหลักสูตรระดับปริญญาตรีปีสุดท้าย (เนื่องจากเราไม่มีหลักสูตรระดับบัณฑิตศึกษาในสหราชอาณาจักรเป็นหลัก) พวกเขาจะทำอย่างน้อยหนึ่งอัลกอริธึมพื้นฐานหลักสูตรล่วงหน้าและทำได้ดีในการเลือกหลักสูตรติดตามผลขั้นสูง หลักสูตรปัจจุบันของหลักสูตรขั้นสูงมีหัวข้อต่าง ๆ เช่นการแฮ็กที่สมบูรณ์แบบตัวกรอง Bloom ต้นไม้ Van Emde Boas โปรแกรมเชิงเส้นประมาณ อัลกอริธึมสำหรับปัญหา NP-hard เป็นต้นฉันไม่ได้ตั้งใจจะใช้เวลาบรรยายมากกว่าหนึ่งครั้งใน ML แต่ถ้ามีบางอย่างที่เกี่ยวข้องกับทั้งอัลกอริทึมและ ML อย่างแน่นอนก็อาจรวมอยู่ด้วย


1
โปรดกำจัดสองสิ่ง: 1) มันเป็นหลักสูตรระดับปริญญาตรีหรือหลักสูตรบัณฑิตศึกษาหรือไม่? พวกเขาผ่านหลักสูตรใดบ้างที่เกี่ยวข้อง (ถ้ามี) 2) คุณต้องการอุทิศให้ ML เท่าไหร่
MS Dousti

3
hmmm ฉันคิดว่าพีชคณิตเชิงเส้นเป็นสิ่งจำเป็นและเป็นหลักสูตรพื้นฐานที่สำคัญอย่างน้อยในด้านการเรียนรู้ของเครื่อง และฉันคิดว่าตัวแบบเชิงเส้นเป็นสิ่งที่ดีมากสำหรับอัลกอริทึมการเรียนรู้ของเครื่อง คุณอาจนึกถึงอัลกอริธึมระดับพื้นฐานอื่น ๆ เช่นเพื่อนบ้านใกล้เคียง K หรืออัลกอริทึมการถดถอยโลจิสติก นี่อาจช่วยให้คุณen.wikipedia.org/wiki/List_of_machine_learning_algorithms
Deyaa

1
บางทีแนวคิดบางอย่างจากวิธี Hal Daume สอนการเรียนรู้ของเครื่อง - nlpers.blogspot.com/2010/04/how-i-teach-machine-learning.html
Yaroslav Bulatov

3
เรียนกราฟิลส์โดยทั่วไป Avrim Blum จะสรุปคลาสอัลกอริธึมระดับสูงของเขาด้วยการเรียนรู้ของเครื่องและหัวข้อที่เกี่ยวข้อง การทำซ้ำล่าสุดอยู่ที่ลิงค์ต่อไปนี้cs.cmu.edu/~avrim/451f09/index.htmlและคุณสามารถรับข้อมูลเพิ่มเติมได้จากหน้าเว็บของเขา มีทั้ง TA และชั้นเรียนนี้ฉันสามารถพูดได้ว่านักเรียน (และวัสดุการสรุป) ได้รับการต้อนรับอย่างอบอุ่น
matus

คำตอบ:


29

คุณสามารถครอบคลุมการส่งเสริม มันฉลาดมากใช้งานง่ายมีการใช้กันอย่างแพร่หลายในทางปฏิบัติและไม่จำเป็นต้องมีความรู้เบื้องต้นในการทำความเข้าใจ


5
ฉันได้นำเสนอบางส่วนของแบบสำรวจโดย Arora และคณะ ( cs.princeton.edu/~arora/pubs/MWsurvey.pdf ) ในชั้นเรียนหลักสูตรทฤษฎีไม่กี่ปีหลัง ดูเหมือนว่าผู้คนจะชอบมันและฉันคิดว่าคุณไม่จำเป็นต้องมีพื้นฐานในการเข้าใจเนื้อหานี้
Danu

9

หากคุณต้องการที่จะเพิ่มความอยากอาหารในการบรรยายเพียงครั้งเดียวอาจเป็นเรื่องที่น่าตื่นเต้นที่สุดในการนำเสนอแอปพลิเคชั่นที่ทรงพลัง ตัวอย่างเช่นสนับสนุนเครื่องเวกเตอร์และอัลกอริทึมการเรียนรู้ของเครื่องอื่น ๆ ที่ใช้ในเคมีบำบัดสำหรับการค้นพบยา

ปัญหาการเรียนรู้เป็นหลักคือ: กำหนดพฤติกรรมที่เราต้องการให้สารเคมีจัดแสดงประดิษฐ์โครงสร้างที่แสดงพฤติกรรมนั้นโดยการอนุมานจากฐานข้อมูลของโครงสร้างที่รู้จักซึ่งมีพฤติกรรมคล้ายกัน (หรือแตกต่างกัน) ปัญหาการเรียนรู้มีริ้วรอยพิเศษ: ยาใหม่จะต้อง "อยู่ห่างไกล" ในโครงสร้างระดับโลกจากยาที่รู้จักกันก่อนหน้านี้เพื่อที่จะพบอสังหาริมทรัพย์

แหล่งข่าวคนหนึ่งคือการจัดกลุ่มวิธีการและใช้พวกเขาในการคำนวณเคมี


1
ขอบคุณสำหรับการอ้างอิง ฉันคิดว่าบางทีสอน SVM เป็นแอพพลิเคชั่นของการเพิ่มประสิทธิภาพนูน นั่นจะเกี่ยวข้องกับส่วนอัลกอริทึมกับส่วน ML อย่างดี
Raphael

2
คุณจะครอบคลุม SVM โดยไม่มีพีชคณิตเชิงเส้นได้อย่างไร
เลฟเรซิน

ฉันหวังว่าจะสอนสิ่งที่จำเป็นขั้นต่ำสำหรับพวกเขาในหลักสูตรของฉัน อาจจะเป็นแง่ดีเกินไป :-)
Raphael

ยังมีตัวอย่างสำคัญที่การสนับสนุนเครื่องเวกเตอร์เป็นตัวเลือกที่ดีที่สุด ฉันสังเกตเห็นว่าในการแข่งขัน kaggle พวกเขาไม่เคยเป็นส่วนสำคัญของการชนะ อย่างน้อยก็ไม่มีอะไรที่ฉันได้เห็นเมื่อเร็ว ๆ นี้ (ฉันยืนที่จะได้รับการแก้ไขแน่นอน)
Lembik

7

K-Means และ KNN นั้นทรงพลังมากและไม่ต้องการพีชคณิตเชิงเส้นใด ๆ ยกเว้นการคำนวณระยะทางของคะแนน


โดยเฉพาะอย่างยิ่ง K-Means เป็นอัลกอริทึมที่ทรงพลังมาก มันมีประสิทธิภาพอย่างไม่น่าเชื่อแม้จะไม่มีขอบเขตที่พิสูจน์ได้เกี่ยวกับประสิทธิภาพการทำงานของวัตถุในระดับที่น่ากลัวว่ามันเกือบจะเหมือนกับความซับซ้อนเชิงพหุนามที่มีประสิทธิภาพของ Simplex ของอัลกอริธึมที่มีประสิทธิภาพ เวอร์ชั่นออนไลน์นั้นมีประโยชน์ในแอพพลิเคชั่นข้อมูลขนาดใหญ่
Elliot JJ

5

ส่วนที่สองของ "โครงข่ายประสาทและการเรียนรู้ของเครื่อง" โดย Christopher Bishop (ที่ MSR) อยู่บนอัลกอริทึมใน ML หนังสือเรียนของบิชอปมักใช้สำหรับตำราเรียนระดับบัณฑิตศึกษา


4

อัลกอริทึมนี้ใช้การตัดกราฟขั้นต่ำเพื่อจำแนกตัวอย่างที่ไม่มีป้ายกำกับจำนวนมากโดยใช้ตัวอย่างที่มีป้ายกำกับจำนวนเล็กน้อยเท่านั้น

ปริญญาตรีเป็นมิตร ฉันได้อธิบายสิ่งนี้กับผู้ที่ได้รับการสุ่มเลือกสองสามคนและพวกเขาเข้าใจ

Ref: Blum, A. , & Chawla, S. (2001) เรียนรู้จากข้อมูลที่ติดป้ายกำกับและไม่มีป้ายกำกับโดยใช้กราฟย่อ

โปรโมชั่นด้วยตนเองการแสดงของอัลกอริทึมในYouTube


4

ผมเห็นความคาดหวังว่าการเพิ่มประสิทธิภาพ (EM) ยังไม่ได้รับการกล่าวถึงและก็แน่นอน "ขึ้นมี" ในด้านบน 10: http://www.cs.uvm.edu/~icdm/algorithms/10Algorithms-08.pdf


1

อัลกอริทึมการเรียนรู้เสริม (โดยเฉพาะ Q-Learning และ SARSA) นั้นค่อนข้างเข้าใจง่ายและทรงพลังมากในการแก้ปัญหาการเรียนรู้ พวกเขาไม่ต้องการความรู้ขั้นสูงใด ๆ ในพีชคณิตเชิงเส้นยกเว้นการพิสูจน์การลู่เข้าและอัตราการลู่เข้า

คุณสามารถใช้แบบสำรวจที่รู้จักกันดีของ Littman และ al .: http://www.cs.cmu.edu/afs/cs/project/jair/pub/volume4/kaelbling96a-html/rl-survey.html


1

คุณสามารถครอบคลุมอัลกอริทึมบางอย่างที่คลาสสิกหรือมีสัญชาตญาณที่ดี

ตัวอย่างเช่น C4.5 และ CART ซึ่งเป็นอัลกอริธึมแผนผังการตัดสินใจแบบคลาสสิก

นอกจากนี้คุณยังสามารถครอบคลุมวิธีการทั้งมวล (เช่น AdaBoost (Boosting), Bagging) ซึ่งมีประสิทธิภาพที่ดีมากในการใช้งานจริง

นอกจากนี้การเรียนรู้เชิงลึกยังเป็นหัวข้อที่ดีเพราะมันร้อนมาก



0

Native Bayes และเครือข่าย Bayesian อัลกอริธึมต้นไม้ตัดสินใจค่อนข้างง่ายที่จะมองเห็นได้ง่ายกว่าเริ่มต้นด้วยเครือข่ายที่เป็นกลางหรือ svm


0

การเขียนโปรแกรมทางพันธุกรรมนั้นยอดเยี่ยมจริงๆ มันใช้แรงบันดาลใจจากชีววิทยาและสามารถนำไปใช้กับปัญหาจำนวนมาก (เช่นปัญหา n-queens และ TSP)

มันไม่จำเป็นต้องมีทักษะทางคณิตศาสตร์ลึก

แก้ไข: มันต้องใช้วิธีการประเมินว่าโซลูชั่นที่มีศักยภาพดีแค่ไหน มันสามารถใช้เป็นตัวอย่างในการเดากฎที่อยู่เบื้องหลังชุดของตัวเลขการค้นหาปัญหาขั้นต่ำและปัญหาหลายตัวแปรและค้นหาพื้นที่พารามิเตอร์ขนาดใหญ่ มันเหมาะเมื่อคุณไม่สนใจวิธีที่ดีที่สุด แต่เมื่อมีวิธีแก้ปัญหาที่ดีพอจะทำ ฉันเชื่อว่านี่ถูกใช้เพื่อค้นหากลยุทธ์ที่ดีสำหรับเกม (สร้างคำสั่งซื้อใน Starcraft 2 และการเล่นที่ดีที่สุดใน Mario)


มีปัญหาสำคัญหรือไม่ที่เป็นวิธีที่ดีที่สุด? ฉันหมายความว่ามันไม่ได้มีไว้สำหรับ TSP อย่างแน่นอน
Lembik
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.