เมื่อเร็ว ๆ นี้ในคลาสการเรียนรู้ของเครื่องจากศาสตราจารย์ Oriol Pujol ที่ UPC / Barcelona เขาได้อธิบายถึงอัลกอริทึมหลักการและแนวคิดที่ใช้กันทั่วไปสำหรับงานที่เกี่ยวข้องกับการเรียนรู้ของเครื่องจักร ที่นี่ฉันแบ่งปันให้กับคุณและถามคุณ:
- มีกรอบงานที่ครอบคลุมที่จับคู่กับแนวทางหรือวิธีการที่เกี่ยวข้องกับปัญหาการเรียนรู้ของเครื่องที่แตกต่างกันหรือไม่?
ฉันจะเรียนรู้แบบเกาส์ง่ายๆได้อย่างไร ความน่าจะเป็นตัวแปรสุ่มการแจกแจง การประมาณค่าการลู่เข้าหาและเส้นกำกับช่วงเวลาความมั่นใจ
ฉันจะเรียนรู้ส่วนผสมของ Gaussians (MoG) ได้อย่างไร โอกาสความคาดหวัง - สูงสุด (EM); การวางนัยทั่วไปการเลือกแบบจำลองการตรวจสอบข้าม k-หมายถึงรุ่นมาร์คอฟที่ซ่อนอยู่ (HMM)
ฉันจะเรียนรู้ความหนาแน่นได้อย่างไร การประมาณค่าพารามิเตอร์เทียบกับที่ไม่ใช่พารามิเตอร์ Sobolev และพื้นที่การทำงานอื่น ๆ l ́ 2 ข้อผิดพลาด; การประมาณความหนาแน่นของเคอร์เนล (KDE), เคอร์เนลที่ดีที่สุด, ทฤษฎีของ KDE
ฉันจะทำนายตัวแปรต่อเนื่อง (การถดถอย) ได้อย่างไร การถดถอยเชิงเส้น, การทำให้เป็นมาตรฐาน, การถดถอยแบบสันและ LASSO; การถดถอยเชิงเส้นท้องถิ่น การประมาณความหนาแน่นตามเงื่อนไข
ฉันจะทำนายตัวแปรแยก (หมวดหมู่) ได้อย่างไร ลักษณนามเบย์ไร้เดียงสาเบส์กำเนิดและพินิจพิเคราะห์; perceptron, การลดน้ำหนัก, เครื่องเวกเตอร์สนับสนุนเชิงเส้น; ลักษณนามและทฤษฎีเพื่อนบ้านที่ใกล้ที่สุด
ฉันควรใช้ฟังก์ชันการสูญเสียใด ทฤษฎีการประมาณค่าความน่าจะเป็นสูงสุด การประมาณ l -2 การประมาณแบบเบย์ minimax และทฤษฎีการตัดสินใจ, Bayesianism vs บ่อยครั้ง
ฉันควรใช้รุ่นใด AIC และ BIC; ทฤษฎี Vapnik-Chervonenskis; ทฤษฎีการตรวจสอบข้าม ร่วมมือ; อาจถูกต้องทฤษฎี (PAC) ประมาณ; ขอบเขตที่ได้จาก Hoeffding
ฉันจะเรียนรู้แบบจำลองนักเล่น (รวม) ได้อย่างไร ทฤษฎีการเรียนรู้ทั้งมวล ส่งเสริม; ห่อ; การสุม
ฉันจะเรียนรู้แบบจำลองนักเล่น (ไม่เชิงเส้น) ได้อย่างไร ตัวแบบเชิงเส้นทั่วไปการถดถอยแบบลอจิสติก ทฤษฎีบท Kolmogorov โมเดลเสริมทั่วไป การสร้างเคอร์เนล, การสร้างพื้นที่ของเคอร์เนล Hilbert, SVM แบบไม่เป็นเส้นตรง, การถดถอยของกระบวนการแบบเกาส์
ฉันจะเรียนรู้แบบจำลองนักเล่น (เรียงความ) ได้อย่างไร โมเดลแบบเรียกซ้ำต้นไม้การตัดสินใจการจัดกลุ่มแบบลำดับชั้น โครงข่ายประสาทเทียมการขยายพันธุ์กลับเครือข่ายความเชื่อลึก โมเดลกราฟิกผสมของ HMMs ฟิลด์สุ่มแบบมีเงื่อนไขเครือข่ายมาร์คอฟสูงสุด ตัวแบบลอการิทึมเชิงเส้น ไวยากรณ์
ฉันจะลดหรือเชื่อมโยงคุณสมบัติต่างๆได้อย่างไร การเลือกคุณสมบัติเทียบกับการลดขนาด, วิธีการห่อหุ้มสำหรับการเลือกคุณสมบัติ; ความสัมพันธ์เชิงสาเหตุกับความสัมพันธ์ความสัมพันธ์บางส่วนการเรียนรู้โครงสร้างเบย์
ฉันจะสร้างคุณสมบัติใหม่ได้อย่างไร การวิเคราะห์องค์ประกอบหลัก (PCA), การวิเคราะห์องค์ประกอบอิสระ (ICA), การปรับสเกลหลายมิติ, การเรียนรู้ที่หลากหลาย, การลดมิติที่อยู่ภายใต้การดูแล, การเรียนรู้การวัด
ฉันจะลดหรือเชื่อมโยงข้อมูลได้อย่างไร การทำคลัสเตอร์, การทำคลัสเตอร์สองกลุ่ม, การจัดกลุ่มแบบ จำกัด ; กฎความสัมพันธ์และการวิเคราะห์ตะกร้าตลาด ถดถอยอันดับ / ลำดับ; การวิเคราะห์ลิงค์ ข้อมูลเชิงสัมพันธ์
ฉันจะรักษาอนุกรมเวลาได้อย่างไร ARMA; ตัวกรองคาลมานและแบบจำลองพื้นที่ - ตัวกรองอนุภาค การวิเคราะห์ข้อมูลเชิงหน้าที่ การตรวจจับจุดเปลี่ยน; การตรวจสอบความถูกต้องข้ามสำหรับอนุกรมเวลา
ฉันจะจัดการข้อมูลที่ไม่เหมาะได้อย่างไร กะแปรสภาพ ความไม่สมดุลของคลาส ข้อมูลที่ขาดหายไปข้อมูลที่สุ่มตัวอย่างผิดพลาดการวัด การตรวจจับความผิดปกติ, ความทนทาน
ฉันจะปรับพารามิเตอร์ให้เหมาะสมได้อย่างไร Unconstrained vs constrained / Convex optimization, วิธีที่ปราศจากอนุพันธ์, วิธีที่หนึ่งและสองอันดับ, backfitting; การไล่ระดับสีตามธรรมชาติ การเพิ่มประสิทธิภาพที่ถูกผูกไว้และ EM
ฉันจะเพิ่มประสิทธิภาพฟังก์ชั่นเชิงเส้นได้อย่างไร พีชคณิตเชิงเส้นเชิงคำนวณการผกผันของเมทริกซ์สำหรับการถดถอยการสลายตัวของค่าเอกฐาน (SVD) สำหรับการลดขนาด
ฉันจะปรับให้เหมาะสมกับข้อ จำกัด ได้อย่างไร นูน, ตัวคูณลากรองจ์, เงื่อนไข Karush-Kuhn-Tucker, วิธีการจุดภายใน, อัลกอริธึม SMO สำหรับ SVM
ฉันจะประเมินผลรวมที่ซ้อนกันอย่างล้ำลึกได้อย่างไร การอนุมานแบบกราฟิกที่แน่นอนขอบเขตความแปรปรวนในผลรวมการอนุมานแบบกราฟิกโดยประมาณการแพร่กระจายความคาดหวัง
ฉันจะประเมินผลรวมและการค้นหาจำนวนมากได้อย่างไร ปัญหา N-body ทั่วไป (GNP) โครงสร้างข้อมูลแบบลำดับชั้นการค้นหาเพื่อนบ้านที่ใกล้ที่สุดวิธีรวดเร็วหลายวิธี การรวมกันของ Monte Carlo, Markov Chain Monte Carlo, Monte Carlo SVD
ฉันจะจัดการปัญหาที่ใหญ่ขึ้นได้อย่างไร EM แบบขนาน / กระจาย, ขนาน / กระจาย GNP; วิธีการ subgradient สุ่มการเรียนรู้ออนไลน์
ฉันจะใช้ทั้งหมดนี้ในโลกแห่งความจริงได้อย่างไร ภาพรวมของส่วนต่าง ๆ ของ ML การเลือกระหว่างวิธีการที่จะใช้สำหรับงานแต่ละงานความรู้ก่อนหน้าและสมมติฐาน การวิเคราะห์ข้อมูลเชิงสำรวจและการสร้างภาพข้อมูล การประเมินและการตีความโดยใช้ช่วงความมั่นใจและการทดสอบสมมติฐาน ROC curves ที่ปัญหาการวิจัยใน ML คือ