มีแอปพลิเคชันที่ SVM ยังเหนือกว่าหรือไม่


10

อัลกอริทึม SVM นั้นค่อนข้างเก่า - ได้รับการพัฒนาในปี 1960 แต่ได้รับความนิยมอย่างมากในปี 1990 และ 2000 มันเป็นส่วนที่คลาสสิก (และค่อนข้างสวยงาม) ของหลักสูตรการเรียนรู้ของเครื่อง

วันนี้ดูเหมือนว่าในการประมวลผลสื่อ (ภาพเสียงและอื่น ๆ ) เครือข่ายประสาทเทียมมีอิทธิพลอย่างสมบูรณ์ในขณะที่ในพื้นที่อื่น ๆ การไล่ระดับสีไล่ระดับมีตำแหน่งที่แข็งแกร่งมาก

นอกจากนี้ในการแข่งขันข้อมูลล่าสุดฉันสังเกตว่าไม่มีโซลูชั่นที่ใช้ SVM

ฉันกำลังมองหาตัวอย่างแอปพลิเคชันที่ SVM ยังคงให้ผลลัพธ์ที่ทันสมัย ​​(ณ ปี 2016)

อัปเดต:ฉันต้องการมีตัวอย่างที่ฉันสามารถให้เช่นนักเรียน / เพื่อนร่วมงานเมื่ออธิบาย SVM เพื่อให้ดูเหมือนว่าวิธีการทางทฤษฎีหรือเลิกใช้หมดจด


3
เหนือกว่าในแง่ใด การวัดประสิทธิภาพบางอย่าง? การฝึกอบรมโครงข่ายประสาทส่วนลึกนั้นต้องใช้เวลาคอมพิวเตอร์เป็นจำนวนมาก แต่ฉันสามารถฝึกอบรม SVM ที่สามารถใช้งานได้บนแล็ปท็อปของฉัน
Sycorax พูดว่า Reinstate Monica

@ user777 ฉันหมายถึงการจัดหมวดหมู่ / การถดถอยที่เหมาะสมสำหรับเขตข้อมูลแอปพลิเคชันแน่นอน ปัญหาเกี่ยวกับความซับซ้อนในการคำนวณสำหรับ DL เป็นสิ่งสำคัญ แต่นี่ไม่ใช่ขอบเขตของคำถามนี้
Alleo

คำตอบ:


11

จากบทความเราต้องการตัวจําแนกหลายร้อยตัวเพื่อแก้ปัญหาการจําแนกโลกแห่งความจริงหรือไม่? SVM พร้อมกับ Random Forest และ Gradient Booting Machines เป็นหนึ่งในอัลกอริธึมการจำแนกที่มีประสิทธิภาพสูงสุดสำหรับชุดข้อมูลขนาดใหญ่ 120+ ชุด (ใช้ความแม่นยำเป็นเมตริก)

ฉันทำการทดลองซ้ำด้วยการดัดแปลงและทำให้ตัวแยกประเภทสามตัวนี้ทำงานได้ดีกว่าตัวอื่น ๆ แต่เนื่องจากไม่มีทฤษฎีอาหารกลางวันฟรีบอกว่ามีปัญหาเสมอที่อัลกอริทึมอื่นทำงานได้ดีกว่าทั้งสาม

ใช่ฉันจะบอกว่า SVM (กับเคอร์เนล Gaussian - นั่นคือสิ่งที่ฉันใช้) ยังคงเป็นอัลกอริธึมที่เกี่ยวข้องสำหรับชุดข้อมูลที่ไม่เกี่ยวข้องกับสื่อ


สวัสดีขอบคุณสำหรับการตอบสนอง! ฉันเคยเห็นการศึกษาที่น่าสนใจนี้ เท่าที่ฉันเข้าใจความคิดคือการดูว่าตัวจําแนกให้มากโดยไม่มีการปรับแต่งอย่างจริงจัง (ในขณะที่นักวิเคราะห์ข้อมูลควรทำการปรับ IMO) การศึกษาที่เกี่ยวข้องกับพื้นที่จะเป็นที่สนใจมากขึ้น
Alleo

1
ฉันจำได้ว่า Delgado และทุกคนไม่ได้ทำการค้นหารายละเอียดมากสำหรับพารามิเตอร์ที่ดีที่สุด แต่ถ้าพวกเขาทำการค้นหาบางอย่าง คำถาม (ที่ฉันไม่มีคำตอบ) คือว่าการค้นหาที่ละเอียดยิ่งขึ้นสำหรับ hypeparameters ที่ดีที่สุดจะทำให้ได้ผลลัพธ์ที่แตกต่างกันหรือไม่ ถ้านั่นเป็นความจริงนั่นหมายความว่าอัลกอริธึมการแข่งขันสำหรับ SVM โดยทั่วไปมีความคมชัดสูงสุดในความแม่นยำสำหรับพารามิเตอร์หลายมิติซึ่งฉันคิดว่าเป็นปัจจัยลบสำหรับอัลกอริทึม
Jacques Wainer

อีกหนึ่งข้อคิดเห็นเล็กน้อยคือชุดข้อมูล UCI (ใช้สำหรับการทดสอบ) ส่วนใหญ่มีขนาดค่อนข้างเล็ก ฉันสงสัยว่านี่อาจเป็นคำอธิบายถึงผลลัพธ์ที่ไม่ดีของการส่งเสริมหรือไม่ ความท้าทายที่ยุ่งเหยิงส่วนใหญ่ (ด้วยข้อมูลจำนวนมาก) แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าของ GB
Alleo

ฉันเห็นด้วยกับชุดข้อมูลที่มีขนาดเล็ก สำหรับชุดข้อมูลขนาดใหญ่ที่ฉันใช้ป่าสุ่มในขณะนี้ - จะเริ่มใช้ GBM ทันทีที่ฉันรู้สึกสะดวกสบายมากขึ้นกับพารามิเตอร์หลายมิติ - ฉันไม่รู้ว่า GBM เป็นเรื่องสมเหตุสมผลเพียงใด
Jacques Wainer
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.