ใครสามารถอธิบายให้ฉันข้อดีและข้อเสียของการจัดหมวดหมู่ SVM ที่แตกต่างจากตัวแยกประเภทอื่น ๆ ?
ใครสามารถอธิบายให้ฉันข้อดีและข้อเสียของการจัดหมวดหมู่ SVM ที่แตกต่างจากตัวแยกประเภทอื่น ๆ ?
คำตอบ:
มีข้อดีสี่ประการ: ประการแรกมันมีพารามิเตอร์ normalization ซึ่งทำให้ผู้ใช้คิดเกี่ยวกับการหลีกเลี่ยงการกระชับ ประการที่สองจะใช้เคล็ดลับเคอร์เนลเพื่อให้คุณสามารถสร้างความรู้ผู้เชี่ยวชาญเกี่ยวกับปัญหาผ่านทางวิศวกรรมเคอร์เนล ประการที่สาม SVM ถูกกำหนดโดยปัญหาการปรับให้เหมาะสมแบบนูน (ไม่มี minima ท้องถิ่น) ซึ่งมีวิธีการที่มีประสิทธิภาพ (เช่น SMO) ท้ายที่สุดมันเป็นการประมาณค่าของขอบเขตข้อผิดพลาดในการทดสอบและมีทฤษฎีที่สำคัญอยู่เบื้องหลังซึ่งแสดงว่าควรเป็นความคิดที่ดี
ข้อเสียคือทฤษฎีนี้ครอบคลุมเฉพาะการกำหนดพารามิเตอร์สำหรับค่าที่กำหนดของพารามิเตอร์การทำให้เป็นมาตรฐานและเคอร์เนลและการเลือกเคอร์เนลเท่านั้น ในทางที่ SVM ย้ายปัญหาของการปรับให้เหมาะสมมากเกินไปจากการปรับพารามิเตอร์ให้เหมาะสมกับการเลือกแบบจำลอง รุ่นเคอร์เนลที่น่าเศร้านั้นค่อนข้างไวต่อการปรับเกณฑ์การเลือกรุ่นให้เหมาะสม
GC Cawley และ NLC Talbot, การเลือกรุ่นที่มากเกินไปและความลำเอียงในการเลือกการประเมินผลการปฏิบัติงาน, วารสารการวิจัยการเรียนรู้ของเครื่องจักร, การวิจัย 2010, บทที่ 11, pp. 2079-2107, กรกฎาคม 2010 ( pdf )
หมายเหตุอย่างไรก็ตามปัญหานี้ไม่ได้เป็นเอกลักษณ์ของวิธีเคอร์เนลวิธีการเรียนรู้ของเครื่องส่วนใหญ่มีปัญหาที่คล้ายกัน การสูญเสียบานพับที่ใช้ใน SVM ส่งผลให้มีการกระจัดกระจาย อย่างไรก็ตามบ่อยครั้งที่ตัวเลือกที่ดีที่สุดของพารามิเตอร์เคอร์เนลและการทำให้เป็นปกตินั้นหมายความว่าคุณจะได้รับข้อมูลทั้งหมดที่สนับสนุนเวกเตอร์ หากคุณต้องการเครื่องเคอร์เนลแบบกระจายให้ใช้สิ่งที่ถูกออกแบบมาให้ห่างจากจุดเริ่มต้น (แทนที่จะเป็นผลพลอยได้ที่มีประโยชน์) เช่นเครื่องเวกเตอร์ข้อมูล ฟังก์ชั่นการสูญเสียที่ใช้สำหรับการสนับสนุนการถดถอยเวกเตอร์ไม่มีการแทรกซึมทางสถิติที่เห็นได้ชัดบ่อยครั้งที่ความรู้จากผู้เชี่ยวชาญของปัญหาสามารถถูกเข้ารหัสในฟังก์ชั่นการสูญเสียเช่น Poisson หรือ Beta หรือ Gaussian เช่นเดียวกันกับปัญหาการจำแนกประเภทหลายอย่างที่คุณต้องการความน่าจะเป็นของการเป็นสมาชิกคลาส
นั่นคือทั้งหมดที่ฉันสามารถนึกได้