เมื่อใช้ SVM เราต้องเลือกเคอร์เนล
ฉันสงสัยว่าจะเลือกเคอร์เนลอย่างไร เกณฑ์การเลือกเคอร์เนลใด ๆ
เมื่อใช้ SVM เราต้องเลือกเคอร์เนล
ฉันสงสัยว่าจะเลือกเคอร์เนลอย่างไร เกณฑ์การเลือกเคอร์เนลใด ๆ
คำตอบ:
เคอร์เนลเป็นการวัดความคล้ายคลึงกันอย่างมีประสิทธิภาพดังนั้นการเลือกเคอร์เนลตามความรู้ก่อนหน้าของ invariances ตามที่ Robin แนะนำ (+1) เป็นแนวคิดที่ดี
ในกรณีที่ไม่มีความรู้จากผู้เชี่ยวชาญเคอร์เนล Radial Basis จะสร้างเคอร์เนลเริ่มต้นที่ดี (เมื่อคุณสร้างแล้วมันเป็นปัญหาที่ต้องใช้โมเดลที่ไม่ใช่เชิงเส้น)
ตัวเลือกของเคอร์เนลและพารามิเตอร์เคอร์เนล / การทำให้เป็นมาตรฐานสามารถเป็นไปโดยอัตโนมัติโดยปรับการเลือกรุ่นตามข้ามวัลดีดี (หรือใช้รัศมี - ขอบหรือขยายขอบเขต) สิ่งที่ง่ายที่สุดที่จะทำคือการลดเกณฑ์การเลือกแบบต่อเนื่องให้น้อยที่สุดโดยใช้วิธี Nelder-Mead simplex ซึ่งไม่ต้องการการคำนวณแบบไล่ระดับสีและทำงานได้ดีกับตัวเลขไฮเปอร์พารามิเตอร์ที่เหมาะสม หากคุณมีพารามิเตอร์ไฮเปอร์มากกว่าสองสามตัวในการปรับแต่งการเลือกรุ่นอัตโนมัติน่าจะส่งผลให้เกิดการปรับตัวที่รุนแรงเกินไปเนื่องจากความแปรปรวนของเกณฑ์การเลือกรุ่น เป็นไปได้ที่จะใช้การปรับให้เหมาะสมแบบไล่ระดับสี แต่โดยทั่วไปแล้วการเพิ่มประสิทธิภาพจะไม่คุ้มค่ากับความพยายามในการเขียนโค้ด)
ตัวเลือกแบบอัตโนมัติของเมล็ดและพารามิเตอร์เคอร์เนล / การทำให้เป็นมาตรฐานนั้นเป็นปัญหาที่ยุ่งยากเนื่องจากเป็นเรื่องง่ายที่จะปรับให้เหมาะกับเกณฑ์การเลือกรุ่น (โดยทั่วไปจะใช้การตรวจสอบข้าม) และคุณสามารถจบลงด้วยรุ่นที่แย่กว่าที่คุณเริ่ม การเลือกรุ่นโดยอัตโนมัติยังสามารถทำให้การประเมินผลมีอคติได้ดังนั้นให้แน่ใจว่าการประเมินประสิทธิภาพของคุณประเมินกระบวนการทั้งหมดของการปรับแบบจำลอง (การฝึกอบรมและการเลือกแบบจำลอง) สำหรับรายละเอียดดู
GC Cawley และ NLC Talbot ป้องกันการปรับตัวเกินในการเลือกแบบจำลองผ่านการปรับค่าพารามิเตอร์แบบไฮเปอร์, วารสารการวิจัยการเรียนรู้ของเครื่องจักร, เล่ม 8, หน้า 841-861, เมษายน 2550 (pdf)
และ
GC Cawley และ NLC Talbot, การเลือกรุ่นที่มากเกินไปและความลำเอียงที่เลือกในการประเมินประสิทธิภาพ, วารสารการวิจัยการเรียนรู้ของเครื่อง, บทที่ 11, pp. 2079-2107, กรกฎาคม 2010 (pdf)
หากคุณไม่แน่ใจว่าอะไรจะดีที่สุดคุณสามารถใช้เทคนิคการเลือกอัตโนมัติ (เช่นการตรวจสอบความถูกต้องของข้อมูล, ... ) ในกรณีนี้คุณยังสามารถใช้ตัวแยกประเภทร่วมกัน (หากปัญหาของคุณคือการจำแนกประเภท) ที่ได้รับจากเคอร์เนลที่แตกต่างกัน
อย่างไรก็ตาม "ข้อดี" ของการทำงานกับเคอร์เนลคือคุณเปลี่ยนรูปทรงเรขาคณิต "Euclidean" ตามปกติเพื่อให้เหมาะกับปัญหาของคุณเอง นอกจากนี้คุณควรพยายามที่จะเข้าใจสิ่งที่เป็นความสนใจของเคอร์เนลสำหรับปัญหาของคุณคืออะไรโดยเฉพาะรูปทรงเรขาคณิตของปัญหาของคุณ ซึ่งอาจรวมถึง:
ฉันมักจะรู้สึกว่าการเลือกพารามิเตอร์ไฮเปอร์ใด ๆ สำหรับ SVM จะทำผ่านการตรวจสอบข้ามร่วมกับการค้นหากริด
โดยทั่วไปเคอร์เนล RBF เป็นตัวเลือก rst ที่เหมาะสมนอกจากนี้เคอร์เนลเชิงเส้นเป็นกรณีพิเศษของ RBF โดยเฉพาะอย่างยิ่งเมื่อจำนวนของคุณลักษณะมีขนาดใหญ่มากหนึ่งอาจใช้เคอร์เนลเชิงเส้น