นี่คือเหตุผลหนึ่งว่าทำไมการกำหนดสูตรคู่จึงมีความน่าสนใจจากมุมมองการเพิ่มประสิทธิภาพเชิงตัวเลข คุณสามารถค้นหารายละเอียดในเอกสารต่อไปนี้:
Hsieh, C.-J. , Chang, K.-W. , Lin, C.-J. , Keerthi, SS, และ Sundararajan, S. ,“ วิธีการประสานงานแบบโคตรคู่สำหรับขนาด SVM เชิงเส้นขนาดใหญ่”, การดำเนินการของ การประชุมนานาชาติเรื่องการเรียนรู้ของเครื่องจักรที่เฮลซิงกิครั้งที่ 25
สูตรคู่เกี่ยวข้องกับข้อ จำกัด ความเท่าเทียมกันเลียนแบบเดียวและข้อ จำกัด ที่ถูกผูกไว้ n
1. ข้อ จำกัด ความเท่าเทียมกันของเลียนแบบสามารถ "กำจัด" ออกจากสูตรคู่ได้
สิ่งนี้สามารถทำได้โดยเพียงแค่ดูข้อมูลของคุณใน R ^ (d + 1) ผ่านการฝัง R ^ d ใน R ^ (d + 1) resuling จากการเพิ่มพิกัด "1" เดียวไปยังแต่ละจุดข้อมูลเช่น R ^ d ----> R ^ (d + 1): (a1, ... , ad) | ---> (a1, ... , โฆษณา, 1)
การทำเช่นนี้กับทุกจุดในชุดการฝึกอบรมจะทำให้เกิดปัญหาการแยกเชิงเส้นใน R ^ (d + 1) และกำจัดคำคงที่ w0 จากตัวจําแนกของคุณซึ่งจะช่วยลดข้อจํากัดความเหมือนกันจากคู่
2. ตามจุดที่ 1 คู่สามารถถูกทำให้กลายเป็นปัญหาการหาค่าเหมาะที่สุดแบบสมการกำลังสองนูนได้อย่างง่ายดาย
3. ขณะนี้สามารถแก้ไขปัญหาสองอย่างได้อย่างมีประสิทธิภาพเช่นผ่านอัลกอริธึมแบบโคตรสองพิกัดที่ให้ผลการแก้ปัญหา epsilon ที่ดีที่สุดใน O (log (1 / epsilon))
สิ่งนี้ทำได้โดยการสังเกตว่าการซ่อมอัลฟ่าทั้งหมดยกเว้นตัวเดียวให้ผลเฉลยแบบปิด จากนั้นคุณสามารถหมุนเวียนไปตามตัวอักษรทั้งหมดทีละตัว (เช่นเลือกแบบสุ่มแก้ไขตัวอักษรอื่น ๆ ทั้งหมดคำนวณแบบฟอร์มปิด) หนึ่งสามารถแสดงให้เห็นว่าคุณจะได้รับทางออกที่ดีที่สุด "ค่อนข้างเร็ว" (ดูทฤษฎีบทที่ 1 ในกระดาษข้างต้น)
มีเหตุผลอื่น ๆ อีกมากมายที่ทำให้ปัญหาสองประการนั้นน่าสนใจจากมุมมองของการปรับให้เหมาะสมซึ่งบางข้อก็ใช้ประโยชน์จากข้อเท็จจริงที่ว่ามันมีข้อ จำกัด เลียนแบบความเท่าเทียมเพียงข้อเดียวเท่านั้น ของปัญหาสอง "บ่อยที่สุดส่วนใหญ่" เป็นศูนย์ (ไม่ใช่ศูนย์ที่สอดคล้องกับเวกเตอร์สนับสนุน)
คุณสามารถรับภาพรวมที่ดีของการพิจารณาการเพิ่มประสิทธิภาพเชิงตัวเลขสำหรับ SVM จากการนำเสนอของ Stephen Wright ที่การประชุมเชิงปฏิบัติการการเรียนรู้ (2009)
PS: ฉันใหม่ที่นี่ ขออภัยในความไม่สะดวกในการใช้สัญลักษณ์ทางคณิตศาสตร์ในเว็บไซต์นี้