เชิงเส้นตรงกับ RKHS- การถดถอย


9

ฉันกำลังศึกษาความแตกต่างระหว่างการทำให้เป็นปกติในการถดถอย RKHS และการถดถอยเชิงเส้น แต่ฉันมีเวลายากที่จะเข้าใจความแตกต่างที่สำคัญระหว่างทั้งสอง

รับคู่อินพุต - เอาต์พุต (xi,yi)ฉันต้องการประเมินฟังก์ชั่น f() ดังนี้

f(x)u(x)=i=1mαiK(x,xi),
ที่ไหน K(,)เป็นฟังก์ชั่นเคอร์เนล ค่าสัมประสิทธิ์αm สามารถพบได้โดยการแก้
minαRn1nYKαRn2+λαTKα,
ที่มีการละเมิดบางส่วนของโน้ตที่i,j 'รายการของเมทริกซ์เคอร์เนลวันที่KคือK(xi,xj){J})} สิ่งนี้จะให้
α=(K+λnI)1Y.
อีกวิธีหนึ่งเราสามารถรักษาปัญหาดังกล่าวเป็นปัญหาการถดถอยแบบเส้นตรง / ปัญหาการถดถอยเชิงเส้น:
minαRn1nYKαRn2+λαTα,
พร้อมทางออก
α=(KTK+λnI)1KTY.

อะไรคือความแตกต่างที่สำคัญระหว่างทั้งสองแนวทางและวิธีแก้ปัญหาของพวกเขา



@MThQ - คำอธิบายของคุณเกี่ยวกับการถดถอยแนวสัน 'ปกติ' ยังคงใช้ได้หรือไม่? เพียงเพื่อชี้แจงว่าฉันคิดว่าการถดถอยของสันเขาปกติจะถือว่าเป็นการทำงานครั้งแรก (ซึ่งเป็นการนำเสนอคุณลักษณะที่ชัดเจน)
rnoodle

คำตอบ:


5

ดังที่คุณอาจสังเกตเห็นเมื่อเขียนปัญหาการปรับให้เหมาะสมความแตกต่างเพียงเล็กน้อยในการย่อขนาดคือบรรทัดฐานของฮิลแบร์ตที่ใช้สำหรับการลงโทษ นั่นคือการหาปริมาณของค่าใหญ่ของสำหรับการลงโทษ ในการตั้งค่า RKHS เราใช้ผลิตภัณฑ์ภายใน RKHSในขณะที่การถดถอยของสันเขาลงโทษด้วยความเคารพต่อกฎเกณฑ์แบบยุคลิดααtKα

ผลที่ตามทฤษฎีที่น่าสนใจคือว่าวิธีการแต่ละผลกระทบคลื่นความถี่ของการทำซ้ำเคอร์เนลKตามทฤษฎีของ RKHS เรามีว่าเป็นสมการเชิงบวกแน่นอน จากทฤษฎีบทของสเปกตรัมเราสามารถเขียนโดยที่คือเมทริกซ์แนวทแยงของค่าลักษณะเฉพาะและคือเมทริกซ์แบบของ eigenvectors ดังนั้นในการตั้งค่า RKHS start ในขณะเดียวกันในการตั้งค่าการถดถอยริดจ์ให้สังเกตว่าโดยสมมาตร KKK=UtDUDU

(K+λnI)1Y=[Ut(D+λnI)U]1Y=Ut[D+λnI]1UY.
KtK=K2
(K2+λnI)1KY=[Ut(D2+λnI)U]1KY=Ut[D2+λnI]1UKY=Ut[D2+λnI]1DUY=Ut[D+λnD1]1UY.
ให้สเปกตรัมของเป็น\ใน RKHS ถดถอยค่าลักษณะเฉพาะที่มีเสถียรภาพโดย n ในการถดถอยริดจ์เรามี n เป็นผลให้ RKHS ปรับเปลี่ยนค่าลักษณะเฉพาะอย่างสม่ำเสมอในขณะที่ Ridge เพิ่มค่าที่มากขึ้นหากสอดคล้องกันมีขนาดเล็กลงKν1,,νnνiνi+λnνiνi+λn/νiνi

ขึ้นอยู่กับทางเลือกของเคอร์เนลการประมาณสองค่าสำหรับอาจใกล้หรือไกลจากกัน ระยะทางในความรู้สึกปกติของผู้ปฏิบัติงานคือ อย่างไรก็ตามสิ่งนี้ยังคงถูก จำกัด ขอบเขตสำหรับกำหนดα

αRKHSαRidge2=ARKHSYARidgeY2[D+λnI]1[D+λnD1]1Y2maxi=1,,n{|(νi+λn)1(νi+λn/νi)1|}Y2maxi=1,,n{λn|1νi|(νi+λn)(νi2+λn)}Y2
Yดังนั้นตัวประมาณสองค่าของคุณจึงไม่สามารถแยกออกจากกันได้โดยพลการ ดังนั้นหากเคอร์เนลของคุณใกล้กับตัวตนแล้วส่วนใหญ่จะมีความแตกต่างเล็กน้อยในแนวทาง ถ้าเมล็ดของคุณแตกต่างกันอย่างมากทั้งสองวิธียังสามารถนำไปสู่ผลลัพธ์ที่คล้ายกันได้

ในทางปฏิบัติมันเป็นการยากที่จะพูดอย่างชัดเจนหากคนหนึ่งดีกว่าคนอื่นสำหรับสถานการณ์ที่กำหนด เมื่อเราลดข้อผิดพลาดกำลังสองลงเมื่อแสดงข้อมูลในแง่ของฟังก์ชันเคอร์เนลเราจึงเลือกเส้นโค้งการถดถอยที่ดีที่สุดจากฟังก์ชันของ Hilbert ที่สอดคล้องกัน ดังนั้นการลงโทษด้วยความเคารพต่อผลิตภัณฑ์ภายใน RKHS ดูเหมือนจะเป็นวิธีธรรมชาติในการดำเนินการ


1
คุณมีการอ้างอิงสำหรับสิ่งนี้หรือไม่?
rnoodle
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.