Gaussian RBF กับเคอร์เนล Gaussian


18

ความแตกต่างระหว่างการทำการถดถอยเชิงเส้นด้วยฟังก์ชั่น Gaussian Radial Basis (RBF) และการถดถอยเชิงเส้นด้วยเคอร์เนล Gaussian คืออะไร?


ยินดีต้อนรับสู่เว็บไซต์ @ user35965 โปรดสะกดคำย่อของคุณ โดย "RBF" คุณหมายถึงฟังก์ชันพื้นฐานของรัศมีหรือไม่?
gung - Reinstate Monica

2
ใช่นั่นคือสิ่งที่ฉันหมายถึง exatcty บันทึกไว้อย่างถูกต้องสำหรับการอ้างอิงในอนาคต
user35965

คำตอบ:


19

ความแตกต่างที่แท้จริงเพียงอย่างเดียวคือในการทำให้เป็นมาตรฐานที่ใช้ เครือข่าย RBF ที่ทำเป็นปกติโดยทั่วไปจะใช้บทลงโทษตามเกณฑ์กำลังสองของน้ำหนัก สำหรับรุ่นเคอร์เนลบทลงโทษมักจะอยู่ในเกณฑ์ปกติกำลังสองของน้ำหนักของตัวแบบเชิงเส้นที่สร้างขึ้นโดยปริยายในพื้นที่คุณลักษณะที่เกิดจากเคอร์เนล ความแตกต่างในทางปฏิบัติที่สำคัญสิ่งนี้ทำให้การลงโทษสำหรับเครือข่าย RBF ขึ้นอยู่กับศูนย์กลางของเครือข่าย RBF (และจากตัวอย่างของข้อมูลที่ใช้) ในขณะที่เคอร์เนล RBF พื้นที่คุณลักษณะที่เหนี่ยวนำจะเหมือนกันโดยไม่คำนึงถึงตัวอย่างของ ข้อมูลเพื่อการลงโทษเป็นโทษในฟังก์ชั่นของรูปแบบมากกว่าในตัวparameterisation

กล่าวอีกนัยหนึ่งสำหรับทั้งสองรุ่นเรามี

(x')=Σผม=1αผมK(xผม,x')

สำหรับแนวทางเครือข่าย RBF เกณฑ์การฝึกอบรมคือ

L=Σผม=1(Yผม-(xผม))2+λα2

สำหรับวิธีการ RBF เคอร์เนลเรามีที่และW = Σ ฉัน= 1 α ฉัน φ ( xฉัน ) นี่หมายความว่าการปรับค่าบรรทัดฐานกำลังสองกับน้ำหนักของแบบจำลองในพื้นที่คุณลักษณะที่เหนี่ยวนำให้เกิดwสามารถเขียนได้ในแง่ของพารามิเตอร์คู่, αเป็นK(x,x')=φ(x)φ(x')W=Σผม=1αผมφ(xผม)Wα

W2=αTKα,

โดยที่คือ matix ของการประเมินผลแบบคู่ที่ชาญฉลาดของเคอร์เนลสำหรับรูปแบบการฝึกอบรมทั้งหมด เกณฑ์การฝึกอบรมนั้นK

อัลฟ่าL=Σผม=1(Yผม-(xผม))2+λαTKα

ข้อแตกต่างระหว่างสองรุ่นคือในระยะการทำให้เป็นมาตรฐานK

ข้อได้เปรียบทางทฤษฎีที่สำคัญของแนวทางเคอร์เนลคือช่วยให้คุณสามารถตีความตัวแบบที่ไม่ใช่เชิงเส้นเป็นตัวแบบเชิงเส้นหลังจากการแปลงแบบไม่เชิงเส้นแบบตายตัวซึ่งไม่ได้ขึ้นอยู่กับตัวอย่างของข้อมูล ดังนั้นทฤษฎีการเรียนรู้เชิงสถิติใด ๆ ที่มีอยู่สำหรับตัวแบบเชิงเส้นจะถูกถ่ายโอนไปยังแบบที่ไม่ใช่เชิงเส้นโดยอัตโนมัติ อย่างไรก็ตามทั้งหมดนี้พังลงทันทีที่คุณลองและปรับพารามิเตอร์ของเคอร์เนล ณ จุดที่เรากลับไปที่จุดเดิมในทางทฤษฎีเหมือนกับที่เราพูดกับเครือข่ายประสาท RBF (และ MLP) ดังนั้นข้อได้เปรียบทางทฤษฎีอาจไม่ดีเท่าที่เราต้องการ

มีแนวโน้มที่จะสร้างความแตกต่างที่แท้จริงในแง่ของประสิทธิภาพหรือไม่ อาจจะไม่มาก ทฤษฎี "ไม่มีอาหารกลางวันฟรี" แนะนำว่าไม่มีความเหนือกว่าของอัลกอริธึมเหนือสิ่งอื่นใดและความแตกต่างในการทำให้เป็นมาตรฐานนั้นค่อนข้างบอบบางดังนั้นหากสงสัยลองทั้งคู่และเลือกสิ่งที่ดีที่สุดตามการตรวจสอบข้าม


1
α2=αTผมααTKαKผมK

Kφ(x)

Kα'2αTKα=μαTผมα
Dikran Marsupial

ขอขอบคุณ. ฉันจะไตร่ตรองเรื่องนี้จะกลับมาหาคุณ ในขณะนี้ดูเหมือนว่าฉันไม่ได้อยู่ในระดับความเข้าใจของคุณ ฉันต้องคิดมากขึ้น :)
Cagdas Ozgenc

@CagdasOzgenc ไม่มีปัญหาข้อความมาตรฐานส่วนใหญ่อธิบายผ่าน eigenfunctions ของฟังก์ชั่นเคอร์เนลซึ่งทำให้สมองของฉันเจ็บปวดเช่นกัน! ; o)
Dikran Marsupial
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.