เมทริกซ์เคอร์เนล RBF มีแนวโน้มว่าจะไม่ดีหรือไม่?


10

ฉันใช้ฟังก์ชั่นเคอร์เนล RBF เพื่อใช้อัลกอริทึมการเรียนรู้ของเคอร์เนล (KLPP) หนึ่งตัวเคอร์เนลผลลัพธ์ แสดงว่ามีสภาพที่ไม่ดีอย่างยิ่งจำนวนเงื่อนไขของ L2-norm มาK

K(i,j)=exp((xixj)2σm2)
10171064

มีวิธีใดบ้างที่จะทำให้ห้องปรับอากาศมีสภาพดี? ฉันเดาว่าต้องมีการปรับพารามิเตอร์แต่ฉันไม่ทราบว่าจะต้องทำอย่างไรσ

ขอบคุณ!


1
ดีถ้าคุณทำ σmยิ่งคุณปรับปรุงจำนวนเงื่อนไขน้อยลง
user189035

คำตอบ:


11

ลดความกว้างของเคอร์เนล σm มักจะลดจำนวนเงื่อนไข

อย่างไรก็ตามการฝึกอบรมเคอร์เนลสามารถกลายเป็นเอกพจน์หรือใกล้กับเอกพจน์สำหรับฟังก์ชั่นพื้นฐานหรือการกระจายจุดใด ๆ ให้ฟังก์ชั่นพื้นฐานที่ทับซ้อนกัน เหตุผลนี้ค่อนข้างง่ายมาก:

  • เมทริกซ์เคอร์เนล K เป็นเอกเทศเมื่อดีเทอร์มีแนนต์ det(K) เป็นศูนย์
  • การสลับสองจุดและในการแก้ไขของคุณนั้นเทียบเท่ากับการแลกเปลี่ยนสองแถวในโดยสมมติว่าจุดทดลองของคุณยังคงที่xixjK
  • การสลับสองแถวในเมทริกซ์จะเปลี่ยนสัญลักษณ์ของดีเทอร์มีแนนต์

ทีนี้ลองนึกภาพการเลือกสองจุดและแล้วค่อย ๆ หมุนมันเพื่อที่จะเปลี่ยนสถานที่ ในขณะที่ทำสิ่งนี้ดีเทอร์มิแนนต์ของจะเปลี่ยนเครื่องหมายกลายเป็นศูนย์ ณ จุดใดจุดหนึ่งในระหว่าง ณ จุดนี้คือตามนิยามเอกพจน์xixjKK


ไม่ใช่เมทริกซ์ K สมมาตร - การสลับสองจุดจะสลับแถวและคอลัมน์?
ปฏิเสธ

@Denis นั่นเป็นเพียงกรณีที่โหนดและจุดทดลองของคุณเหมือนกันและคุณย้ายทั้งคู่ นี่เป็นเหตุผลว่าทำไมในกระสุนนัดที่สองฉันเขียนว่า "สมมติว่าจุดทดลองใช้ของคุณคงที่"
Pedro

เคอร์เนลเมทริกซ์ของ Gaussians (คำถามของ OP) เป็นแบบกึ่งบวกแน่นอนหรือไม่
เดนิส

@Denis: อีกครั้งนี่เป็นคำถามของวิธีการที่คุณกำหนดปัญหาการแก้ไข RBF ของคุณ พิจารณากรณีทั่วไปมากที่สุดที่คุณได้ RBFs แน่นิ่งอยู่บนจุด ,และคุณต้องการที่จะลดการแก้ไขที่ Theจุด ,M ตัวอย่างโปสเตอร์ของสมมติและ\หากเราตั้งค่าและแรกและจากนั้นย้ายเราสามารถสร้างเอกพจน์ได้เล็กน้อย Nxii=1NMξjj=1MM=Nξj=xiMNξjxixiK
Pedro

3

ข้อเสนอแนะสองสามข้อ:

  1. เลือกระยะทางเฉลี่ย | สุ่ม - ใกล้ที่สุดx_i(การประมาณราคาถูกสำหรับจุดกระจายอย่างสม่ำเสมอในคิวบ์หน่วยใน , คือ 0.5 / ) เราต้องการมีขนาดใหญ่สำหรับใกล้ , เล็กสำหรับเสียงพื้นหลัง; พล็อตที่สุ่มไม่กี่xσxxiNRd,d 2..5N1/d
    ϕ(|xxi|)xixx

  2. เลื่อนออกจาก 0, ,หรือมากกว่านั้น; นั่นคือทำให้เป็นปกติKKK+λIλ106

  3. ดูที่น้ำหนักจากการแก้f หากบางคนยังคงมีขนาดใหญ่ (โดยไม่คำนึงถึงหมายเลขเงื่อนไข) นั่นก็มีแนวโน้มที่จะยืนยัน Boyd (ด้านล่าง) ว่า Gaussian RBF นั้นอ่อนแอโดยพื้นฐาน(K+λI)w=f

(ทางเลือกหนึ่งสำหรับ RBF คือการถ่วงน้ำหนักทางผกผัน, IDW มันมีข้อดีของการปรับขนาดอัตโนมัติแบบเดียวกันสำหรับระยะทางที่ใกล้ที่สุด 1 2 3 สำหรับ 100 200 300 นอกจากนี้ฉันพบตัวเลือกผู้ใช้อย่างชัดเจนของจำนวน จากเพื่อนบ้านที่ใกล้เคียงที่ต้องพิจารณาชัดเจนกว่าการค้นหากริดบน )Nnearσ,λ

John P. Boyd ความไร้ประโยชน์ของ Fast Gauss Transform สำหรับการสรุปฟังก์ชั่นพื้นฐานแบบเกาส์เรเดียนกล่าว

การแก้ไขแบบเกาส์ RBF นั้นเป็นแบบไม่ดีสำหรับซีรีย์ส่วนใหญ่ในแง่ที่ว่าการแก้ไขนั้นมีความแตกต่างกันเล็กน้อยกับค่าสัมประสิทธิ์ขนาดใหญ่

หวังว่านี่จะช่วยได้; กรุณาแบ่งปันประสบการณ์ของคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.