ประสิทธิภาพการถดถอยของเคอร์เนลเคอร์เนล


11

การถดถอยของสันสามารถแสดงเป็น

y^=(XX+aId)1Xx
ที่ไหน y^เป็นป้ายที่คาดการณ์ระบุเมทริกซ์วัตถุที่เรากำลังพยายามที่จะหาฉลากและเมทริกซ์ของวัตถุเช่นนั้น:Idd×dxXn×dnxi=(xi,1,...,xi,d)Rd

X=(x1,1x1,2x1,dx2,1x2,2x2,dxn,1x1,2xn,d)

เราสามารถสร้างเคอร์เนลได้ดังนี้:

y^=(K+aId)1k

โดยที่คือเมทริกซ์ของเคอร์เนลฟังก์ชันKn×nK

K=(K(x1,x1)K(x1,x2)K(x1,xn)K(x2,x1)K(x2,x2)K(x2,xn)K(xn,x1)K(xn,x2)K(xn,xn))

และเวกเตอร์คอลัมน์ของฟังก์ชันเคอร์เนลkn×1K

k=(K(x1,x)K(x2,x)K(xn,x))

คำถาม:

(a) หากมีวัตถุมากกว่าหนึ่งมิติมันสมเหตุสมผลที่จะไม่ใช้เมล็ดหรือไม่ เช่นปล่อยให้xiX เป็น 50×3 เมทริกซ์นั้น XX จะเป็น 3×3 และเราจะกลับมาเป็นก 3×3 เมทริกซ์แทน 50×50เมทริกซ์ที่เราจะต้องกลับกันคือเราต้องใช้เมล็ด นี่หมายความว่าถ้าdn เราไม่ควรใช้เมล็ด

(b) ควรใช้เคอร์เนลที่ง่ายที่สุดที่เป็นไปได้หรือไม่ ดูเหมือนว่าเมล็ดในการถดถอยของสันถูกนำมาใช้เพื่อลบล้างอิทธิพลของมิติและไม่ใช้คุณสมบัติบางอย่างของพื้นที่คุณลักษณะ (ซึ่งแตกต่างจากเครื่องเวกเตอร์สนับสนุน) ถึงแม้ว่าเมล็ดสามารถเปลี่ยนระยะทางระหว่างวัตถุต่าง ๆ ได้ดังนั้นเมล็ดที่นิยมใช้ในการถดถอยของสันเขา?

(c) สิ่งที่เป็น O ความซับซ้อนของเวลาของการถดถอยของสันเขาและ / หรือการถดถอยของเคอร์เนลของเคอร์เนล?


'ประสิทธิภาพ' มีความหมายแตกต่างกันในสถิติ คุณหมายถึง 'computational complex' หรือเปล่า (ในชื่อ)
Memming

ฉันหมายถึง "ประสิทธิภาพอัลกอริทึม" แม้ว่ามันจะเป็นจริงที่คำถามของฉันจะลดสิ่งนี้ลงเป็น "ความซับซ้อนในการคำนวณ"
Helix

คำตอบ:


5

(a) วัตถุประสงค์ของการใช้เคอร์เนลคือการแก้ปัญหาการถดถอยแบบไม่เชิงเส้นในกรณีนี้ เคอร์เนลที่ดีจะช่วยให้คุณแก้ปัญหาในพื้นที่ฟีเจอร์ที่ไม่มีที่สิ้นสุด แต่ใช้เคอร์เนลเชิงเส้นK(x,y)=xy และการทำเคอร์เนลริดจ์ถดถอยในพื้นที่คู่นั้นเหมือนกับการแก้ปัญหาในพื้นที่แรกนั่นคือมันไม่ได้ประโยชน์อะไรเลย (มันช้ากว่ามากเมื่อจำนวนตัวอย่างเพิ่มขึ้นตามที่คุณสังเกต)

(b) หนึ่งในตัวเลือกที่ได้รับความนิยมมากที่สุดคือเคอร์เนลเอ็กซ์โปเนนเชียลกำลังสอง K(x,y)=exp(τ2||xy||2)ซึ่งเป็นสากล (ดูอ้างอิงด้านล่าง) มีเมล็ดจำนวนมากและแต่ละอันจะทำให้เกิดผลิตภัณฑ์ภายในที่แตกต่างกัน

(c) การดำเนินการที่ตรงไปตรงมาจำเป็นต้องมีการแก้สมการเชิงเส้นของขนาด nดังนั้นมันเป็น O(n3). มีวิธีการประมาณที่เร็วกว่ามากมายเช่นNyströmการประมาณ นี่เป็นส่วนหนึ่งของการวิจัยเชิงรุก

อ้างอิง:

  1. Bharath Sriperumbudur, Kenji Fukumizu และ Gert Lanckriet ในความสัมพันธ์ระหว่างความเป็นสากลลักษณะของเมล็ดและการฝังตัวของมาตรการ RKHS วารสารวิจัยการเรียนรู้ของเครื่อง, 9: 773–780, 2010
  2. Bernhard Schlkopf, Alexander J. Smola การเรียนรู้กับเมล็ด: สนับสนุนเครื่องเวกเตอร์, การทำให้เป็นมาตรฐาน, การปรับให้เหมาะสมและเกินกว่าปี 2002
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.