แผนที่คุณลักษณะสำหรับเคอร์เนลเกาส์เซียน


24

ใน SVM เคอร์เนล Gaussian ถูกกำหนดเป็น: ที่x, y \ in \ mathbb {R ^ n} ผมไม่ทราบว่าสมการที่ชัดเจนของ\ พี ฉันอยากรู้

K(x,y)=exp(xy222σ2)=ϕ(x)Tϕ(y)
x,yRnϕ

ฉันยังต้องการที่จะทราบว่า

iciϕ(xi)=ϕ(icixi)
ที่ciRR ตอนนี้ฉันคิดว่ามันไม่เท่ากันเพราะการใช้เคอร์เนลจัดการกับสถานการณ์ที่ Linearierier ไม่ทำงาน ฉันรู้ϕโปรเจ็กต์ x ถึงพื้นที่ไม่มีที่สิ้นสุด ดังนั้นถ้ามันยังคงเป็นเส้นตรงไม่ว่าจะเป็นมิติใด svm ยังคงไม่สามารถทำการจำแนกที่ดีได้

ทำไมเคอร์เนลนี้แสดงถึงการเปลี่ยนแปลง? หรือคุณอ้างถึงพื้นที่ของฟีเจอร์ที่เกี่ยวข้อง?
Placidia

ใช่อะไรคือคุณสมบัติของพื้นที่ϕ()ดังนั้นϕT(x)ϕ(x)=exp(12σ2xx2)
27886

คำตอบ:


20

คุณสามารถขอรับสมการที่ชัดเจนของϕสำหรับเคอร์เนล Gaussian ผ่านการขยายตัว Tailor ชุดของex x เพื่อความง่ายในการใช้สัญสมมติสมมติxR1 :

ϕ(x)=ex2/2σ2[1,11!σ2x,12!σ4x2,13!σ6x3,]T

รายละเอียดเพิ่มเติมในสไลด์เหล่านี้ยังถูกกล่าวถึงโดย Chih-Jen Lin แห่ง NTU (สไลด์ 11 โดยเฉพาะ) โปรดทราบว่าในสไลด์ใช้เป็นพารามิเตอร์เคอร์เนลγ=12σ2

สมการใน OP เก็บเฉพาะสำหรับเคอร์เนลเชิงเส้น


2
สวัสดี แต่สมการข้างต้นนี้เหมาะกับมิติเดียวเท่านั้น
วิเวียน

ดังนั้นที่นี่เคอร์เนลที่ทำซ้ำของฮิลแบร์ตสเปซเป็นพื้นที่ย่อยของถูกต้องหรือไม่ 2
The_Anomaly

มีการแสดงอย่างชัดเจนของเคอร์เนล Laplacian หรือไม่?
เฟลิกซ์ Crazzolara

13

สำหรับเคอร์เนล psd ที่ถูกต้องใด ๆมีแผนที่คุณลักษณะเช่นนั้นmathcal} ที่จริงแล้วและการฝังไม่จำเป็นต้องมีลักษณะเฉพาะ แต่มีคู่ที่สำคัญไม่ซ้ำกันรู้จักกันในชื่อการทำซ้ำเคอร์เนล Hilbert space (RKHS)k:X×XRφ:XHk(x,y)=φ(x),φ(y)HHφ(H,φ)

The RKHS ถูกกล่าวถึงโดย: Steinwart, Hush and Scovel, คำอธิบายที่ชัดเจนของการทำซ้ำเคอร์เนลฮิลแบร์ตสเปซของ Gaussian RBF Kernels , ธุรกรรม IEEE เกี่ยวกับทฤษฎีข้อมูล 2006 ( doi , Citeseer pdf ฟรี )

มันค่อนข้างซับซ้อน แต่มันก็ลดลงเหลือดังนี้: กำหนดเหมือน en:CC

en(z):=(2σ2)nn!zneσ2z2.

ปล่อยเป็นลำดับที่ครอบคลุมทุก -tuples ของจำนวนเต็ม nonnegative; ถ้าอาจเป็น , ,และอื่น ๆ แสดงว่าองค์ประกอบ TH ของ TH tuple โดย{IJ}n:N0N0ddd=3n(0)=(0,0,0)n(1)=(0,0,1)n(2)=(0,1,1)jinij

จากนั้นส่วนประกอบของ THเป็น(x_j) ดังนั้นแผนที่เวกเตอร์ในกับเวกเตอร์เชิงซ้อนมิติที่ไม่มีที่สิ้นสุดiφ(x)j=1denij(xj)φRd

สิ่งที่เราจับได้คือเราต้องกำหนดบรรทัดฐานสำหรับเวกเตอร์เชิงซ้อนแบบไร้ขีด จำกัด เหล่านี้ในวิธีพิเศษ ดูกระดาษสำหรับรายละเอียด


Steinwart และคณะ ยังให้ตรงไปตรงมามากขึ้น (ความคิดของฉัน) ฝังเข้าไปใน , พื้นที่ฮิลแบร์ตของฟังก์ชั่นสี่เหลี่ยมจตุรัสจาก : โปรดทราบว่าเป็นตัวฟังก์ชั่นจากจะR มันคือความหนาแน่นของGaussian Dimensions ที่มีค่าเฉลี่ยและความแปรปรวนร่วม ; เฉพาะค่าคงที่ normalizing จะแตกต่างกัน ดังนั้นเมื่อเรารับ L2(Rd)RdR

Φσ(x)=(2σ)d2πd4e2σ2x22.
Φσ(x)RdRdx14σ2I
Φ(x),Φ(y)L2=[Φ(x)](t)[Φ(y)](t)dt,
เราจะได้ผลคูณของฟังก์ชันความหนาแน่นแบบเกาส์เซียนซึ่งเป็นค่าคงที่แน่นอนคูณกับฟังก์ชันความหนาแน่นแบบเกาส์ เมื่อคุณทำหนึ่งว่าโดยแล้วคงที่ตกออกมาสิ้นสุดขึ้นเป็นว่าy)tk(x,y)

สิ่งเหล่านี้ไม่ใช่ embeddings เท่านั้นที่ทำงาน

ส่วนอีกเรื่องจะขึ้นอยู่กับการแปลงฟูริเยร์ซึ่งกระดาษ Rahimi และ Recht ( คุณสมบัติแบบสุ่มสำหรับเครื่องเคอร์เนลขนาดใหญ่ , NIPS 2007) ใกล้เคียงกับเอฟเฟกต์เยี่ยม

นอกจากนี้คุณยังสามารถทำได้โดยใช้ชุดเทย์เลอร์: ได้อย่างมีประสิทธิภาพรุ่นที่ไม่มีที่สิ้นสุดของชาวชนบท Keshet และ Srebro, ประการที่ชัดเจนของเกาส์เคอร์เนล , arXiv: 1109.4603


1
ดักลาสจนผ่านให้รุ่น 1D ของ "ตรงไปตรงมามากขึ้น" ฝังในหัวข้อที่น่าสนใจที่นี่
Dougal

ที่นี่คุณจะพบคำอธิบายเพิ่มเติมที่ 'ใช้งานง่าย' ที่สามารถแมปลงในมิติที่มีขนาดเท่ากับขนาดของตัวอย่างการฝึกอบรมแม้สำหรับตัวอย่างการฝึกอบรมที่ไม่มีที่สิ้นสุด: stats.stackexchange.com/questions/80398/ …Φ

6

สำหรับฉันแล้วว่าสมการที่สองของคุณจะเป็นจริงถ้าคือการจับคู่เชิงเส้น (และด้วยเหตุนี้เป็นเคอร์เนลเชิงเส้น) เนื่องจากเคอร์เนลเกาส์เซียนนั้นไม่ใช่แบบเส้นตรงความเสมอภาคจะไม่ถูกเก็บไว้ (ยกเว้นในขีด จำกัด เมื่อไปที่ศูนย์)ϕKσ


ขอบคุณสำหรับคำตอบ. เมื่อมิติของโครงการเคอร์เนล Gaussian จะเพิ่มขึ้น และด้วยแรงบันดาลใจของคุณตอนนี้ฉันคิดว่ามันไม่เท่ากัน เนื่องจากการใช้เคอร์เนลเพียงจัดการกับสถานการณ์ที่การจำแนกเชิงเส้นไม่ทำงาน σ0
วิเวียน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.