ฉันคิดว่ากุญแจสำคัญในเวทย์มนตร์เป็นไปอย่างราบรื่น คำตอบยาว ๆ ของฉันซึ่งต่อไปนี้เป็นเพียงการอธิบายเกี่ยวกับความลื่นไหลนี้ อาจหรือไม่อาจเป็นคำตอบที่คุณคาดหวัง
คำตอบสั้น ๆ :
กำหนดบวกแน่นอนเคอร์เนลมีอยู่พื้นที่ที่สอดคล้องกันของฟังก์ชั่นH คุณสมบัติของฟังก์ชั่นถูกกำหนดโดยเคอร์เนล ปรากฎว่าถ้าเป็นเคอร์เนลแบบเกาส์ฟังก์ชันในจะราบรื่นมาก ดังนั้นฟังก์ชั่นที่เรียนรู้ (เช่นฟังก์ชั่นการถดถอยส่วนประกอบหลักใน RKHS เช่นเดียวกับเคอร์เนล PCA) นั้นราบรื่นมาก โดยทั่วไปแล้วสมมติฐานความราบรื่นจะเหมาะสมสำหรับชุดข้อมูลส่วนใหญ่ที่เราต้องการจัดการ นี่อธิบายได้ว่าทำไมเคอร์เนลเกาส์เซียนจึงมีมนต์ขลังkHHkH
คำตอบยาวว่าทำไมเคอร์เนล Gaussian ให้การทำงานที่ราบรื่น:
เคอร์เนลที่แน่นอนเชิงบวกกำหนด (โดยนัย) ผลิตภัณฑ์ภายใน
สำหรับฟีเจอร์ vectorสร้างจากอินพุตของคุณและ
เป็นพื้นที่ฮิลแบร์ต สัญกรณ์
หมายถึงสินค้าภายในระหว่างและ(y) สำหรับจุดประสงค์ของเราคุณสามารถจินตนาการให้เป็นพื้นที่ยูคลิดตามปกติ แต่อาจมีจำนวนมิติไม่ จำกัด ลองนึกภาพเวกเตอร์ปกติที่มีความยาวไม่สิ้นสุดเช่นk ( x , Y ) = ⟨ φ ( x ) , φ ( Y ) ⟩ H φ ( x ) x H ⟨ φ ( x ) , φ ( Y ) ⟩ φ ( x ) φ ( Y ) H ϕ ( x ) = ( ϕ 1 ( xk(x,y)k(x,y)=⟨ϕ(x),ϕ(y)⟩Hϕ(x)xH⟨ϕ(x),ϕ(y)⟩ϕ(x)ϕ(y)H H f ( x ) = ⟨ f , ϕ ( x ) ⟩ f ( x )ϕ(x)=(ϕ1(x),ϕ2(x),…). ในวิธีการของเคอร์เนลเป็นช่องว่างของฟังก์ชันที่เรียกว่า reproducing kernel Hilbert space (RKHS) พื้นที่นี้มีคุณสมบัติพิเศษที่เรียกว่า `` ทำซ้ำคุณสมบัติ '' ซึ่งเป็นที่ฉ นี้กล่าวว่าในการประเมิน , แรกที่คุณสร้างเวกเตอร์คุณลักษณะ (อนันต์ยาวตามที่กล่าวไว้) สำหรับฉจากนั้นคุณสร้างเวกเตอร์คุณลักษณะของคุณสำหรับแทนด้วย (ยาวไม่สิ้นสุด) การประเมินผลนั้นได้มาจากการใช้ผลิตภัณฑ์ภายในของทั้งสอง เห็นได้ชัดว่าในทางปฏิบัติไม่มีใครสร้างเวกเตอร์ที่มีความยาวไม่สิ้นสุด เนื่องจากเราจะดูแลเกี่ยวกับผลิตภัณฑ์ภายในของเราก็ประเมินโดยตรงเคอร์เนลHf(x)=⟨f,ϕ(x)⟩f(x)fxϕ(x)f(x)k. การข้ามการคำนวณของคุณสมบัติที่ชัดเจนและการคำนวณผลิตภัณฑ์ภายในโดยตรงนั้นเรียกว่า "เคอร์เนลหลอก"
ฟีเจอร์คืออะไร?
ฉันพูดถึงคุณสมบัติโดยไม่ได้ระบุว่ามันคืออะไร รับเคอร์เนลคุณสมบัติไม่ซ้ำกัน แต่
ถูกกำหนดโดยไม่ซ้ำกัน เพื่ออธิบายความนุ่มนวลของฟังก์ชั่นให้เราพิจารณาคุณสมบัติของฟูริเยร์ สมมติว่าค่าคงที่เคอร์เนลการแปลหมายถึง
เช่นเคอร์เนลขึ้นอยู่กับความแตกต่างของอาร์กิวเมนต์สองตัวเท่านั้น เคอร์เนลเสียนมีคุณสมบัตินี้ Letแสดงว่าฟูเรียร์ของkϕ1(x),ϕ2(x),…k⟨ϕ(x),ϕ(y)⟩kk(x,y)=k(x−y)k^k
ในมุมมองฟูริเยร์นี้คุณลักษณะของ
ถูกกำหนดโดย . นี้จะบอกว่าการแสดงคุณลักษณะของการทำงานของคุณ
จะได้รับจากฟูริเยร์ของแปลงหารด้วย Fourer เปลี่ยนของเคอร์เนลkคุณลักษณะที่เป็นตัวแทนของซึ่งคือ
คือ
โดยที่{-1} หนึ่งสามารถแสดงให้เห็นว่าทรัพย์สินทำซ้ำถือ (การออกกำลังกายให้ผู้อ่าน)ff:=(⋯,f^l/k^l−−√,⋯)fkxϕ(x)(⋯,k^l−−√exp(−ilx),⋯)i=−1−−−√
เช่นเดียวกับในทุกพื้นที่ของ Hilbert องค์ประกอบทั้งหมดที่อยู่ในพื้นที่นั้นจะต้องมีบรรทัดฐานที่แน่นอน ให้เราพิจารณาบรรทัดฐานกำลังสองของ :f∈H
∥f∥2H=⟨f,f⟩H=∑∞l=−∞f^2lk^l.
ดังนั้นเมื่อไรค่าปกตินี้คือเป็นของอวกาศ? เมื่อลดลงเร็วกว่าเพื่อให้ผลรวมมาบรรจบกัน ตอนนี้การแปลงฟูริเยร์ของเคอร์เนลแบบเกาส์ff^2lk^l k(x,y)=exp(−∥x−y∥2σ2)
เป็นเสียนที่อื่นลดลงอย่างรวดเร็วด้วยการชี้แจงต่อลิตรดังนั้นหากคือการอยู่ในพื้นที่นี้ฟูริเยร์มันเปลี่ยนจะต้องลดลงได้เร็วยิ่งขึ้นกว่าที่ของkซึ่งหมายความว่าฟังก์ชั่นจะมีประสิทธิภาพเพียงไม่กี่องค์ประกอบความถี่ต่ำที่มีน้ำหนักสูง สัญญาณที่มีส่วนประกอบที่มีความถี่ต่ำเท่านั้นไม่สั่นสะเทือนมาก สิ่งนี้อธิบายว่าทำไมเคอร์เนล Gaussian ให้ฟังก์ชันที่ราบรื่นแก่คุณk^llfk
พิเศษ: แล้วเคอร์เนล Laplace ล่ะ?
หากคุณพิจารณาเคอร์เนล Laplace ,
ฟูริเยร์ของมันเปลี่ยนเป็น Cauchy กระจายซึ่งลดลงช้ากว่าชี้แจง ฟังก์ชั่นในการแปลงฟูริเยร์ของเคอร์เนลเกาส์เซียน นี่หมายความว่าฟังก์ชั่นจะมีส่วนประกอบความถี่สูงมากขึ้น เป็นผลให้ฟังก์ชั่นที่ได้รับจากเคอร์เนล Laplace คือ `` หยาบกว่า '' มากกว่าที่ได้รับจากเคอร์เนลเกาส์เซียนk(x,y)=exp(−∥x−y∥σ)f
อะไรคือคุณสมบัติของเคอร์เนลเกาส์เซียนที่เมล็ดอื่นไม่มี?
คุณสมบัติหนึ่งคือเคอร์เนลเกาส์เซียนเป็น `` universal '' สังหรณ์ใจซึ่งหมายความว่ากำหนดขอบเขตการทำงานอย่างต่อเนื่อง (พล) มีอยู่ฟังก์ชั่นเช่นว่าและ
อยู่ใกล้ (ในความหมายของสูงสุดที่ต้องการโดยพลการ โดยทั่วไปสิ่งนี้หมายถึงเคอร์เนล Gaussian ให้ฟังก์ชันที่สามารถประมาณฟังก์ชั่น "ดี" (ขอบเขต, ต่อเนื่อง) โดยพลการได้ดี เมล็ด Gaussian และ Laplace เป็นสากล เคอร์เนลพหุนามยกตัวอย่างเช่นไม่ใช่gf∈Hfg∥⋅∥∞)
ทำไมเราไม่ใส่บรรทัดฐานพูด Cauchy PDF และคาดหวังผลลัพธ์เดียวกัน
โดยทั่วไปแล้วคุณสามารถทำอะไรก็ได้ที่คุณต้องการตราบใดที่ผลลัพธ์
นั้นเป็นค่าบวกแน่นอน ความหมายเชิงบวกถูกกำหนดเป็น
สำหรับทั้งหมด ,และ
(ชุดจำนวนธรรมชาติ) . หากไม่แน่นอนแน่นอนก็จะไม่สอดคล้องกับพื้นที่ผลิตภัณฑ์ภายใน การวิเคราะห์ทั้งหมดแตกเพราะคุณไม่มีช่องว่างของฟังก์ชั่น
ตามที่กล่าวไว้ อย่างไรก็ตามมันอาจใช้งานได้จริง ตัวอย่างเช่นเคอร์เนลไฮเพอร์โบลิกแทนเจนต์ (ดูหมายเลข 7 ในหน้านี้ )k∑Ni=1∑Nj=1k(xi,xj)αiαj>0αi∈R{xi}Ni=1N∈NkH
k(x,y)=tanh(αx⊤y+c)
ซึ่งมีวัตถุประสงค์ที่จะเลียนแบบการเปิดใช้งานหน่วย sigmoid ในเครือข่ายประสาทเป็นเพียงบวกแน่นอนสำหรับการตั้งค่าของบางส่วนและคยังมีรายงานว่าใช้งานได้จริงαc
คุณสมบัติอื่น ๆ
ฉันบอกว่าคุณสมบัติไม่ซ้ำกัน สำหรับเคอร์เนลแบบเกาส์, ชุดของคุณลักษณะอื่นจะได้รับจากการขยายตัวของเมอร์เซอร์ ดูมาตรา 4.3.1 ที่มีชื่อเสียงของหนังสือเล่มกระบวนการเสียน ในกรณีนี้คุณสมบัติเป็นพหุนาม Hermite ประเมินxϕ(x)x