การทำความเข้าใจกับพารามิเตอร์ฟังก์ชันของ Gaussian Basis ที่จะใช้ในการถดถอยเชิงเส้น


12

ฉันต้องการใช้ฟังก์ชันพื้นฐานแบบเกาส์เซียนในการนำการถดถอยเชิงเส้นมาใช้ น่าเสียดายที่ฉันมีปัญหาในการทำความเข้าใจกับพารามิเตอร์สองตัวในฟังก์ชันพื้นฐาน โดยเฉพาะμและσσ

ชุดข้อมูลของฉันคือ 10,000 x 31 เมทริกซ์ 10,000 ตัวอย่างและ 31 คุณสมบัติ ฉันได้อ่านแล้วว่า "ฟังก์ชันพื้นฐานแต่ละตัวแปลงเวกเตอร์อินพุต x เป็นค่าสเกลาร์" ดังนั้นฉันถือว่า x เป็น 1 ตัวอย่างดังนั้นเวกเตอร์ 1 x 31 จากที่นี่ฉันสับสน สิ่งที่แน่นอนคือμjพารามิเตอร์? ฉันได้อ่านแล้วว่าสิ่งนี้ควบคุมตำแหน่งของฟังก์ชันพื้นฐาน ดังนั้นนี่ไม่ใช่ความหมายของบางสิ่ง? ฉันถูกโยนโดยตัวห้อย j ( μและϕ ) นี่ทำให้ฉันคิดว่าแถวที่ j แต่ดูเหมือนจะไม่สมเหตุสมผล เป็นμjเวกเตอร์? ตอนนี้สำหรับσว่า "ควบคุมระดับเชิงพื้นที่" มันคืออะไรกันแน่? ฉันเห็นการใช้งานบางอย่างที่ลองใช้ค่าเช่น. 1, .5, 2.5 สำหรับพารามิเตอร์นี้ ค่าเหล่านี้คำนวณอย่างไร ฉันค้นคว้าและมองหาตัวอย่างเพื่อการเรียนรู้ แต่ ณ ตอนนี้ฉันยังไม่พบอะไรเลย ความช่วยเหลือหรือทิศทางเป็นที่นิยมอย่างมาก! ขอบคุณ.

คำตอบ:


11

ในขณะที่คุณสับสนให้ฉันเริ่มต้นด้วยการระบุปัญหาและการตอบคำถามของคุณทีละคน คุณมีขนาดของกลุ่มตัวอย่าง 10,000 คนและแต่ละกลุ่มตัวอย่างมีการอธิบายโดยคุณลักษณะเวกเตอร์ 31 หากคุณต้องการดำเนินการถดถอยโดยใช้ฟังก์ชันพื้นฐานแบบเกาส์เรเดียนแล้วกำลังมองหาฟังก์ชันของรูปแบบf ( x ) = j w jg j ( x ; μ j , σ j ) , j = 1 .. mโดยที่กรัมฉันxR31

f(x)=jwjgj(x;μj,σj),j=1..m
giฟังก์ชั่นพื้นฐานของคุณคืออะไร โดยเฉพาะคุณต้องไปหาน้ำหนักW Jเพื่อให้สำหรับพารามิเตอร์ที่กำหนดμ เจและσ Jคุณลดข้อผิดพลาดในระหว่างปีและการคาดการณ์ที่สอดคล้องY = F ( x ) - โดยทั่วไปแล้วคุณจะลดข้อผิดพลาดสี่เหลี่ยมน้อยmwjμjσjyy^f(x^)

พารามิเตอร์ subscript j ของ Mu คืออะไร

คุณต้องไปหาฟังก์ชั่นพื้นฐานกรัมเจ (คุณยังจำเป็นต้องกำหนดหมายเลขm ) แต่ละฟังก์ชันพื้นฐานจะมีμ jและ a σ j (ยังไม่ทราบ) ห้อยเจช่วงจาก1ไปม.mgjmμjσjj1m

เป็นเวกเตอร์?μj

ใช่มันเป็นจุดใน 31 กล่าวอีกนัยหนึ่งมันคือจุดหนึ่งในพื้นที่คุณลักษณะของคุณและต้องกำหนดμสำหรับฟังก์ชันพื้นฐานแต่ละmR31μm

ฉันได้อ่านแล้วว่าสิ่งนี้ควบคุมตำแหน่งของฟังก์ชันพื้นฐาน ดังนั้นนี่ไม่ใช่ความหมายของบางสิ่ง?

jthμj

ตอนนี้สำหรับซิกมาที่ "ควบคุมระดับเชิงพื้นที่" มันคืออะไรกันแน่?

σ

R1R2R1σσσσσ

R1xgj(x)gj(x)gj(x)

ฟังก์ชั่นพื้นฐานแต่ละแปลงเวกเตอร์ x ป้อนเข้าเป็นค่าสเกลาร์

xR31

exp(xμj222σj2)

คุณจะได้สเกลาร์เป็นผล ผลลัพธ์สเกลาร์ขึ้นอยู่กับระยะทางของจุดจากจุดศูนย์กลางให้ไว้โดยและเกลา\xμjxμjσj

ฉันเห็นการใช้งานบางอย่างที่ลองใช้ค่าเช่น. 1, .5, 2.5 สำหรับพารามิเตอร์นี้ ค่าเหล่านี้คำนวณอย่างไร

หลักสูตรนี้เป็นหนึ่งในแง่มุมที่น่าสนใจและยากของการใช้ฟังก์ชั่นพื้นฐานแบบเกาส์เรเดียน หากคุณค้นหาเว็บคุณจะพบคำแนะนำมากมายเกี่ยวกับการพิจารณาพารามิเตอร์เหล่านี้ ฉันจะร่างในแง่ง่าย ๆ ความเป็นไปได้อย่างหนึ่งขึ้นอยู่กับการจัดกลุ่ม คุณสามารถค้นหาสิ่งนี้และคำแนะนำอื่น ๆ ได้ทางออนไลน์

เริ่มต้นด้วยการจัดกลุ่มตัวอย่าง 10,000 ตัวอย่างของคุณ (คุณสามารถใช้ PCA เพื่อลดขนาดตามด้วยการทำคลัสเตอร์ k-Means) คุณสามารถให้เป็นจำนวนกลุ่มที่คุณพบ (โดยทั่วไปจะใช้การตรวจสอบความถูกต้องข้ามเพื่อกำหนดดีที่สุด) ตอนนี้สร้างฟังก์ชันพื้นฐานเรเดียลสำหรับแต่ละคลัสเตอร์ สำหรับฟังก์ชันพื้นฐานแต่ละแนวรัศมีให้เป็นศูนย์กลาง (เช่นค่าเฉลี่ย, เซนทรอยด์, ฯลฯ ) ของคลัสเตอร์ ให้สะท้อนความกว้างของกระจุกดาว (เช่นรัศมี ... ) ตอนนี้ไปข้างหน้าและทำการถดถอยของคุณ (คำอธิบายง่ายๆนี้เป็นเพียงภาพรวม - มันต้องการงานจำนวนมากในแต่ละขั้นตอน!)mmgjμjσj

* แน่นอนเส้นโค้งระฆังถูกกำหนดจาก -ถึงดังนั้นจะมีค่าทุกที่ในบรรทัด อย่างไรก็ตามค่าที่อยู่ห่างจากจุดศูนย์กลางนั้นเล็กน้อยมาก


คำตอบที่ดี! อย่างไรก็ตามการค้นหาเราไม่จบด้วยการสนับสนุน vector machine regression (ด้วยเคอร์เนล gaussian) ใช่ไหม μ
O_Devinyak

@ O_Devinyak- วิธีการขยายแบบพื้นฐานจะต้องมีการประมาณค่าพารามิเตอร์ มีหลายวิธีในการค้นหาดังนั้นฉันจึงไม่คิดว่านี่แปลว่าเรากำลังลดปัญหาให้กับ SVR ตามจริงแล้วฉันไม่ใช่ผู้เชี่ยวชาญเกี่ยวกับ SVR แต่ฟังก์ชั่นการสูญเสียที่ถูกย่อเล็กสุดนั้นแตกต่างกันอย่างแน่นอนและฉันมั่นใจว่าฟีเจอร์หลายอย่างจะถูกเพิกเฉยนั่นคือวิธีการสนับสนุนเวกเตอร์ ด้วยฟังก์ชั่นพื้นฐานที่เราใช้ฟังก์ชั่นทั้งหมดสำหรับการประเมินผล แต่โชคดีที่การสนับสนุนที่กะทัดรัดช่วยให้ฟังก์ชั่นพื้นฐานจำนวนมากส่งคืนค่าที่ไม่ได้รับหรือเป็นศูนย์ อย่างไรก็ตามมันจะทำให้เป็นคำถามที่ดีในฟอรั่มนี้μ
martino

ทำไมเราต้องการสเกลแทนที่จะเป็นเมทริกซ์ความแปรปรวนร่วมซึ่งจะทำให้ฟังก์ชันพื้นฐานดูเหมือนส่วนอธิบายของเกาส์หลายตัวแปร σj
stackunderflow

1

ฉันขอคำอธิบายง่ายๆ ในสัญกรณ์ดังกล่าวสามารถเป็นหมายเลขแถวได้ แต่อาจเป็นหมายเลขคุณลักษณะได้เช่นกัน ถ้าเราเขียนจากนั้นหมายถึงหมายเลขคุณลักษณะคือคอลัมน์ - เวกเตอร์เป็นสเกลาร์และเป็นคอลัมน์ เวกเตอร์ ถ้าเราเขียนดังนั้นหมายถึงหมายเลขแถวคือสเกลาร์,คือคอลัมน์ - เวกเตอร์และเป็นแถวของเวกเตอร์ สัญกรณ์ที่หมายถึงคอลัมน์แถวและหมายถึงทั่วไปมากขึ้นดังนั้นให้เราใช้ตัวแปรแรกjy=β0+j=1:31βjϕj(x)jyβjϕj(x)yj=βϕj(x)jyjβϕj(x)ij

แนะนำฟังก์ชั่นพื้นฐานเสียนเข้าสู่การถดถอยเชิงเส้น, (เกลา) ตอนนี้ไม่ได้ขึ้นอยู่กับค่าตัวเลขของคุณลักษณะ (เวกเตอร์) แต่ในระยะทางระหว่างและศูนย์กลางของทุกจุดอื่น ๆ\ในลักษณะดังกล่าวไม่ได้ขึ้นอยู่กับว่าค่าคุณลักษณะ -th ของสังเกต -th สูงหรือขนาดเล็ก แต่ขึ้นอยู่กับว่าค่าคุณลักษณะ -th อยู่ใกล้หรือไกลจากค่าเฉลี่ยสำหรับการที่ -feature . ดังนั้นไม่ใช่พารามิเตอร์เนื่องจากไม่สามารถปรับได้ มันเป็นเพียงคุณสมบัติของชุดข้อมูล พารามิเตอร์x ฉันx ฉันμ ฉันy ฉันฉัน j ฉันj j μ ฉันj μ j σ 2 y y σ 2yixixiμiyijijjμijμjσ2มันเป็นค่าสเกลาร์มันควบคุมความนุ่มนวล หากมีขนาดเล็กการเปลี่ยนแปลงระยะทางเล็กน้อยจะมีผลกระทบขนาดใหญ่ (โปรดจำไว้ว่า Gaussian ที่สูงชัน: ทุกจุดที่อยู่ห่างจากจุดศูนย์กลางเล็ก ๆ จะมีค่าน้อย) หากมีขนาดใหญ่การเปลี่ยนแปลงระยะทางเล็กน้อยจะมีผลกระทบต่ำ (โปรดจำไว้ว่า gaussian แบบเรียบ: การลดลงของเมื่อเพิ่มระยะทางจากศูนย์กลางช้า) ควรหาค่าที่เหมาะสมที่สุดของ (มักพบได้จากการตรวจสอบความถูกต้องข้าม)yyσ2


0

ฟังก์ชั่นพื้นฐานแบบเกาส์เซียนในการตั้งค่าหลายตัวแปรมีศูนย์หลายตัวแปร สมมติว่าคุณแล้วเช่นกัน เกาส์เซียนจะต้องมีหลายตัวแปรเช่นโดยที่คือ เมทริกซ์ความแปรปรวนร่วม ดัชนีไม่ใช่องค์ประกอบของเวกเตอร์มันเป็นเพียงเวกเตอร์ th ในทำนองเดียวกันคือเมทริกซ์ลำดับที่ μ jR 31 e ( x - μ j ) Σ - 1 j ( x - μ j ) Σ jR 31 × 31 j j Σ j jxR31μjR31e(xμj)Σj1(xμj)ΣjR31×31jjΣjj

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.