กระบวนการแบบเกาส์: คุณสมบัติการประมาณฟังก์ชั่น


16

ฉันกำลังเรียนรู้เกี่ยวกับกระบวนการแบบเกาส์เซียนและเคยได้ยินเพียงส่วนน้อยเท่านั้น จะขอบคุณความคิดเห็นและคำตอบจริงๆ

สำหรับชุดข้อมูลใด ๆ เป็นความจริงหรือไม่ที่การประมาณค่าฟังก์ชันเกาส์เซียนจะทำให้เกิดข้อผิดพลาดในการปรับศูนย์หรือเล็กน้อยที่จุดข้อมูล? ในสถานที่อื่นฉันยังได้ยินว่ากระบวนการแบบเกาส์นั้นดีสำหรับข้อมูลที่มีเสียงดัง สิ่งนี้ดูเหมือนว่าจะขัดแย้งกับข้อผิดพลาดที่เหมาะสมน้อยสำหรับข้อมูลใด ๆ ที่สังเกตได้?

นอกจากนี้ยิ่งห่างจากจุดข้อมูลดูเหมือนว่ามีความไม่แน่นอนมากขึ้น (ความแปรปรวนร่วมที่มากขึ้น) ถ้าเป็นเช่นนั้นมันจะทำงานเหมือนรุ่นในตัวเครื่อง (RBF ฯลฯ ) หรือไม่?

ในที่สุดมีคุณสมบัติการประมาณสากลหรือไม่?

คำตอบ:


17

ตัวอย่างข้อมูลที่สมมติว่าเป็น N และสมมติว่าเรามีฟังก์ชันความแปรปรวนร่วมและค่าเฉลี่ยศูนย์ที่ระบุสำหรับกระบวนการ Gussian การแจกแจงสำหรับจุดใหม่จะเป็น Gaussian ที่มีค่าเฉลี่ยและความแปรปรวนV (\ mathbf {x}) = k (\ mathbf {x}, \ mathbf {x}) - \ mathbf {k} K ^ {- 1} \ \ mathbf {k} ^ T เวกเตอร์\ mathbf {k} = \ {k (\ mathbf {x}, \ mathbf {x} _1), \ ldots, k (\ mathbf {x}, \ mathbf {x} _N) \}เป็นเวกเตอร์ของโควาเรีย , เมทริกซ์K = \ {k (\ mathbf {x} _i, \ mathbf {x} _j) \} _ {i, j = 1} ^ ND=(X,y)={xi,yi=y(xi)}i=1Nk(x1,x2)x

m(x)=kK1y
V(x)=k(x,x)kK1kT.
k={k(x,x1),,k(x,xN)}K={k(xi,xj)}i,j=1Nเป็นเมทริกซ์ของค่าความแปรปรวนร่วมตัวอย่าง ในกรณีที่เราทำการทำนายโดยใช้ค่าเฉลี่ยของการกระจายหลังสำหรับคุณสมบัติการแก้ไขตัวอย่างถือ จริง ๆ
m(X)=KK1y=y.
แต่มันก็ไม่ได้เกิดขึ้นถ้าเราใช้การทำให้เป็นมาตรฐานเช่นใช้คำว่าเสียงสีขาว ในกรณีนี้เมทริกซ์ความแปรปรวนร่วมสำหรับตัวอย่างมีรูปแบบK+σIแต่สำหรับค่าความแปรปรวนร่วมที่มีค่าฟังก์ชันจริงเรามีเมทริกซ์ความแปรปรวนร่วมKและค่าเฉลี่ยหลังคือ
m(X)=K(K+σI)1yy.
นอกจากนี้การทำให้เป็นปกติจะทำให้ปัญหามีเสถียรภาพมากขึ้น

การเลือกความแปรปรวนของเสียงเราสามารถเลือกได้หากเราต้องการการแก้ไข ( ) หรือเราต้องการจัดการกับการสังเกตที่มีเสียงดัง (มีขนาดใหญ่)σσ=0σ

นอกจากนี้กระบวนการถดถอยแบบเกาส์เป็นวิธีท้องถิ่นเพราะความแปรปรวนของการคาดการณ์เติบโตขึ้นด้วยระยะทางจากตัวอย่างการเรียนรู้ แต่เราสามารถเลือกฟังก์ชันความแปรปรวนร่วมที่เหมาะสมและจัดการปัญหาที่ซับซ้อนกว่าด้วย RBF คุณสมบัติที่ดีอีกประการหนึ่งคือพารามิเตอร์จำนวนน้อย โดยปกติจะเท่ากับโดยที่คือมิติข้อมูลkO(n)n

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.