ปัญหาของเล่นถดถอยแบบเกาส์


9

ฉันกำลังพยายามที่จะได้รับปรีชาสำหรับการถดถอยแบบเกาส์กระบวนการดังนั้นฉันจึงสร้างปัญหาของเล่น 1D แบบง่ายๆเพื่อทดลองใช้ ฉันใช้เป็นอินพุตและเป็นคำตอบ ('ได้แรงบันดาลใจ' จากy = x ^ 2 )xi={1,2,3}yi={1,4,9}y=x2

สำหรับการถดถอยฉันใช้ฟังก์ชันเคอร์เนลเอ็กซ์โพเนนเชียลกำลังสองมาตรฐาน:

k(xp,xq)=σf2exp(12l2|xpxq|2)

ฉันสันนิษฐานว่ามีเสียงรบกวนพร้อมค่าเบี่ยงเบนมาตรฐานσnดังนั้นเมทริกซ์ความแปรปรวนร่วมจึงกลายเป็น:

Kpq=k(xp,xq)+σn2δpq

hyperparameters (σn,l,σf)อยู่ที่ประมาณโดยการเพิ่มโอกาสในการเข้าสู่ระบบของข้อมูล เพื่อให้การคาดการณ์ที่จุดxฉันพบค่าเฉลี่ยและความแปรปรวนตามลำดับโดยต่อไปนี้

μx=kT(K+σn2I)1y
σx2=k(x,x)kT(K+σn2I)1k

โดยที่kเป็นเวกเตอร์ของความแปรปรวนร่วมระหว่างxและอินพุตและyเป็นเวกเตอร์ของเอาต์พุต

ผลลัพธ์ของฉันสำหรับ1<x<3แสดงอยู่ด้านล่าง เส้นสีฟ้าคือค่าเฉลี่ยและเส้นสีแดงทำเครื่องหมายช่วงค่าเบี่ยงเบนมาตรฐาน

ผลที่ได้

ฉันไม่แน่ใจว่าสิ่งนี้ถูกต้องหรือไม่ อินพุตของฉัน (ทำเครื่องหมายโดย 'X's) ไม่ได้อยู่บนเส้นสีน้ำเงิน ตัวอย่างส่วนใหญ่ที่ฉันเห็นมีค่าเฉลี่ยตัดกับอินพุต นี่เป็นคุณสมบัติทั่วไปที่คาดหวัง


1
ถ้าฉันต้องเดาในตัวอย่างที่คุณดูไม่มีข้อผิดพลาดตกค้าง ในกรณีนั้นเส้นจะผ่านจุดทั้งหมด
ผู้ชาย

@ ซื้อถูกต้องแล้ว

คำตอบ:


10

ฟังก์ชั่นเฉลี่ยที่ผ่านดาต้าพอยน์มักจะเป็นตัวบ่งชี้ของการปรับตัวที่มากเกินไป การปรับพารามิเตอร์ไฮเปอร์ให้เหมาะสมโดยการเพิ่มความน่าจะเป็นที่ขอบจะทำให้รูปแบบง่ายมากเว้นแต่ว่ามีข้อมูลเพียงพอที่จะพิสูจน์สิ่งที่ซับซ้อนมากขึ้น เนื่องจากคุณมีดาต้าพอยท์เพียงสามตัวเท่านั้นซึ่งมีจำนวนมากขึ้นหรือน้อยลงซึ่งมีสัญญาณรบกวนน้อยรูปแบบที่พบนั้นดูสมเหตุสมผลสำหรับฉัน เป็นหลักข้อมูลสามารถอธิบายได้ว่าเป็นฟังก์ชั่นพื้นฐานเชิงเส้นที่มีสัญญาณรบกวนปานกลางหรือฟังก์ชั่นพื้นฐานที่ไม่ใช่เชิงเส้นปานกลางที่มีสัญญาณรบกวนน้อย อดีตคือความเรียบง่ายของสองสมมติฐานและได้รับการสนับสนุนจาก "Occam's razor"


ขอบคุณสำหรับการป้อนข้อมูล คุณช่วยบอกฉันเพิ่มเติมเกี่ยวกับ "over-fitting"; มันเป็นคุณสมบัติบวก / ลบ?
Comp_Warrior

over-fitting เป็นสิ่งที่เป็นลบมันโดยทั่วไปหมายความว่าแบบจำลองนั้นจดจำการเปลี่ยนแปลงแบบสุ่มในข้อมูลซึ่งมีแนวโน้มที่จะทำให้ประสิทธิภาพการทำงานทั่วไปแย่ลง เป็นการดีที่คุณต้องการให้รูปแบบการเรียนรู้รูปแบบพื้นฐานของข้อมูลในขณะที่ละเว้นเสียงรบกวนการปนเปื้อน หนังสือเรียนรู้ด้วยเครื่องจักรที่ดีที่สุดส่วนใหญ่จะกล่าวถึงในตอนต้น
Dikran Marsupial

เพิ่งหมดความสนใจทำไมต้องโหวต?
Dikran Marsupial

ฉันไม่ได้ลงคะแนนคุณ ในความเป็นจริงฉัน upvoted!
Comp_Warrior

2
ไม่มีปัญหา Comp_Warrior ฉันไม่คิดว่ามันเป็นคุณ แต่มีบางคนลงคะแนนให้กับคำตอบของฉันและฉันยินดีที่จะให้ข้อเสนอแนะเกี่ยวกับสาเหตุ พวกเราทุกคนผิดพลาดได้และถ้าฉันมีบางอย่างผิดปกติในคำตอบของฉันฉันก็กระตือรือร้นที่จะแก้ไข
Dikran Marsupial

7

คุณกำลังใช้เครื่องมือประมาณการ Kriging ด้วยการเพิ่มคำที่มีเสียงรบกวน (รู้จักกันในชื่อเอฟเฟกต์นักเก็ตในวรรณคดีกระบวนการเกาส์เซียน) หากคำว่าเสียงถูกตั้งค่าเป็นศูนย์เช่น

σn2δpq=0

จากนั้นการคาดการณ์ของคุณจะทำหน้าที่เป็นการแก้ไขและส่งผ่านจุดข้อมูลตัวอย่าง


3

นี่ดูโอเคสำหรับฉันในหนังสือ GP โดย Rasmussen มันแสดงตัวอย่างที่ฟังก์ชันค่าเฉลี่ยไม่ผ่านจุดข้อมูลแต่ละจุด โปรดทราบว่าบรรทัดการถดถอยเป็นค่าประมาณสำหรับฟังก์ชันพื้นฐานและเราสมมติว่าการสังเกตเป็นค่าฟังก์ชันพื้นฐานบวกกับเสียงรบกวน หากเส้นการถดถอยอ้างอิงจากทั้งสามจุดมันจะบอกว่าไม่มีเสียงรบกวนในค่าที่สังเกตได้

คุณสามารถบังคับให้ไม่มีข้อสมมติฐานด้านเสียงรบกวนโดยการตั้งค่าและเพิ่มประสิทธิภาพพารามิเตอร์ไฮเปอร์อื่น ๆσn=0

ฉันยังต้องสงสัยว่า Hyper-parmeterจะถูกตั้งค่าที่ค่อนข้างใหญ่ให้ฟังก์ชั่นตื้นมากl

คุณสามารถลองจับด้วยค่าที่น้อยกว่าและดูว่ามันเปลี่ยนเส้นโค้งอย่างไร บางทีถ้าคุณบังคับให้เล็กกว่านี้เส้นถดถอยจะผ่านจุดข้อมูลทั้งหมดll

ดังที่ระบุไว้โดย Dikran Marsupial นี่เป็นฟีเจอร์ที่สร้างขึ้นในกระบวนการแบบเกาส์เซียนความเป็นไปได้ที่จะลงโทษโมเดลที่เฉพาะเจาะจงมากเกินไปและชอบสิ่งที่สามารถอธิบายชุดข้อมูลจำนวนมากได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.