Optimism bias - การประเมินความผิดพลาดโดยประมาณ


9

หนังสือองค์ประกอบของการเรียนรู้เชิงสถิติ (มีให้ใน PDF ออนไลน์) กล่าวถึงอคติที่เหมาะสม (7.21, หน้า 229) มันระบุว่าอคติในแง่ดีคือความแตกต่างระหว่างข้อผิดพลาดการฝึกอบรมและข้อผิดพลาดในตัวอย่าง (ข้อผิดพลาดสังเกตว่าถ้าเราตัวอย่างค่าผลลัพธ์ใหม่ที่แต่ละจุดฝึกอบรมเดิม) (ต่อด้านล่าง)

ป้อนคำอธิบายรูปภาพที่นี่

ถัดไปจะระบุอคติเชิงบวกนี้ ( ) เท่ากับความแปรปรวนร่วมของค่า y ที่เราประมาณและค่า y ที่แท้จริง (สูตรต่อด้านล่าง) ฉันมีปัญหาในการทำความเข้าใจว่าทำไมสูตรนี้บ่งบอกถึงการมองในแง่ดี อย่างไร้เดียงสาฉันจะคิดว่าความแปรปรวนร่วมที่แข็งแกร่งระหว่างจริงและทำนายเพียงอธิบายความถูกต้อง - ไม่มองในแง่ดี แจ้งให้เราทราบหากมีคนสามารถช่วยได้มาของสูตรหรือแบ่งปันสัญชาตญาณ ωyy

ป้อนคำอธิบายรูปภาพที่นี่


มีประโยชน์มากขอบคุณ! ฉันคิดว่าหนึ่งในสมการมีตัวพิมพ์เล็กและควร:=1Ni=1N(Ey[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])
Sleepster

คำตอบ:


8

เริ่มต้นด้วยสัญชาตญาณ

ไม่มีอะไรผิดปกติกับการใช้ที่จะทำนาย\ในความเป็นจริงการไม่ใช้มันหมายความว่าเรากำลังทิ้งข้อมูลที่มีค่า แต่ยิ่งเราขึ้นอยู่กับข้อมูลที่มีอยู่ในจะเกิดขึ้นกับการคาดการณ์ของเรามากขึ้นมากเกินไปในแง่ดีประมาณการของเราจะเป็นyiy^iyi

ในสุดขั้วหนึ่งหากเป็นเพียงแค่คุณจะมีการคาดการณ์ตัวอย่างที่สมบูรณ์แบบ ( ) แต่เราค่อนข้างมั่นใจว่าการคาดการณ์แบบนอกตัวอย่างจะไม่ดี ในกรณีนี้ (มันเป็นเรื่องง่ายที่จะตรวจสอบด้วยตัวเอง) องศาอิสระจะny^iyiR2=1df(y^)=n

อีกด้านหนึ่งถ้าคุณใช้ค่าเฉลี่ยตัวอย่าง :สำหรับทั้งหมดดังนั้นองศาอิสระของคุณจะเท่ากับ 1yyi=yi^=y¯i

ตรวจสอบเอกสารแจกที่ดีนี้โดย Ryan Tibshiraniสำหรับรายละเอียดเพิ่มเติมเกี่ยวกับสัญชาตญาณนี้


ตอนนี้เป็นข้อพิสูจน์ที่คล้ายกับคำตอบอื่น ๆ แต่มีคำอธิบายเพิ่มเติมอีกเล็กน้อย

โปรดจำไว้ว่าตามนิยามแล้วการมองโลกในแง่ดีโดยเฉลี่ยคือ:

ω=Ey(Errinerr¯)

=Ey(1Ni=1NEY0[L(Yi0,f^(xi)|T)]1Ni=1NL(yi,f^(xi)))

ตอนนี้ใช้ฟังก์ชันการสูญเสียกำลังสองและขยายคำกำลังสอง:

=Ey(1Ni=1NEY0[(Yi0y^i)2]1Ni=1N(yiy^i)2))

=1Ni=1N(EyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

ใช้เพื่อแทนที่:EyEY0[(Yi0)2]=Ey[yi2]

=1Ni=1N(Ey[yi2]+Ey[yi^2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

=2Ni=1N(E[yiy^i]Ey[yi]Ey[y^i])

ในการทำให้เสร็จโปรดทราบว่าซึ่งให้ผลลัพธ์:Cov(x,w)=E[xw]E[x]E[w]

=2Ni=1NCov(yi,y^i)

5
ฉันต้องชี้ให้เห็นว่าชื่อของเขาสะกดว่า "Ryan Tibshirani" Rob Tibshirani
robert tibshirani

2
ยินดีต้อนรับสู่เว็บไซต์ของเรา Rob - มันเป็นสิทธิพิเศษที่ได้คุณมาที่นี่ถ้าเพียงเพื่อแก้ไขข้อผิดพลาด! หากคุณเห็นรายละเอียดเพิ่มเติมโปรดแจ้งให้เราทราบ: และแน่นอนว่าเรายินดีที่จะตอบทุกคำถามที่คุณ (หรือนักเรียนของคุณ) สนใจที่จะโพสต์ งานของคุณมีการอ้างอิงอย่างกว้างขวางในเว็บไซต์นี้โดยเฉพาะESLและแนะนำ Bootstrap
whuber

ใจอธิบาย ? นอกจากนี้คือ ? EyEY0[(Yi0)2]=Ey[yi2]2EyEY0[Yi0y^i]=2Ey[EY0[Yi0]EY0[y^i]]=2Ey[yi]Ey[y^i]
Shookie

7

ให้จากนั้น f^(xi)=y^i

ω=Ey[op]=Ey[Errinerr¯]=Ey[Errin]Ey[err¯]=Ey[1Ni=1NEY0[L(Yi0,f^(xi))]Ey[1Ni=1NL(yi,f^(xi))]=1Ni=1NEyEY0[(Yi0y^i)2]Ey[(yiy^i)2]=1Ni=1NEyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=1Ni=1NEy[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=2Ni=1NEy[yiy^i]Ey[yi]Ey[y^i]=2Ni=1NEy[yiy^iyiEy[y^i]Ey[yi]y^i+Ey[yi]Ey[y^i]]=2Ni=1NEy[(y^iEy[y^i])([yiEy[yi])]=2Ni=1Ncov(y^i,yi)
QED

1
สี่ขั้นตอนสุดท้ายสามารถลดความซับซ้อนลงได้โดยคุณสมบัติความแปรปรวนร่วมนี้:E[xw]E[x]E[w]=Cov(x,w)
cd98
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.