Illustrating the Bias - Variance Tradeoff โดยใช้ตัวอย่างของเล่น
@Matthew Drury ชี้ให้เห็นว่าในสถานการณ์จริงคุณจะไม่เห็นกราฟสุดท้าย แต่ตัวอย่างของเล่นต่อไปนี้อาจให้การตีความด้วยภาพและสัญชาตญาณแก่ผู้ที่เห็นว่าเป็นประโยชน์
ชุดข้อมูลและสมมติฐาน
Y
- Y= s i n ( πx - 0.5 ) + ϵϵ ∼ Un ฉันfo r m ( - 0.5 , 0.5 )
- Y= f( x ) + ϵ
xYVR ( Y) = Va r ( ϵ ) = 112
ฉ^( x ) = β0+ β1x + β1x2+ . . . + βพีxพี
ติดตั้งโมเดลพหุนามหลายแบบ
โดยสังเขปคุณคาดหวังว่าเส้นโค้งเส้นตรงจะทำงานได้ไม่ดีเนื่องจากชุดข้อมูลนั้นไม่ใช่เส้นตรงอย่างชัดเจน ในทำนองเดียวกันการใส่พหุนามลำดับที่สูงมากอาจจะมากเกินไป สัญชาตญาณนี้สะท้อนให้เห็นในกราฟด้านล่างซึ่งแสดงให้เห็นถึงรูปแบบต่าง ๆ และค่าเฉลี่ยข้อผิดพลาดสแควร์ที่สอดคล้องกันสำหรับข้อมูลรถไฟและการทดสอบ
กราฟด้านบนใช้งานได้กับรถไฟเดี่ยว / การทดสอบแยกแต่เราจะทราบได้อย่างไรว่าเป็นแบบมาตรฐาน
การประเมินรถไฟที่คาดหวังและทดสอบ MSE
ที่นี่เรามีตัวเลือกมากมาย แต่วิธีการหนึ่งคือการสุ่มแยกข้อมูลระหว่างรถไฟ / การทดสอบ - ปรับโมเดลให้เหมาะกับการแบ่งที่กำหนดและทำการทดลองซ้ำหลายครั้ง MSE ที่เป็นผลลัพธ์สามารถถูกพล็อตและค่าเฉลี่ยคือค่าประมาณของข้อผิดพลาดที่คาดไว้
เป็นที่น่าสนใจที่จะเห็นว่าการทดสอบ MSE มีความผันผวนอย่างมากสำหรับการแยกข้อมูลการรถไฟ / การทดสอบที่แตกต่างกัน แต่การที่ค่าเฉลี่ยในการทดลองจำนวนมากเพียงพอทำให้เรามีความมั่นใจมากขึ้น
Y
Bias - การสลายตัวผลต่าง
ตามที่อธิบายไว้ที่นี่ MSE สามารถแบ่งออกเป็น 3 องค์ประกอบหลัก:
E[ ( Y)- ฉ^)2] = σ2ε+ B ฉันs2[ f^] + VR [ F^]
E[ ( Y)- ฉ^)2] = σ2ε+ [ f- E[ f^] ]2+ E[ f^- E[ f^] ]2
ในกรณีที่ของเล่นของเรา:
- ฉ
- σ2εε
- E[ f^]
- ฉ^
- E[ f^- E[ f^] ]2
ให้ความสัมพันธ์ดังต่อไปนี้
หมายเหตุ: กราฟข้างต้นใช้ข้อมูลการฝึกอบรมเพื่อให้พอดีกับรูปแบบและแล้วคำนวณ MSE บนรถไฟทดสอบด้าน