การแลกเปลี่ยนความแปรปรวนอคติจะขึ้นอยู่กับการแยกย่อยของความคลาดเคลื่อนกำลังสองเฉลี่ย:
MSE(y^)=E[y−y^]2=E[y−E[y^]]2+E[y^−E[y^]]2
วิธีหนึ่งในการดูการแลกเปลี่ยนความแปรปรวนแบบอคติคือคุณสมบัติของชุดข้อมูลที่ใช้ในโมเดลพอดี สำหรับโมเดลอย่างง่ายถ้าเราสมมติว่าการถดถอย OLS ถูกใช้เพื่อให้พอดีกับเส้นตรงดังนั้นจะมีเพียง 4 ตัวเลขเท่านั้นที่ใช้เพื่อให้พอดีกับเส้น:
- ความแปรปรวนร่วมตัวอย่างระหว่าง x และ y
- ความแปรปรวนตัวอย่างของ x
- ค่าเฉลี่ยตัวอย่างของ x
- ค่าเฉลี่ยตัวอย่างของ y
ดังนั้นกราฟใดก็ตามที่นำไปสู่ตัวเลข 4 ตัวด้านบนจะนำไปสู่เส้นที่พอดีกัน (10 คะแนน, 100 คะแนน, 100000000 คะแนน) ดังนั้นในแง่หนึ่งมันจึงไม่รู้สึกถึงตัวอย่างที่สังเกตได้ ซึ่งหมายความว่ามันจะ "เอนเอียง" เพราะมันจะไม่สนใจข้อมูลบางส่วน หากการละเว้นส่วนหนึ่งของข้อมูลนั้นมีความสำคัญการคาดการณ์จะผิดพลาดอย่างสม่ำเสมอ คุณจะเห็นสิ่งนี้หากคุณเปรียบเทียบสายที่ได้รับการติดตั้งโดยใช้ข้อมูลทั้งหมดกับสายที่ได้รับจากการลบจุดข้อมูลหนึ่งจุด พวกเขามีแนวโน้มที่จะมีเสถียรภาพมาก
ตอนนี้รุ่นที่สองใช้เศษข้อมูลทุกอย่างที่สามารถรับได้และเหมาะสมกับข้อมูลให้ใกล้เคียงที่สุด ดังนั้นตำแหน่งที่แน่นอนของทุกจุดข้อมูลจึงมีความสำคัญดังนั้นคุณจึงไม่สามารถเปลี่ยนข้อมูลการฝึกอบรมได้โดยไม่ต้องเปลี่ยนรูปแบบที่เหมาะสมเช่นเดียวกับ OLS ดังนั้นแบบจำลองจึงมีความอ่อนไหวต่อชุดฝึกอบรมเฉพาะที่คุณมี โมเดลที่ถูกติดตั้งจะแตกต่างกันมากหากคุณทำจุดข้อมูลแบบดรอปดาวน์เดียวกัน