โพสต์นี้หมายถึงรูปแบบการถดถอย bivariate เชิงเส้น\ ฉันมักจะแบ่งพาร์ติชันของผลรวมของกำลังสอง (SSTO) เป็นผลรวมของกำลังสองสำหรับข้อผิดพลาด (SSE) และผลรวมของกำลังสองสำหรับโมเดล (SSR) โดยความเชื่อ แต่เมื่อฉันเริ่มคิดจริงๆฉันไม่เข้าใจทำไมมันถึงทำงาน ...
ส่วนที่ผมไม่เข้าใจ
: ค่าที่สังเกตได้ของ y
: ค่าเฉลี่ยของ s ที่สังเกตได้ทั้งหมด
: ค่าติดตั้ง / ทำนายของ y สำหรับการสังเกตของ x
: ส่วนที่เหลือ / ข้อผิดพลาด (ถ้ายกกำลังสองและบวกกันสำหรับการสังเกตทั้งหมดนี่คือ SSE)
: ค่าติดตั้งโมเดลแตกต่างจากค่าเฉลี่ย (ถ้ายกกำลังสองและบวกสำหรับการสังเกตทั้งหมดนี่คือ SSR)
: ค่าที่สังเกตได้นั้นแตกต่างจากค่าเฉลี่ย (ถ้าถูก suared และบวกสำหรับการสังเกตทั้งหมดนี่คือ SSTO)
ผมสามารถเข้าใจว่าทำไมสำหรับการสังเกตเดียวโดยไม่ squaring อะไร_i) และฉันสามารถเข้าใจได้ว่าทำไมถ้าคุณต้องการเพิ่มสิ่งต่างๆลงไปในการสังเกตทั้งหมดคุณจะต้องยกกำลังสองพวกเขาหรือพวกมันจะรวมกันเป็น 0
ส่วนที่ฉันไม่เข้าใจคือสาเหตุ (เช่น SSTO = SSR + SSE) มันน่าจะเป็นว่าถ้าคุณมีสถานการณ์ที่แล้วไม่ 2 ทำไมไม่เป็นอย่างนั้น?