เหตุใดความชัน 1 เสมอเมื่อทำการถดถอยข้อผิดพลาดในส่วนที่เหลือโดยใช้ OLS

10

ฉันกำลังทดสอบความสัมพันธ์ระหว่างข้อผิดพลาดและส่วนที่เหลือโดยใช้การจำลองแบบง่าย ๆ ในอาร์สิ่งหนึ่งที่ฉันพบคือไม่ว่าขนาดตัวอย่างหรือความแปรปรวนข้อผิดพลาดฉันได้สำหรับความชันเสมอเมื่อคุณพอดีกับโมเดล $1$

e r r o r s \sim β_{0} + β_{1} \times r e s i d u a l s

${\rm errors} \sim \beta_0 + \beta_1 \times {\rm residuals}$

นี่คือการจำลองที่ฉันทำ:

n <- 10 
s <- 2.7 

x <- rnorm(n) 
e <- rnorm(n,sd=s)
y <- 0.3 + 1.2*x + e

model <- lm(y ~ x) 
r <- model$res 

summary( lm(e ~ r) )

eและrมีความสัมพันธ์สูง (แต่ไม่สมบูรณ์) แม้กระทั่งสำหรับกลุ่มตัวอย่างขนาดเล็ก แต่ฉันไม่สามารถเข้าใจได้ว่าทำไมสิ่งนี้ถึงเกิดขึ้นโดยอัตโนมัติ คำอธิบายทางคณิตศาสตร์หรือเรขาคณิตจะได้รับการชื่นชม

regression least-squares residuals

— GoF_Logistic
แหล่งที่มา

5

ในสามเหลี่ยมเครื่องบิน OXY โดยมีฐาน OX ระดับความสูงของด้าน YO และ XY คือระดับความสูงของสามเหลี่ยมเอง ในการสั่งซื้อระดับความสูงเหล่านั้นจะได้รับจากค่าสัมประสิทธิ์ของlm(y~r), lm(e~r)และlm(r~r)ซึ่งทั้งหมดจึงต้องเท่ากัน หลังเห็นได้ชัดคือ1

ลองคำสั่งทั้งสามนี้เพื่อดู ที่จะทำให้การทำงานที่ผ่านมาหนึ่งในคุณต้องสร้างสำเนาของเช่น สำหรับข้อมูลเพิ่มเติมเกี่ยวแผนภาพเรขาคณิตของการถดถอยดูstats.stackexchange.com/a/113207

1

$1$ Rrs<-r;lm(r~s)

— whuber

1

ขอบคุณ @whuber คุณต้องการที่จะทำมากกว่าคำตอบเพื่อให้ฉันสามารถยอมรับได้หรืออาจทำเครื่องหมายว่าเป็นคำซ้ำ?

— GoF_Logistic

1

ฉันไม่คิดว่ามันซ้ำซ้อนดังนั้นฉันจึงขยายความคิดเห็นไปเป็นคำตอบ

— whuber

11

คำตอบของ whuber นั้นยอดเยี่ยมมาก! (+1) ฉันใช้ปัญหากับสัญกรณ์ที่ฉันคุ้นเคยมากที่สุดและคิดว่าการได้มา (น่าสนใจน้อยลงและกิจวัตรมากขึ้น) อาจคุ้มค่าที่จะรวมไว้ที่นี่

ปล่อยให้เป็นแบบจำลองการถดถอยสำหรับและเสียง จากนั้นการถดถอยของกับคอลัมน์ของมีสมการปกติประมาณการผลผลิต $y = X \beta^* + \epsilon$ $X \in \mathbb{R}^{n \times p}$ $\epsilon$ $y$ $X$ $X^T\left(y - X \hat\beta\right) = 0,$

\hat{β} = {(X^{T} X)}^{- 1} X^{T} y .

$\hat\beta = \left(X^T X \right)^{-1} X^T y.$ ดังนั้นการถดถอยมีเหลือ

สำหรับ

T

r = y - X \hat{β} = (I - H) y = (I - H) ϵ,

$r = y - X \hat\beta = \left( I - H \right) y = \left( I - H \right) \epsilon,$

H = X (X^{T} X)^{- 1} X^{T}

$H = X (X^T X)^{-1} X^T$

การถดถอยกับทำให้ได้ผลลัพธ์โดยประมาณที่กำหนดโดย $\epsilon$ $r$

\begin{aligned} (r^{T} r)^{- 1} r^{T} ϵ & = {({[(I - H) ϵ]}^{T} [(I - H) ϵ])}^{- 1} {[(I - H) ϵ]}^{T} ϵ \\ = \frac{ϵ^{T} {(I - H)}^{T} ϵ}{ϵ^{T} {(I - H)}^{T} (I - H) ϵ} \\ = \frac{ϵ^{T} (I - H) ϵ}{ϵ^{T} (I - H) ϵ} \\ = 1, \end{aligned}

$\begin{align*} (r^T r)^{-1} r^T \epsilon & = \left( \left[ \left(I - H\right) \epsilon \right]^T \left[ \left(I - H\right) \epsilon \right] \right)^{-1} \left[ \left(I - H\right) \epsilon \right]^T \epsilon \\ & = \frac{\epsilon^T \left( I - H \right)^T \epsilon}{\epsilon^T \left( I - H \right)^T \left( I - H \right) \epsilon} \\ & = \frac{\epsilon^T \left( I - H \right) \epsilon}{\epsilon^T \left( I - H \right) \epsilon} \\ & = 1, \end{align*}$

I - H

$I-H$

ϵ \notin i m (X)

$\epsilon \not\in \mathrm{im}(X)$

$1^T r = 0$

— user795305
แหล่งที่มา

+1 มันเป็นเรื่องดีเสมอที่ได้เห็นวิธีการแก้ปัญหาทำงานอย่างรอบคอบและชัดเจน

— whuber

11

$x$ $e$ $Y=\beta x + e$ $b$ $\beta$ $r = Y - bx$ $O$

$\beta x$ $e$ $Y$ $bx$ $Y-bx$ $r$

$x$ $OY$ $(\beta x)Y$ $r$ $r$ $Y$ $r$ $Y$ $e$ $r$ $e$ $r$ $r$ $r$ $1$

$r$ $e=r+(\beta-b)x$ $Y=e+\beta x = r + (2\beta-b)x$ $x$ $x$ $r$ $r$ $1$ $x$ $r$

— whuber
แหล่งที่มา