ฉันกำลังทดสอบความสัมพันธ์ระหว่างข้อผิดพลาดและส่วนที่เหลือโดยใช้การจำลองแบบง่าย ๆ ในอาร์สิ่งหนึ่งที่ฉันพบคือไม่ว่าขนาดตัวอย่างหรือความแปรปรวนข้อผิดพลาดฉันได้สำหรับความชันเสมอเมื่อคุณพอดีกับโมเดล
นี่คือการจำลองที่ฉันทำ:
n <- 10
s <- 2.7
x <- rnorm(n)
e <- rnorm(n,sd=s)
y <- 0.3 + 1.2*x + e
model <- lm(y ~ x)
r <- model$res
summary( lm(e ~ r) )
e
และr
มีความสัมพันธ์สูง (แต่ไม่สมบูรณ์) แม้กระทั่งสำหรับกลุ่มตัวอย่างขนาดเล็ก แต่ฉันไม่สามารถเข้าใจได้ว่าทำไมสิ่งนี้ถึงเกิดขึ้นโดยอัตโนมัติ คำอธิบายทางคณิตศาสตร์หรือเรขาคณิตจะได้รับการชื่นชม
lm(y~r)
,lm(e~r)
และlm(r~r)
ซึ่งทั้งหมดจึงต้องเท่ากัน หลังเห็นได้ชัดคือ1ลองคำสั่งทั้งสามนี้เพื่อดู ที่จะทำให้การทำงานที่ผ่านมาหนึ่งในคุณต้องสร้างสำเนาของเช่น สำหรับข้อมูลเพิ่มเติมเกี่ยวแผนภาพเรขาคณิตของการถดถอยดูstats.stackexchange.com/a/113207R
r
s<-r;lm(r~s)