อะไรคือความแตกต่างพื้นฐานระหว่างตัวแบบการถดถอยสองตัวนี้


10

สมมติว่าฉันมีการตอบสนองแบบ bivariate ที่มีความสัมพันธ์อย่างมีนัยสำคัญ ฉันพยายามเปรียบเทียบทั้งสองวิธีเพื่อจำลองผลลัพธ์เหล่านี้ วิธีหนึ่งคือการสร้างแบบจำลองความแตกต่างระหว่างผลลัพธ์ทั้งสอง: อีกวิธีหนึ่งคือการใช้หรือสร้างแบบจำลองพวกเขา: ( y i j = β 0 + เวลา+ X β )

(yi2yi1=β0+Xβ)
glsgee
(yij=β0+time+Xβ)

นี่คือตัวอย่างของ foo:

#create foo data frame

require(mvtnorm)
require(reshape)
set.seed(123456)
sigma <- matrix(c(4,2,2,3), ncol=2)
y <- rmvnorm(n=500, mean=c(1,2), sigma=sigma)
cor(y)
x1<-rnorm(500)
x2<-rbinom(500,1,0.4)
df.wide<-data.frame(id=seq(1,500,1),y1=y[,1],y2=y[,2],x1,x2)
df.long<-reshape(df.wide,idvar="id",varying=list(2:3),v.names="y",direction="long")
df.long<-df.long[order(df.long$id),]
    df.wide$diff_y<-df.wide$y2-df.wide$y1


#regressions
fit1<-lm(diff_y~x1+x2,data=df.wide)
fit2<-lm(y~time+x1+x2,data=df.long)
fit3<-gls(y~time+x1+x2,data=df.long, correlation = corAR1(form = ~ 1 | time))

fit1fit2fit2fit3p


7
ความแตกต่างระหว่าง fit1 และ fit3 บางครั้งเรียกว่าเป็นเส้นขนานของท่าน ดูที่นี่สำหรับบางสนทนา (เกี่ยวกับเหตุผลที่ประมาณการไว้ไม่เปลี่ยนแปลงระหว่างรูปแบบ) และการอ้างอิงถึงบทความพอลอัลลิสันstats.stackexchange.com/a/15759/1036 ข้อมูลอ้างอิงอื่น ๆHolland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.
Andy W

คำตอบ:


1

ก่อนอื่นฉันจะแนะนำรุ่นที่สี่สำหรับการอภิปรายในคำตอบของฉัน:

fit1.5 <- lm (y_2 ~ x_1 + x_2 + y_1)

ส่วนที่ 0
ความแตกต่างระหว่าง fit1 และ fit1.5 นั้นสรุปได้ดีที่สุดเนื่องจากความแตกต่างระหว่างข้อ จำกัด และความแตกต่างที่ดีที่สุด

y2=b0+b1·x+b2·y1
b2
y2b2·y1=b0+b1·x
y

b2=1

y2y1=b0+b1·x

xy1y2t


y=b0+b1·x+b2·t
t=0y1t=1y2
y1=b0+b1·xy2=b0+b1·x+b2
y2y1=b2b2b2y

ตอนที่ 2
ดังนั้นอะไรคือความแตกต่างระหว่างรุ่นที่เหมาะสม 2 และพอดี 3 ... ที่จริงแล้วมีน้อยมาก แบบจำลอง fit3 นั้นคำนึงถึงความสัมพันธ์ในแง่ของข้อผิดพลาด แต่เป็นการเปลี่ยนแปลงกระบวนการประมาณเท่านั้นและดังนั้นความแตกต่างระหว่างผลลัพธ์แบบจำลองทั้งสองจะน้อยที่สุด

ตอนที่ 2.5
และฉันจะรวมโมเดลอีกหนึ่งโมเดลไว้ในการสนทนานี้

fit4 <- lmer (y ~ time + x1 + x2 + (1 | id), data = df.long)

y

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.