มาตรการซ้ำ anova: lm vs lmer


10

ฉันพยายามสร้างการทดสอบการโต้ตอบหลายครั้งระหว่างมาตรการทั้งสองlmและlmerมาตรการซ้ำ (2x2x2) เหตุผลที่ฉันต้องการเปรียบเทียบทั้งสองวิธีนี้เป็นเพราะ GLM ของ SPSS สำหรับการวัดซ้ำ ๆ ทำให้ได้ผลลัพธ์ที่เหมือนกันกับlmวิธีที่นำเสนอที่นี่ดังนั้นในตอนท้ายฉันต้องการเปรียบเทียบ SPSS กับ R-lmer จนถึงตอนนี้ฉันทำได้แค่ทำซ้ำ (อย่างใกล้ชิด) ปฏิสัมพันธ์บางอย่าง

คุณจะพบสคริปต์ด้านล่างเพื่อแสดงจุดของฉันให้ดีขึ้น:

library(data.table)
library(tidyr)
library(lmerTest)
library(MASS)

set.seed(1)

N     <- 100 # number of subjects
sigma <- 1   # popuplation sd
rho   <- .6  # correlation between variables

# X1:   a  a  a  a  b  b  b  b
# X2:   a  a  b  b  a  a  b  b
# X3:   a  b  a  b  a  b  a  b
mu <- c(5, 3, 3, 5, 3, 5, 5, 3) # means

# Simulate the data
sigma.mat <- rep(sigma, length(mu))
S <- matrix(sigma.mat, ncol = length(sigma.mat), nrow = length(sigma.mat))
Sigma <- t(S) * S * rho  
diag(Sigma) <- sigma**2
X <- data.table( mvrnorm(N, mu, Sigma) )
setnames(X, names(X), c("aaa", "aab", "aba", "abb", "baa", "bab", "bba", "bbb"))
X[, id := 1:.N]

# Long format
XL <- data.table( gather(X, key, Y, aaa:bbb) )
XL[, X1 := substr(key, 1, 1)]
XL[, X2 := substr(key, 2, 2)]
XL[, X3 := substr(key, 3, 3)]

# Recode long format (a = +1; b = -1)
XL[, X1c := ifelse(X1 == "a", +1, -1)]
XL[, X2c := ifelse(X2 == "a", +1, -1)]
XL[, X3c := ifelse(X3 == "a", +1, -1)]


### Composite scores to be used with lm
# X2:X3 2-way interaction (for half the data; i.e. when X1 == "a")
X[, X1a_X2.X3 := (aaa - aab) - (aba - abb)]

# X2:X3 2-way interaction (for all the data)
X[, aa := (aaa + baa) / 2]
X[, ab := (aab + bab) / 2]
X[, ba := (aba + bba) / 2]
X[, bb := (abb + bbb) / 2]
X[, X2.X3 := (aa - ab) - (ba - bb)]

# X1:X2:X3 3-way interaction (for all the data)
X[, X1.X2.X3 := ( (aaa - aab) - (aba - abb) ) - ( (baa - bab) - (bba - bbb) )]


### Fit models
# X2:X3 2-way interaction (for half the data; i.e. when X1 == "a")
summary( lm(X1a_X2.X3 ~ 1, X) ) # t = 34.13303
summary( lmer(Y ~ X2c*X3c + (X2c+X3c|id), XL[X1 == "a"]) ) # t = 34.132846  close match
summary( lmer(Y ~ X2c*X3c + (X2c+X3c||id), XL[X1 == "a"]) ) # t = 34.134624  close match

# X2:X3 2-way interaction (for all the data) 
summary( lm(X2.X3 ~ 1, X) ) # t = 0.3075025
summary( lmer(Y ~ X2c*X3c + (X2c+X3c|id), XL) ) # t = 0.1641932
summary( lmer(Y ~ X2c*X3c + (X2c+X3c||id), XL) ) # t = 0.1640710
summary( lmer(Y ~ X2c*X3c + (X2c*X3c|id), XL) ) # t = 0.1641765
anova(   lmer(Y ~ X2c*X3c + (X2c*X3c|id), XL), ddf = "Kenward-Roger" ) # t = 0.1643168
summary( lmer(Y ~ X2c*X3c + (X2c*X3c|id), XL, REML = FALSE) ) # t = 0.1645303
summary( lmer(Y ~ X2c*X3c + (X2c*X3c||id), XL) ) # t = 0.1640704

# X1:X2:X3 3-way interaction (for all the data)
summary( lm(X1.X2.X3 ~ 1, X) ) # t = 46.50177
summary( lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c - X1c:X2c:X3c|id), XL) ) # t = 49.0317599
anova(   lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c - X1c:X2c:X3c|id), XL), ddf = "Kenward-Roger" ) # t = 49.03176
summary( lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c - X1c:X2c:X3c|id), XL, REML = FALSE) ) # t = 49.2677606
summary( lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c - X1c:X2c:X3c||id), XL) ) # t = 46.5193774 close match
summary( lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c|id), XL) ) # unidentifiable
summary( lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c|id), XL,
              control = lmerControl(check.nobs.vs.nRE="ignore")) ) # t = 46.5148684 close match

ที่คุณสามารถดูจากข้างต้นไม่มีการlmประมาณการว่าจะถูกจับคู่โดยlmerคน แม้ว่าผลลัพธ์บางอย่างจะคล้ายกันมากและอาจแตกต่างกันเพียงเพราะเหตุผลเชิงตัวเลข / การคำนวณ X2:X3 2-way interaction (for all the data)ช่องว่างระหว่างทั้งสองวิธีการประมาณค่าที่มีขนาดใหญ่เป็นพิเศษสำหรับ

คำถามของฉันคือถ้ามีวิธีที่จะได้รับเป็นที่แน่นอนผลลัพธ์เดียวกันด้วยวิธีการทั้งสองและหากมีความถูกต้องวิธีการดำเนินการวิเคราะห์ด้วยlmer(แม้ว่ามันอาจจะไม่ตรงกับlmผลการค้นหา)


โบนัส:

ฉันสังเกตเห็นว่าการt valueเชื่อมโยงกับการโต้ตอบ 3 ทางได้รับผลกระทบจากวิธีการเข้ารหัสซึ่งดูเหมือนแปลกมากสำหรับฉัน:

summary( lmer(Y ~ X1*X2*X3 + (X1*X2*X3 - X1:X2:X3||id), XL) ) # t = 48.36
summary( lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c - X1c:X2c:X3c||id), XL) ) # t = 56.52

1
+1 เพราะมันดูน่าสนใจ แต่ฉันไม่รู้ว่าคุณกำลังทำอะไรที่นี่ :) คุณช่วยอธิบายด้วยคำหรือคณิตศาสตร์ได้ไหมว่าทำไมการเรียก lm และ lmer เหล่านี้ควรให้ค่าสัมประสิทธิ์เท่ากัน? และตรรกะอะไรที่อยู่เบื้องหลังการฝึกทั้งหมดนี้?
อะมีบา

@ amoeba ฉันอัปเดตโพสต์ของฉันเพื่อชี้แจงวัตถุประสงค์ของโพสต์ โดยทั่วไปฉันต้องการสร้างผลลัพธ์จาก SPSS (ซึ่งสามารถแปลเป็นlmแบบจำลอง) ด้วยlmerและยังรู้ว่าการวิเคราะห์ที่ถูกต้อง lmerสำหรับข้อมูลประเภทนี้คืออะไร
เสื่อ

เหตุผลของความคลาดเคลื่อนขนาดใหญ่ในกรณีของการโต้ตอบแบบสองทางสำหรับข้อมูลทั้งหมดคือคุณมี 2 จุดข้อมูลต่อการรวมพารามิเตอร์ ปรีชาคือขนาดตัวอย่างที่มีประสิทธิภาพสำหรับตัวแบบผสมจะเล็กกว่า 2x lm; lmerฉันสงสัยว่าทำไมเสื้อสถิติคือประมาณสองครั้งมีขนาดเล็กใน คุณอาจจะสามารถสังเกตปรากฏการณ์เดียวกันนี้ได้โดยใช้การออกแบบ 2x2 ที่ง่ายกว่าและดูเอฟเฟกต์หลักโดยไม่ต้องกังวลกับ 2x2x2 และการโต้ตอบที่ซับซ้อน
อะมีบา

คำตอบ:


3

แปลกเมื่อฉันใช้รุ่นสุดท้ายของคุณฉันพบคู่ที่สมบูรณ์แบบไม่ใช่คู่ที่ใกล้เคียง:

Fixed effects:
            Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  3.91221    0.07242 99.00001  54.025   <2e-16 ***
X1c          0.03277    0.05006 99.00000   0.655    0.514    
X2c         -0.04836    0.04644 99.00000  -1.042    0.300    
X3c          0.04248    0.05009 99.00001   0.848    0.398    
X1c:X2c      0.08370    0.08747 98.99998   0.957    0.341    
X1c:X3c     -0.07025    0.08895 98.99994  -0.790    0.432    
X2c:X3c     -0.02957    0.09616 99.00000  -0.308    0.759    
X1c:X2c:X3c -8.14099    0.17507 99.00003 -46.502   <2e-16 ***

1
เพื่อให้ชัดเจนคุณหมายถึงรูปแบบใด
พรม

สรุป (lmer (Y ~ X1c X2c X3c + (X1c X2c X3c | id), XL, ควบคุม = lmerControl (check.nobs.vs.nRE = "เพิกเฉย"))
244839

นี่มันแปลกมากจริงๆ! summary( lmer(Y ~ X1c*X2c*X3c + (X1c*X2c*X3c|id), XL, control=lmerControl(check.nobs.vs.nRE="ignore")) )$coefficientsส่งกลับt = 46.5148684สำหรับฉัน อาจเป็นปัญหารุ่นหรือไม่ ฉันใช้และR version 3.5.3 (2019-03-11) lmerTest 3.1-0
พรม

ฉันมีรุ่น R & lmerTest เหมือนกับ @mat และได้ผลลัพธ์เดียวกันกับพวกมัน (แม้ว่าจะมีคำเตือนมากมาย - ไม่สามารถมาบรรจบกันได้)
mkt - Reinstate Monica

1
@mat บางทีฉันไม่ชัดเจน - ฉันได้รับผลลัพธ์เช่นเดียวกับคุณ! ฉันคิดว่าคุณอาจพูดถูกที่ผู้ใช้ 244839 ใช้รุ่นที่แตกต่างจากที่เป็นอยู่
mkt - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.