ความเท่าเทียมกันของ (0 + ปัจจัย | กลุ่ม) และ (1 | กลุ่ม) + (1 | กลุ่ม: ปัจจัย) ข้อมูลจำเพาะของผลกระทบแบบสุ่มในกรณีที่สัดส่วนสมมาตร


13

ดักลาสเบตส์กล่าวว่าแบบจำลองต่อไปนี้เทียบเท่ากัน "ถ้าเมทริกซ์ความแปรปรวนร่วมแปรปรวนสำหรับเอฟเฟกต์สุ่ม - ค่าเวกเตอร์มีรูปแบบพิเศษเรียกว่าสมมาตรผสม" ( สไลด์ 91 ในการนำเสนอนี้ ):

m1 <- lmer(y ~ factor + (0 + factor|group), data)
m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data)

เบตส์เฉพาะใช้ตัวอย่างนี้:

library(lme4)
data("Machines", package = "MEMSS")

m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines)
m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines)

ด้วยผลลัพธ์ที่สอดคล้องกัน:

print(m1a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (0 + Machine | Worker)
   Data: Machines
REML criterion at convergence: 208.3112
Random effects:
 Groups   Name     Std.Dev. Corr     
 Worker   MachineA 4.0793            
          MachineB 8.6253   0.80     
          MachineC 4.3895   0.62 0.77
 Residual          0.9616            
Number of obs: 54, groups:  Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917  

print(m2a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (1 | Worker) + (1 | Worker:Machine)
   Data: Machines
REML criterion at convergence: 215.6876
Random effects:
 Groups         Name        Std.Dev.
 Worker:Machine (Intercept) 3.7295  
 Worker         (Intercept) 4.7811  
 Residual                   0.9616  
Number of obs: 54, groups:  Worker:Machine, 18; Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917

ทุกคนสามารถอธิบายความแตกต่างระหว่างแบบจำลองและวิธีm1ลดm2(สมมาตรผสมที่กำหนด) ด้วยวิธีที่เข้าใจง่ายได้หรือไม่?


6
+1 และ, imho, นี่เป็นหัวข้อจริงๆ โหวตเพื่อเปิดใหม่
อะมีบาพูดว่า Reinstate Monica

2
@Peter Flom ทำไมคุณถึงคิดว่าคำถามนี้เป็นนอกหัวข้อ?
statmerkur

3
อาจไม่ชัดเจนว่าคุณถามเกี่ยวกับแบบจำลองมากกว่าเกี่ยวกับlme4ไวยากรณ์ มันต้องการจะเป็นประโยชน์ - ขยายและสระว่ายน้ำของ answerers ศักยภาพ - lme4ถ้าคุณอธิบายพวกเขาสำหรับคนที่ไม่คุ้นเคยกับ
Scortchi - Reinstate Monica

ดูเหมือนว่ามันเกี่ยวกับการเข้ารหัส
Peter Flom - Reinstate Monica

1
หากเป็นประโยชน์ต่อไปนี้เป็นบทความที่ดีสองข้อเกี่ยวกับสิ่งที่ไวยากรณ์ lme4 กำลังทำอยู่และสมมาตรผสมอยู่ในบริบทของตัวแบบผสม (ดูคำตอบที่ยอมรับสำหรับคำถามทั้งสองข้อ) stats.stackexchange.com/questions/13166/rs-lmer-cheat-sheet และ stats.stackexchange.com/questions/15102/ …
Jacob Socolar

คำตอบ:


11

ในตัวอย่างนี้มีข้อสังเกตสามประการสำหรับการรวมกันของเครื่องจักรทั้งสาม (A, B, C) และแรงงานหกคน ฉันจะใช้เพื่อแสดงเมทริกซ์เอกลักษณ์ -dimensional และเพื่อแสดงเวกเตอร์ -dimensional ของมัน สมมุติว่าคือเวกเตอร์ของการสังเกตที่ฉันจะสมมติว่าได้รับคำสั่งจากคนงานแล้วเครื่องก็ทำซ้ำ ให้เป็นค่าที่คาดหวังที่สอดคล้องกัน (เช่นผลกระทบคงที่) และให้เป็นเวกเตอร์ของการเบี่ยงเบนเฉพาะกลุ่มจากค่าที่คาดหวัง (เช่นผลกระทบแบบสุ่ม) ตามเงื่อนไขบน , โมเดลสำหรับสามารถเขียนได้:Inn1nnyμγγy

yN(μ+γ,σy2I54)

โดยที่คือความแปรปรวน "ส่วนที่เหลือ"σy2

เพื่อให้เข้าใจถึงวิธีการที่โครงสร้างของความแปรปรวนของผลกระทบที่ก่อให้เกิดการสุ่มโครงสร้างแปรปรวนในหมู่สังเกตก็คือใช้งานง่ายมากขึ้นในการทำงานร่วมกับเทียบเท่าตัวแทน "ร่อแร่"ซึ่งรวมมากกว่าผลกระทบสุ่ม\รูปแบบขอบของรุ่นนี้คือγ

yN(μ,σy2I54+Σ)

ที่นี่เป็นเมทริกซ์ความแปรปรวนร่วมที่ขึ้นอยู่กับโครงสร้างของ (เช่น "องค์ประกอบความแปรปรวน" ซึ่งเป็นพื้นฐานของเอฟเฟกต์แบบสุ่ม) ฉันจะอ้างถึงว่า "ความแปรปรวนร่วม" เล็กน้อยΣγΣ

ในตัวคุณm1เอฟเฟกต์แบบสุ่มสลายตัวเป็น:

γ=Zθ

โดยที่เป็นเมทริกซ์การออกแบบที่แมปค่าสัมประสิทธิ์แบบสุ่มบนการสังเกตและเป็นเวกเตอร์ 18 มิติของค่าสัมประสิทธิ์แบบสุ่มสั่งโดยคนงานแล้วเครื่องจักรและกระจายเป็น:Z=I1813θT=[θ1,A,θ1,B,θ1,Cθ6,A,θ6,B,θ6,C]

θN(0,I6Λ)

ที่นี่คือความแปรปรวนร่วมของสัมประสิทธิ์แบบสุ่ม สมมติฐานของความสมมาตรแบบผสมหมายความว่ามีสองพารามิเตอร์ซึ่งฉันจะเรียกว่าและและโครงสร้าง:ΛΛσθτ

Λ=[σθ2+τ2τ2τ2τ2σθ2+τ2τ2τ2τ2σθ2+τ2]

(กล่าวอีกนัยหนึ่งความสัมพันธ์ของเมทริกซ์พื้นฐานมีองค์ประกอบทั้งหมดในแนวตั้งเป็นค่าเดียวกัน)Λ

โครงสร้างความแปรปรวนร่วมที่เกิดจากการสุ่มผลคือดังนั้นความแปรปรวนของการสังเกตการณ์ที่ได้รับคือและความแปรปรวนร่วมระหว่างสอง (แยก) การสังเกตจากคนงานและเครื่องจักรคือ: Σ=Z(I6Λ)ZTσθ2+τ2+σy2i,ju,v

cov(yi,u,yj,v)={0if ijτ2if i=j,uvσθ2+τ2if i=j,u=v

สำหรับคุณm2เอฟเฟกต์แบบสุ่มสลายตัวเป็น:

γ=Zω+Xη

โดยที่ Z เป็นมาก่อนเป็นเมทริกซ์การออกแบบที่แมปการดักแบบสุ่มต่อผู้ปฏิบัติงานเข้าสู่การสังเกตเป็นเวกเตอร์ 18 มิติของการสกัดกั้นแบบสุ่มสำหรับการรวมกันของเครื่องจักรและคนงานทุกคน และเป็นเวกเตอร์ 6 มิติของการสกัดกั้นแบบสุ่มสำหรับผู้ปฏิบัติงาน สิ่งเหล่านี้กระจายเป็น ที่ไหนคือความแปรปรวนของการสกัดกั้นแบบสุ่มเหล่านี้X=I619ωT=[ω1,A,ω1,B,ω1,C,,ω6,A,ω6,B,ω6,C]ηT=[η1,,η6]

ηN(0,ση2I6)
ωN(0,σω2I18)
ση2,σω2

โครงสร้างแปรปรวนส่วนเพิ่มของการm2เป็นเพื่อให้ความแปรปรวนของการสังเกตให้เป็นและความแปรปรวนร่วมระหว่างสองข้อสังเกตจากพนักงานและเครื่องจักรคือ: Σ=σω2ZZT+ση2XXTσω2+ση2+σy2i,ju,v

cov(yi,u,yj,v)={0if ijση2if i=j,uvσω2+ση2if i=j,u=v

ดังนั้น ...และ\ หากสันนิษฐานว่าเป็นสัดส่วนที่สมมาตรกัน (ซึ่งไม่ได้เกิดจากการที่คุณโทรหา lmer เพราะความแปรปรวนร่วมแบบสุ่มนั้นไม่มีโครงสร้าง) τ 2σ 2 ησθ2σω2τ2ση2 m1

ความกะทัดรัดไม่ได้เป็นจุดแข็งของฉัน: ทั้งหมดนี้เป็นเพียงวิธีที่ซับซ้อนและยาวที่จะบอกว่าแต่ละรุ่นมีพารามิเตอร์แปรปรวนสองแบบสำหรับเอฟเฟกต์แบบสุ่มและเป็นเพียงสองวิธีที่แตกต่างกันในการเขียนโมเดล "ขอบ" เดียวกัน

ในรหัส ...

sigma_theta <- 1.8
tau         <- 0.5
sigma_eta   <- tau
sigma_omega <- sigma_theta
Z <- kronecker(diag(18), rep(1,3))
rownames(Z) <- paste(paste0("worker", rep(1:6, each=9)), 
                     rep(paste0("machine", rep(1:3, each=3)),6))
X <- kronecker(diag(6), rep(1,9))
rownames(X) <- rownames(Z)
Lambda <- diag(3)*sigma_theta^2 + tau^2

# marginal covariance for m1:
Z%*%kronecker(diag(6), Lambda)%*%t(Z)
# for m2:
X%*%t(X)*sigma_eta^2 + Z%*%t(Z)*sigma_omega^2

1
คำตอบที่ดีมาก! แต่ฉันคิดว่าวลี "เครื่องจักรซ้อนกันภายในผู้ปฏิบัติงาน" อาจทำให้เข้าใจผิดเนื่องจากเครื่องสามเครื่องเดียวกันปรากฏในพนักงานมากกว่าหนึ่งคน (ในความเป็นจริงทุกคน)
statmerkur

@atmerkur ขอบคุณฉันพยายามชี้แจงบรรทัดนี้ แจ้งให้เราทราบหากคุณมีข้อเสนอแนะอื่น
Nate Pope

1
ควรกำหนดเป็น ? X = ฉัน61 9XX=I619
S. Catterall Reinstate Monica

1
@ S.Catterall Yup นั่นเป็นคำสะกดผิด - ขอบคุณสำหรับการจับมัน! ฉันแก้ไขคำตอบแล้ว
เนทสมเด็จพระสันตะปาปา

2
@atmerkur คุณสามารถอธิบายสิ่งที่คุณหมายถึงอะไร ไม่มีโควาเรียต์ต่อเนื่องที่นี่ดังนั้นไม่แน่ใจว่าคุณหมายถึงอะไรโดย "ความชัน" วิธีที่ฉันคิดของแบบจำลองคือมีความแตกต่างอย่างเป็นระบบในค่าเฉลี่ยของการตอบสนองระหว่างเครื่อง (ผลคงที่) จากนั้นมีการเบี่ยงเบนแบบสุ่มสำหรับผู้ปฏิบัติงานแต่ละคน (การสกัดกั้นแบบสุ่ม / ผู้ปฏิบัติงาน) จากนั้นจะมีการเบี่ยงเบนแบบสุ่มสำหรับชุดค่าผสมของผู้ปฏิบัติงานแต่ละเครื่อง และในที่สุดก็เบี่ยงเบนแบบสุ่มต่อการสังเกต ยิ่งความแปรปรวนของการเบี่ยงเบนแบบสุ่มมากขึ้นต่อคนงานการสังเกตที่มีความสัมพันธ์กันมากขึ้นจากคนงานที่กำหนดจะเป็นเช่นนั้นเป็นต้น
เนทพระสันตะปาปา
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.