พิจารณาข้อมูลต่อไปนี้จากการออกแบบสองทางภายในวิชา:
df <- "http://personality-project.org/r/datasets/R.appendix4.data"
df <- read.table(df,header=T)
head(df)
Observation Subject Task Valence Recall
1 1 Jim Free Neg 8
2 2 Jim Free Neu 9
3 3 Jim Free Pos 5
4 4 Jim Cued Neg 7
5 5 Jim Cued Neu 9
6 6 Jim Cued Pos 10
ฉันต้องการวิเคราะห์สิ่งนี้โดยใช้แบบจำลองเชิงเส้นผสม การพิจารณาเอฟเฟกต์แบบคงที่และแบบสุ่มที่เป็นไปได้ทั้งหมดมีโมเดลที่เป็นไปได้หลายแบบ:
# different fixed effects with random-intercept
a0 <- lmer(Recall~1 + (1|Subject), REML=F,df)
a1 <- lmer(Recall~Task + (1|Subject), REML=F,df)
a2 <- lmer(Recall~Valence + (1|Subject), REML=F,df)
a3 <- lmer(Recall~Task+Valence + (1|Subject), REML=F,df)
a4 <- lmer(Recall~Task*Valence + (1|Subject), REML=F,df)
# different fixed effects with random-intercept-random-slope
b0 <- lmer(Recall~1 + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b1 <- lmer(Recall~Task + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b2 <- lmer(Recall~Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b3 <- lmer(Recall~Task+Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b4 <- lmer(Recall~Task*Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
# different fixed effects with random-intercept-random-slope including variance-covariance matrix
c0 <- lmer(Recall~1 + (1 + Valence + Task|Subject), REML=F,df)
c1 <- lmer(Recall~Task + (1 + Valence + Task|Subject), REML=F,df)
c2 <- lmer(Recall~Valence + (1 + Valence + Task|Subject), REML=F,df)
c3 <- lmer(Recall~Task+Valence + (1 + Valence + Task|Subject), REML=F,df)
c4 <- lmer(Recall~Task*Valence + (1 + Valence + Task|Subject), REML=F,df)
วิธีที่แนะนำในการเลือกรูปแบบการกระชับที่สุดในบริบทนี้คืออะไร? เมื่อใช้อัตราส่วนทดสอบความน่าจะเป็นบันทึกขั้นตอนที่แนะนำคืออะไร? กำลังสร้างแบบจำลองขึ้นด้านบน (จากแบบจำลองโมฆะไปจนถึงแบบจำลองที่ซับซ้อนที่สุด) หรือแบบลงด้านล่าง (จากแบบจำลองที่ซับซ้อนที่สุดไปจนถึงแบบจำลองแบบโมฆะ)? การรวมหรือแยกแบบทีละขั้น? หรือแนะนำให้ใส่แบบจำลองทั้งหมดในการทดสอบอัตราส่วนล็อก - ต่อ - ความน่าจะเป็นและเลือกรุ่นที่มีค่า p ต่ำสุดหรือไม่ จะเปรียบเทียบแบบจำลองที่ไม่ซ้อนกันได้อย่างไร
ขอแนะนำให้หาโครงสร้างผลกระทบคงที่ที่เหมาะสมก่อนจากนั้นเลือกโครงสร้างผลกระทบแบบสุ่มที่เหมาะสมหรือวิธีอื่น ๆ (ฉันได้พบการอ้างอิงสำหรับตัวเลือกทั้งสอง ... ) หรือไม่
วิธีการรายงานผลที่แนะนำคืออะไร? การรายงานค่า p-value จากการทดสอบอัตราส่วนบันทึกความน่าจะเป็นเมื่อเปรียบเทียบกับแบบจำลองผสมทั้งหมด (ที่มีผลกระทบต่อคำถาม) กับแบบจำลองที่ลดลง (โดยไม่มีผลกระทบในคำถาม) หรือดีกว่าที่จะใช้การทดสอบอัตราส่วนความน่าจะเป็นเพื่อค้นหาแบบจำลองที่เหมาะสมที่สุดแล้วใช้ lmerTest เพื่อรายงานค่า p จากผลกระทบในแบบจำลองการฟิตติ้งที่ดีที่สุด?