การตรวจสอบสมมติฐาน lmer / lme แบบผสมใน R


25

ฉันวิ่งออกแบบซ้ำโดยที่ฉันทดสอบชาย 30 คนและหญิง 30 คนในภารกิจที่แตกต่างกันสามงาน ฉันต้องการที่จะเข้าใจว่าพฤติกรรมของชายและหญิงนั้นแตกต่างกันอย่างไรและขึ้นอยู่กับงานนั้นอย่างไร ฉันใช้ทั้งแพคเกจ lmer และ lme4 เพื่อตรวจสอบเรื่องนี้อย่างไรก็ตามฉันพยายามตรวจสอบสมมติฐานของทั้งสองวิธี รหัสที่ฉันเรียกใช้คือ

lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)

ฉันตรวจสอบว่าการโต้ตอบเป็นแบบจำลองที่ดีที่สุดโดยเปรียบเทียบกับแบบจำลองที่ง่ายกว่าโดยไม่มีการโต้ตอบและเรียกใช้ anova หรือไม่:

lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)

คำถามที่ 1: การใช้ตัวทำนายเชิงหมวดหมู่เหล่านี้ในรูปแบบผสมแบบเชิงเส้นสามารถใช้ได้หรือไม่
Q2: ฉันเข้าใจอย่างถูกต้องหรือไม่ว่ามันเป็นผลดีที่ตัวแปรผลลัพธ์ ("พฤติกรรม") ไม่จำเป็นต้องกระจายตัวเอง (ข้ามเพศ / งาน)?
Q3: ฉันจะตรวจสอบความสม่ำเสมอของความแปรปรวนได้อย่างไร plot(LM$fitted.values,rstandard(LM))สำหรับการใช้งานผมรูปแบบเชิงเส้นอย่างง่าย มีการใช้งานplot(reside(lm.base1))เพียงพอหรือไม่
Q4: เพื่อตรวจสอบความปกติใช้รหัสต่อไปนี้ ok?

hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)

สิ่งหนึ่งที่ฉันสังเกตคือรุ่น lme4 ที่ฉันใช้ไม่ใช่รุ่นล่าสุดดังนั้นพล็อตธรรมดา (myModel.lm) จึงใช้งานไม่ได้บางทีนี่อาจเป็นประโยชน์สำหรับผู้อ่านคนอื่น ๆ ที่จะรู้ ..
crazjo

คำตอบ:


26

Q1: ใช่ - เหมือนกับโมเดลการถดถอยใด ๆ

Q2: เหมือนกับโมเดลเชิงเส้นทั่วไปตัวแปรผลลัพธ์ของคุณไม่จำเป็นต้องกระจายตามปกติเป็นตัวแปรที่ไม่แปร อย่างไรก็ตามโมเดล LME จะสมมติว่ามีการแจกแจงส่วนที่เหลือของโมเดล ดังนั้นการแปลงหรือเพิ่มน้ำหนักให้กับตัวแบบจะเป็นวิธีในการดูแลสิ่งนี้ (และการตรวจสอบกับแผนการวินิจฉัยของหลักสูตร)

Q3: plot(myModel.lme)

qqnorm(myModel.lme, ~ranef(., level=2))Q4: รหัสนี้จะช่วยให้คุณสร้าง QQ แปลงสำหรับแต่ละระดับของลักษณะพิเศษแบบสุ่ม โมเดล LME สมมติว่าไม่เพียง แต่ส่วนที่เหลือภายในคลัสเตอร์จะกระจายตามปกติ แต่แต่ละเอฟเฟกต์แบบสุ่มก็มีเช่นกัน แปรผันlevelตั้งแต่ 0, 1, ถึง 2 เพื่อให้คุณสามารถตรวจสอบหนูงานและสิ่งตกค้างภายในเรื่อง

แก้ไข: ฉันควรเพิ่มว่าในขณะที่สันนิษฐานว่าปกติและการเปลี่ยนแปลงที่น่าจะช่วยลดปัญหาที่เกิดจากข้อผิดพลาด / เอฟเฟ็กต์ที่ไม่ปกติก็ไม่ชัดเจนว่าปัญหาทั้งหมดได้รับการแก้ไขจริงหรือไม่ได้มีอคติ หากข้อมูลของคุณต้องการการแปลงให้ระมัดระวังเกี่ยวกับการประเมินเอฟเฟกต์แบบสุ่ม นี่เป็นกระดาษที่อยู่นี้


ขอบคุณสำหรับคำตอบ. ฉันต้องการแชร์ชุดข้อมูลและสคริปต์เพื่อการวิเคราะห์รวมถึงผลลัพธ์เพื่อดูว่าสิ่งที่ฉันทำถูกต้องหรือไม่ มันเป็นไปได้ในการแลกเปลี่ยนสแต็ค? ยิ่งกว่านั้นฉันคิดว่าฉันวิ่งผิดปัจจัยแบบสุ่ม (1 | หนู / งาน) มันควรจะไม่ใช่แค่ (1 | หนู) หรือไม่? ฉันทดสอบ 60 rats (30 ของแต่ละเพศ) ในสามภารกิจ
crazjo

9
ฉันลองใช้รหัสสำหรับไตรมาสที่ 4 เมื่อเร็ว ๆ นี้และฉันได้รับข้อผิดพลาดเกี่ยวกับวัตถุประเภท 'S4' ซึ่งไม่สามารถรีเซ็ตได้ รหัสนั้นเหมาะสำหรับรุ่นที่เหมาะสมกับแพ็คเกจ lme หรือไม่ เกี่ยวกับ lme4
emudrak

เกี่ยวกับไตรมาสที่ 4 ผู้ที่ทำแปลงเหล่านั้นจำเป็นต้องจำไว้ว่า N สำหรับแต่ละแปลงที่ผลิตจะมีขนาดเล็กกว่าอย่างมีนัยสำคัญทั้งหมดดังนั้นแผนการจะมีความแปรปรวนมากขึ้น อย่าคาดหวังให้พวกเขาดูกระจายตามปกติโดยรวมอย่างสม่ำเสมอ
John

14

คุณดูเหมือนจะเข้าใจผิดเกี่ยวกับสมมติฐานที่อยู่รอบตัวแบบหลายระดับ ไม่มีข้อสันนิษฐานของความสม่ำเสมอของความแปรปรวนในข้อมูลเพียงว่าส่วนที่เหลือควรจะกระจายประมาณปกติ และตัวทำนายเชิงหมวดหมู่ถูกใช้ในการถดถอยตลอดเวลา (ฟังก์ชันพื้นฐานใน R ที่รัน ANOVA คือคำสั่งการถดถอยเชิงเส้น)

สำหรับรายละเอียดเกี่ยวกับการตรวจสอบสมมติฐานลองดูที่หนังสือ Pinheiro และ Bates (หน้า 174, หัวข้อ 4.3.1) นอกจากนี้หากคุณวางแผนที่จะใช้ lme4 (ซึ่งไม่ได้เขียนหนังสือเล่มนี้) คุณสามารถทำซ้ำพล็อตของพวกเขาโดยใช้พล็อตที่มีlmerรูปแบบ ( ?plot.merMod)

qqnorm(resid(myModel))ตรวจสอบอย่างรวดเร็วปกติมันก็จะเป็น


ขอบคุณสำหรับความคิดเห็นของคุณ คุณแนะนำให้ใช้ lmer กับวิธี lme4 หรือไม่? และฉันถูกต้องในการทำความเข้าใจตัวแปรตอบสนองไม่จำเป็นต้องกระจายตามปกติหรือไม่ ฉันจะอ่านหนังสือพินเฮโรและเบทส์อย่างเหมาะสม
crazjo

นอกจากนี้คุณแน่ใจหรือไม่ว่ารัน qqnorm (ส่วนที่เหลือ (myModel)) ในโมเดลผสมที่มีหลายปัจจัย
crazjo

ฟังก์ชัน lmer ที่ใหม่กว่ามีความสามารถและประสิทธิภาพที่สูงขึ้น คุณลอง qqnorm แล้วหรือยัง ทำตามคำแนะนำในตอนต้นของหนังสือเกี่ยวกับวิธีการอ่าน
John

พล็อตที่ฉันเคยดูแปลก ๆ อาจเป็นเพราะฉันไม่มีเวอร์ชั่นใหม่ล่าสุดของ lmer ขอบคุณที่สังเกตสิ่งนี้มันทำงานได้ตามต้องการ
crazjo

12

เกี่ยวกับ Q2:

ตาม Pinheiro และ Bates ' หนังสือคุณอาจใช้วิธีการต่อไปนี้:

"การ lmeฟังก์ชั่นนี้อนุญาตให้สร้างแบบจำลองของ heteroscesdasticity ของกลุ่มภายในข้อผิดพลาดผ่านการweightsโต้แย้งหัวข้อนี้จะกล่าวถึงรายละเอียดใน§ 5.2 แต่สำหรับตอนนี้มันพอเพียงที่จะทราบว่า varIdentโครงสร้างฟังก์ชั่นแปรปรวนช่วยให้เกิดความแปรปรวนที่แตกต่างกัน ปัจจัยและสามารถนำมาใช้เพื่อให้พอดีกับแบบจำลอง heteroscedastic [... ] "

Pinheiro และ Bates, p. 177

หากคุณต้องการตรวจสอบความแปรปรวนที่เท่ากันระหว่างsexคุณอาจใช้วิธีนี้:

plot( lm.base2, resid(., type = "p") ~ fitted(.) | sex,
  id = 0.05, adj = -0.3 )

หากความแปรปรวนแตกต่างกันคุณสามารถอัปเดตโมเดลของคุณในลักษณะดังต่อไปนี้:

lm.base2u <- update( lm.base2, weights = varIdent(form = ~ 1 | sex) )
summary(lm.base2u)

ยิ่งไปกว่านั้นคุณอาจดูrobustlmmแพ็คเกจที่ใช้วิธีการชั่งน้ำหนักด้วย วิทยานิพนธ์ระดับปริญญาเอกของ Koller เกี่ยวกับแนวคิดนี้มีให้ในแบบเปิด ("การประมาณค่าที่แม่นยำของโมเดลเชิงเส้นผสม") รัฐนามธรรม:

"การประเมินมาตราส่วนแบบใหม่คือการประเมินการออกแบบแบบปรับตัวได้รับการพัฒนาโดยมีจุดประสงค์เพื่อให้พื้นฐานเสียงสำหรับการทดสอบที่มีประสิทธิภาพในเวลาต่อมาซึ่งทำได้โดยการปรับสมดุลความต่างธรรมชาติตามธรรมชาติของส่วนที่เหลือและปรับสมการ การแก้ไขแบบปรับเปลี่ยนการออกแบบเหล่านี้มีความสำคัญในการตั้งค่าตัวอย่างขนาดเล็กซึ่งจำนวนการสังเกตอาจจะเป็นเพียงแค่จำนวนครั้งของจำนวนพารามิเตอร์ที่จะประมาณหรือน้อยกว่า "



ฉันไม่มีคะแนนเพียงพอสำหรับความคิดเห็น อย่างไรก็ตามฉันเห็นความจำเป็นที่จะต้องอธิบายบางแง่มุมของคำตอบของ @John ด้านบน รัฐ Pinheiro และ Bates บนหน้า 174:

อัสสัมชัญ 1 - ข้อผิดพลาดภายในกลุ่มมีความเป็นอิสระและกระจายตามปกติเหมือนกันโดยมีค่าเฉลี่ยศูนย์และความแปรปรวนσ2และข้อผิดพลาดเหล่านี้เป็นอิสระจากการสุ่มแบบสุ่ม

ข้อความนี้ไม่ชัดเจนเกี่ยวกับความแปรปรวนที่เป็นเนื้อเดียวกันและฉันไม่ลึกพอที่จะรู้สถิติทั้งหมดที่อยู่เบื้องหลังแนวคิด LME อย่างไรก็ตามในวันที่ 175, §4.3.1, ส่วนที่เกี่ยวข้องกับข้อสันนิษฐาน 1พวกเขาเขียน:

ในส่วนนี้เรามีสมาธิอยู่กับวิธีการในการประเมินสมมติฐานที่ว่าข้อผิดพลาดภายในกลุ่มมีการกระจายตามปกติเป็นศูนย์กลางที่ศูนย์และมีความแปรปรวนอย่างต่อเนื่อง

นอกจากนี้ในตัวอย่างต่อไปนี้ " ความแปรปรวนคงที่ " ก็มีความสำคัญเช่นกัน ดังนั้นหนึ่งอาจคาดการณ์ว่าพวกเขาบ่งบอกถึงความแปรปรวนที่เป็นเนื้อเดียวกันเมื่อพวกเขาเขียน " กระจายปกติเหมือนกัน " ใน p 174 โดยไม่ต้องพูดถึงโดยตรง


-6

Q1: ใช่ทำไมล่ะ

Q2: ฉันคิดว่าความต้องการคือข้อผิดพลาดที่กระจายตามปกติ

Q3: สามารถทดสอบได้ด้วยการทดสอบของ Leven

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.