อนุญาตการเปรียบเทียบโมเดลเอฟเฟกต์แบบผสม (เอฟเฟกต์แบบสุ่มเป็นหลัก)


20

ฉันได้ดูการสร้างเอฟเฟ็กต์แบบผสมโดยใช้แพ็คเกจ lme4 ในอาร์ฉันใช้lmerคำสั่งเป็นหลักดังนั้นฉันจะถามคำถามของฉันผ่านรหัสที่ใช้ไวยากรณ์นั้น ฉันคิดว่าคำถามง่าย ๆ ทั่วไปอาจจะใช่ไหมที่จะเปรียบเทียบสองโมเดลที่สร้างขึ้นในการlmerใช้อัตราส่วนความน่าจะเป็นตามชุดข้อมูลที่เหมือนกันหรือไม่ ฉันเชื่อว่าคำตอบนั้นต้องเป็น "ไม่" แต่ฉันไม่ถูกต้อง ฉันได้อ่านข้อมูลที่ขัดแย้งกันว่าเอฟเฟกต์แบบสุ่มจะต้องเหมือนกันหรือไม่และองค์ประกอบของเอฟเฟกต์แบบสุ่มนั้นมีความหมายอย่างไร ดังนั้นฉันจะนำเสนอตัวอย่างเล็ก ๆ น้อย ๆ ฉันจะนำพวกเขาจากข้อมูลการวัดซ้ำ ๆ โดยใช้การกระตุ้นคำบางทีบางอย่างเช่นBaayen (2008)น่าจะมีประโยชน์ในการตีความ

สมมติว่าฉันมีแบบจำลองที่มีตัวทำนายเอฟเฟกต์คงที่สองตัวเราจะเรียกพวกมันว่า A และ B และเอฟเฟกต์สุ่มบางอย่าง ... คำศัพท์และวิชาที่มองเห็นพวกมัน ฉันอาจสร้างแบบจำลองดังต่อไปนี้

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(โปรดทราบว่าฉันตั้งใจออกไปdata =และเราจะถือว่าฉันหมายถึงREML = FALSEเพื่อความชัดเจนเสมอ)

ทีนี้จากแบบจำลองต่อไปนี้ซึ่งเป็นสิ่งที่โอเคที่จะเปรียบเทียบกับอัตราส่วนความน่าจะเป็นกับแบบจำลองข้างบนและแบบใด?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

ฉันรับทราบว่าการตีความความแตกต่างเหล่านี้อาจเป็นเรื่องยากหรือเป็นไปไม่ได้ แต่ลองแยกกันสักครู่ ฉันแค่อยากรู้ว่ามีบางสิ่งบางอย่างพื้นฐานในการเปลี่ยนแปลงที่นี่ซึ่งกีดกันความเป็นไปได้ของการเปรียบเทียบ ฉันยังต้องการทราบว่าหาก LRs เป็นปกติและ AIC ก็มีการเปรียบเทียบเช่นกัน


1
ที่เกี่ยวข้อง: stats.stackexchange.com/questions/117497 ดูยังbbolker.github.io/mixedmodels-misc/...
อะมีบาพูดว่า Reinstate Monica

(ฉันสังเกตว่าคุณลบแท็ก [การทดสอบสมมติฐาน] ที่ฉันเพิ่มไปก่อนหน้านี้แล้วแต่คุณ แต่ฉันคิดว่ามันเหมาะสม: การทดสอบอัตราส่วนความน่าจะเป็นเป็นกระบวนการทดสอบสมมุติฐานที่ชัดเจนและ [แบบจำลองผสม] + [การทดสอบสมมติฐาน ] เป็นชุดข้อมูลแท็กที่ให้ข้อมูล IMHO ดูที่stats.stackexchange.com/questions/tagged/… )
อะมีบาพูดว่า Reinstate Monica

แก้ไขแล้วเพื่อลบ "ทดสอบ" จาก LR สามารถตีความ LRs ได้โดยไม่ต้องทดสอบและทำให้ขนานกับ AIC และทำตามความตั้งใจจริงของฉันได้ดีขึ้น ขอบคุณสำหรับการชี้ให้เห็นว่า
จอห์น

คำตอบ:


13

สิ่งเหล่านี้สามารถนำมาเปรียบเทียบกับ AIC ได้ หากเอฟเฟกต์คงที่นั้นเหมือนกัน ( m1ถึงm4) การใช้ REML หรือ ML ใช้ได้โดยปกติแล้วจะต้องการ REML แต่ถ้าแตกต่างกันจะใช้ ML เท่านั้น อย่างไรก็ตามการตีความมักจะยากเมื่อทั้งเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่มกำลังเปลี่ยนแปลงดังนั้นในทางปฏิบัติส่วนใหญ่แนะนำให้เปลี่ยนอย่างใดอย่างหนึ่งเท่านั้น

การใช้การทดสอบอัตราส่วนความน่าจะเป็นไปได้ แต่ยุ่งเพราะการประมาณค่าไคสแควร์ปกติไม่ถือเมื่อทำการทดสอบว่าองค์ประกอบความแปรปรวนเป็นศูนย์ ดูคำตอบของ Aniko สำหรับรายละเอียด (คำชื่นชมถึง Aniko สำหรับทั้งสองอ่านคำถามอย่างระมัดระวังมากกว่าที่ฉันทำและอ่านคำตอบเดิมของฉันอย่างระมัดระวังพอที่จะสังเกตเห็นว่ามันพลาดจุดนี้ขอบคุณ!)

Pinhiero / Bates คือการอ้างอิงแบบดั้งเดิม มันอธิบายnlmeแพคเกจ แต่ทฤษฎีเหมือนกัน ส่วนใหญ่เหมือนกัน; ดั๊กเบตส์ได้เปลี่ยนคำแนะนำของเขาในการอนุมานตั้งแต่การเขียนหนังสือเล่มนั้นและคำแนะนำใหม่จะปรากฏในlme4แพ็คเกจ แต่นั่นเป็นมากกว่าที่ฉันต้องการเข้าไปที่นี่ ข้อมูลอ้างอิงที่อ่านได้มากขึ้นคือ Weiss (2005), การสร้างแบบจำลองข้อมูลระยะยาว


รุ่น m2 และ m4 หรือ m1 และ m3 ไม่สามารถเปรียบเทียบกับการทดสอบอัตราส่วนความน่าจะเป็น พวกเขาไม่ได้เป็นแบบจำลองที่ซ้อนกัน
มาโคร

โอ๊ะขอบคุณที่รับทราบ @Macro! ดูการแก้ไข
แอรอน - คืนสถานะโมนิก้า

คำถามนี้เกี่ยวกับการเปรียบเทียบแบบจำลองกับแบบจำลอง m ไม่ใช่แบบอื่น แต่อย่างไรก็ตามคุณกำลังบอกว่าการเปรียบเทียบ AIC สามารถทำได้แม้ว่าจะไม่ซ้อนกันหรือไม่? คำตอบสำหรับคำถามนี้ดูเหมือนจะขัดแย้งกัน
จอห์น

@ จอห์นฉันอ่านคำตอบเหล่านั้น แต่พลาดที่จะกล่าวถึง AIC และไม่ซ้อนกัน ฉันค่อนข้างแน่ใจว่าใช้ได้ แต่คุณสามารถให้ตัวชี้ที่แม่นยำกว่ากับคำตอบนั้นได้หรือไม่?
แอรอน - คืนสถานะโมนิก้า

ฉันลงคะแนนคำตอบเพราะคุณผิด (หรืออย่างน้อยทำให้เข้าใจผิด) เกี่ยวกับการบังคับใช้ของการทดสอบอัตราส่วนความน่าจะเป็น
Aniko

12

mmm4σ2=0

mm212χ12+12χ02χ12

อย่างไรก็ตามตามที่ @Aaron ระบุผู้เชี่ยวชาญหลายคนไม่แนะนำให้ทำการทดสอบอัตราส่วนความน่าจะเป็นแบบนี้ ทางเลือกที่เป็นไปได้คือเกณฑ์ข้อมูล (AIC, BIC, ฯลฯ ) หรือการเริ่มการทำงานของ LRT

[1] ตนเอง, SG & เหลียง, K. คุณสมบัติแบบอะซิติกติกของตัวประมาณความน่าจะเป็นสูงสุดและการทดสอบอัตราส่วนความน่าจะเป็นภายใต้เงื่อนไขที่ไม่เป็นมาตรฐาน J. Amer statist รศ., 2530, 82, 605-610


1
ขอบคุณสำหรับข้อมูล LR ฉันไม่ได้คิดเกี่ยวกับปัญหาขอบเขตของ LR เมื่อสร้างแบบจำลองสำหรับตัวอย่าง ฉันเพิ่งสังเกตเห็นว่ามันไม่ชัดเจนในคำตอบของคุณหากคำแนะนำของคุณนำไปใช้กับกรณีง่าย ๆ เช่นการเปรียบเทียบแบบจำลองที่มีเอฟเฟกต์คงที่ที่แตกต่างกัน (แน่นอนประมาณ ML)
จอห์น

ไม่ปัญหานี้เกิดขึ้นเมื่อทำการทดสอบส่วนประกอบความแปรปรวนไม่ใช่ผลกระทบคงที่
แอรอน - คืนสถานะโมนิก้า
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.