ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM


10

ฉันมีแบบฟอร์ม GLMM:

lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + 
                (1 | factor3), family=binomial)

เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน

จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน

  • ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้?
  • เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร
  • ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?

คำตอบ:


7

ฉันคิดว่ามันเป็นความแตกต่างของการทดสอบที่คำนวณ car::Anovaใช้การทดสอบ Wald ในขณะที่drop1refits โมเดลวางคำศัพท์เดียว จอห์นฟ็อกซ์เคยเขียนถึงฉันว่าการทดสอบและแบบทดสอบ Wald จากแบบจำลองที่ผ่านการทดสอบโดยใช้การทดสอบอัตราส่วนความน่าจะเป็น (เช่นกลยุทธ์จากdrop1) เห็นด้วยกับโมเดลเชิงเส้น แต่ไม่จำเป็นต้องเป็นแบบจำลองเชิงเส้น น่าเสียดายที่จดหมายฉบับนี้เป็นรายการที่ไม่เหมาะสมและไม่มีการอ้างอิงใด ๆ แต่ฉันรู้ว่าหนังสือของเขามีบททดสอบ Wald ซึ่งอาจมีข้อมูลที่ต้องการ

ความช่วยเหลือที่จะcar::Anovaพูดว่า:

การทดสอบประเภทที่สองนั้นคำนวณตามหลักการของความเป็นชายขอบการทดสอบแต่ละเทอมหลังจากอื่น ๆ ทั้งหมดยกเว้นการละเว้นลำดับที่สูงกว่าของคำนั้น การทดสอบประเภทที่สามที่เรียกว่าเป็นการละเมิดขอบเขตการทดสอบแต่ละเทอมในโมเดลหลังจากที่อื่น ๆ ทั้งหมด คำจำกัดความของการทดสอบ Type-II นี้สอดคล้องกับการทดสอบที่ผลิตโดย SAS สำหรับแบบจำลองการวิเคราะห์ความแปรปรวนซึ่งตัวทำนายทั้งหมดเป็นปัจจัย แต่ไม่มากกว่าโดยทั่วไป (เช่นเมื่อมีตัวทำนายเชิงปริมาณ) ใช้ความระมัดระวังในการจัดทำแบบจำลองสำหรับการทดสอบ Type-III มิฉะนั้นการทดสอบสมมติฐานจะไม่สมเหตุสมผล

น่าเสียดายที่ฉันไม่สามารถตอบคำถามที่สองหรือสามได้เพราะฉันอยากรู้เช่นกัน


อัปเดตความคิดเห็นการตอบกลับ :

ไม่มีการทดสอบ Wald, LR และ F สำหรับโมเดลผสมทั่วไป Anovaเพียงแค่อนุญาต"chisq"และ"F"ทดสอบสำหรับโมเดลผสม (เช่น"mer"วัตถุที่ส่งคืนโดยlmer) ส่วนการใช้งานบอกว่า:

## S3 method for class 'mer'
Anova(mod, type=c("II","III", 2, 3), 
    test.statistic=c("chisq", "F"), vcov.=vcov(mod), singular.ok, ...)

แต่เนื่องจากการทดสอบแบบ F สำหรับmerวัตถุถูกคำนวณโดยpbkrtestซึ่งความรู้ของฉันใช้ได้เฉพาะกับตัวแบบผสมแบบเชิงเส้นเท่านั้นAnovaสำหรับ GLMMs ควรกลับมาเสมอchisq(ด้วยเหตุนี้คุณจึงไม่เห็นความแตกต่าง)

อัปเดตเกี่ยวกับคำถาม:

คำตอบก่อนหน้าของฉันเพียงแค่พยายามที่จะตอบคำถามหลักของความแตกต่างระหว่างและAnova() drop1()แต่ตอนนี้ฉันเข้าใจว่าคุณต้องการทดสอบว่าผลกระทบคงที่แน่นอนมีความสำคัญหรือไม่ R-sig ผสมการสร้างแบบจำลองคำถามที่พบบ่อยกล่าวว่าต่อไปนี้เกี่ยวกับเรื่องนี้:

การทดสอบพารามิเตอร์เดียว

จากที่เลวร้ายที่สุดถึงดีที่สุด:

  • การทดสอบ Wald Z
  • สำหรับ LMM ที่สมดุลและซ้อนกันซึ่งสามารถคำนวณ df ได้: การทดสอบ t-Wald
  • การทดสอบอัตราส่วนความน่าจะเป็นโดยการตั้งค่าแบบจำลองเพื่อให้สามารถแยก / ลดพารามิเตอร์ (ผ่าน anova หรือ drop1) หรือผ่านโปรไฟล์ความน่าจะเป็นในการคำนวณ
  • MCMC หรือพารามิเตอร์ bootstrap ช่วงความเชื่อมั่น

การทดสอบผลกระทบ (เช่นการทดสอบว่าพารามิเตอร์หลายตัวเป็นศูนย์พร้อมกัน)

จากที่เลวร้ายที่สุดถึงดีที่สุด:

  • การทดสอบ Wald chi-square (เช่นรถยนต์ :: Anova)
  • การทดสอบอัตราส่วนความน่าจะเป็น (ผ่าน anova หรือ drop1)
  • สำหรับ LMM ที่สมดุลซ้อนกันซึ่งสามารถคำนวณ df ได้: การทดสอบ F ตามเงื่อนไข
  • สำหรับ LMMs: การทดสอบ F ตามเงื่อนไขพร้อมการแก้ไข df (เช่น Kenward-Roger ในแพ็คเกจ pbkrtest)
  • MCMC หรือพารามิเตอร์หรือพารามิเตอร์เปรียบเทียบ bootstrap (bootstrapping nonparametric จะต้องดำเนินการอย่างรอบคอบเพื่อบัญชีสำหรับปัจจัยการจัดกลุ่ม)

(เน้นเพิ่ม)

นี่เป็นการบ่งชี้ว่าcar::Anova()โดยทั่วไปแล้วไม่แนะนำให้ใช้วิธีการของคุณสำหรับ GLMM แต่ควรใช้วิธีการที่ใช้ MCMC หรือ bootstrap ฉันไม่รู้ว่าpvals.fncจากlanguageRแพ็คเกจบรรจุด้วย GLMM หรือไม่ แต่มันก็คุ้มค่าที่จะลอง


1
ขอบคุณเฮนริก Anova () สามารถคำนวณการทดสอบได้สามแบบ: Wald, LR และ F. ฉันได้ลองทั้งสามแบบแล้ว แต่มันก็ไม่ต่างกัน ฉันมีความรู้สึกว่าฟังก์ชั่นจะปฏิเสธที่จะใช้การทดสอบที่ตัดสินใจว่าไม่เหมาะสมกับข้อมูล ...
tim.farkas
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.