REML vs ML stepAIC


10

ฉันรู้สึกท่วมท้นหลังจากพยายามขุดลงไปในวรรณคดีว่าจะใช้การวิเคราะห์แบบผสมของฉันได้อย่างไรหลังจากใช้ AIC เพื่อเลือกแบบจำลองหรือแบบจำลองที่ดีที่สุด ฉันไม่คิดว่าข้อมูลของฉันมีความซับซ้อน แต่ฉันกำลังมองหาการยืนยันว่าสิ่งที่ฉันทำถูกต้องแล้วแนะนำวิธีดำเนินการต่อ ฉันไม่แน่ใจว่าควรใช้ lme หรือ lmer หรือไม่ถ้าใช้อย่างใดอย่างหนึ่งควรใช้ REML หรือ ML

ฉันมีคุณค่าในการเลือกและฉันต้องการรู้ว่า covariates ที่ดีที่สุดมีอิทธิพลต่อคุณค่านั้นและอนุญาตให้มีการคาดการณ์ นี่คือตัวอย่างข้อมูลและโค้ดสำหรับการทดสอบที่ฉันใช้:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

ฉันมีโมเดล 19 รุ่นที่สำรวจข้อมูลนี้ด้วยชุดค่าผสมที่หลากหลายและมีเงื่อนไขการโต้ตอบ 2 ทาง แต่จะใช้ ID เป็นเอฟเฟกต์แบบสุ่มและ comp1 เป็นตัวแปรตามเสมอ

  • ไตรมาสที่ 1 ต้องใช้อะไร lme หรือ lmer มันสำคัญไหม

ในทั้งสองสิ่งนี้ฉันมีตัวเลือกในการใช้ ML หรือ REML - และฉันได้รับคำตอบที่แตกต่างกันอย่างมาก - การใช้ ML ตามด้วย AIC ฉันจบด้วย 6 รุ่นทั้งหมดที่มีค่า AIC ที่คล้ายคลึงกันและชุดแบบจำลองไม่สมเหตุสมผล ผลลัพธ์ใน 2 โมเดลที่น่าจะเป็นที่สุด อย่างไรก็ตามเมื่อใช้งาน REML ฉันไม่สามารถใช้ anova ได้อีกต่อไป

  • ไตรมาสที่ 2 เป็นเหตุผลหลักที่ใช้ ML เกิน REML เพราะใช้กับ ANOVA? นี่ไม่ชัดเจนสำหรับฉัน

ฉันยังคงไม่สามารถเรียกใช้ stepAIC หรือฉันไม่รู้วิธีอื่นในการ จำกัด รุ่น 19 รุ่นเหล่านั้นให้แคบลง

  • ไตรมาสที่ 3 มีวิธีใช้ stepAIC ณ จุดนี้หรือไม่

3
สำหรับ Q2, ML จำเป็นเนื่องจากการเปรียบเทียบการใช้ REML ไม่ถูกต้องเมื่อผลกระทบคงที่เปลี่ยนไป คำถามที่เป็นประโยชน์ที่เกี่ยวข้องที่เป็นไปได้อยู่ที่นี่: stats.stackexchange.com/a/16015/3601
แอรอนออกจากสแต็ค

@ Aaron ฉันเคยดูคำถามนั้นมาก่อน แต่ก็ยังสับสนอยู่ ใช้ REML เท่านั้น "ทำงาน" เมื่อเอฟเฟกต์แบบสุ่มเปลี่ยนไปหรือไม่ เห็นได้ชัดว่าฉันไม่เข้าใจ ML vs REML เพียงพอ ขอบคุณที่ช่วยด้วยหนึ่งในคำถามของฉัน!
Kerry

ใช่ถูกต้องแล้ว เมื่อเปรียบเทียบรุ่นควรใช้ REML เฉพาะเมื่อรุ่นมีเอฟเฟกต์คงที่เหมือนกัน ขยายคำตอบด้านล่าง
Aaron ออกจาก Stack Overflow

คำตอบ:


16

ไตรมาสที่ 1 ต้องใช้อะไร lme หรือ lmer มันสำคัญไหม ทั้งเป็นเรื่องปกติ พวกเขาจะให้พอดีกับคุณ lmeจะให้ค่า p กับคุณและlmerจะไม่ แต่นั่นเป็นมากกว่าที่ฉันต้องการเข้าไปที่นี่ การอ้างอิงที่มีชื่อเสียงที่สุดคือการโพสต์ดั๊กเบตส์เพื่อ R-ช่วยเหลือรายชื่อที่นี่

(ข้อแม้: พวกเขาจะใช้ขั้นตอนวิธีการที่แตกต่างกันเล็กน้อยเพื่อให้มีกรณีที่อาจเกิดขึ้นบางเรื่องยากคอมพิวเตอร์ที่หนึ่งหรืออื่น ๆ อาจจะทำได้ดีกว่า แต่ผู้ที่หายากมากในทางปฏิบัติจริงและส่วนใหญ่มีแนวโน้มชี้ไปที่ชนิดของแบบจำลอง misspecification บางคนเห็น. ที่แตกต่างกันโดยสิ้นเชิง ผลลัพธ์จาก lmer () และ lme () .)

ไตรมาสที่ 2 เป็นเหตุผลหลักที่ใช้ ML เกิน REML เพราะใช้กับ ANOVA? นี่ไม่ชัดเจนสำหรับฉัน ML เป็นสิ่งจำเป็นเนื่องจากการเปรียบเทียบโดยใช้ REML ไม่ถูกต้องเมื่อเอฟเฟกต์คงที่เปลี่ยนไป ผลอาจคำถามที่เกี่ยวข้องที่มีประโยชน์อยู่ที่นี่: https://stats.stackexchange.com/a/16015/3601 ในการตอบคำถามของคุณในความคิดเห็นด้านบนใช่เมื่อทำการเปรียบเทียบแบบจำลองควรใช้ REML เฉพาะเมื่อแบบจำลองนั้นมีเอฟเฟกต์คงที่เหมือนกัน (กล่าวคือเมื่อเอฟเฟกต์สุ่มเปลี่ยนเท่านั้น) โอกาสของ REML นั้นขึ้นอยู่กับเอฟเฟกต์คงที่ซึ่งอยู่ในโมเดลดังนั้นจึงไม่สามารถเทียบเคียงได้หากเอฟเฟกต์คงที่เปลี่ยนไป โดยทั่วไปจะมีการพิจารณาว่าให้การประมาณที่ดีกว่าสำหรับเอฟเฟกต์แบบสุ่มดังนั้นคำแนะนำทั่วไปคือให้พอดีกับแบบจำลองที่ดีที่สุดของคุณโดยใช้ REML สำหรับการสรุปและการรายงานขั้นสุดท้าย

ไตรมาสที่ 3 มีวิธีใช้ stepAIC ณ จุดนี้หรือไม่ ในการเปรียบเทียบระหว่างรุ่น 19 รุ่นของคุณที่เข้าท่ากับสถานการณ์ของคุณเพียงเปรียบเทียบ AIC ให้กับทุกรุ่น ไม่มีเหตุผลที่จะใช้ขั้นตอนแบบขั้นตอนเลย โดยทั่วไปแล้วขั้นตอนแบบขั้นตอนจะเห็นว่าล้าสมัยในปัจจุบันเนื่องจากไม่รับประกันว่าจะพบรุ่นที่ดีที่สุดและคอมพิวเตอร์ทำให้ง่ายต่อการเปรียบเทียบรุ่นจำนวนมาก


1

ในการขุดต่อไปฉันได้พบแหล่งข้อมูลเหล่านี้ที่สำรองลิงค์ที่แอรอนได้จัดเตรียมไว้และเป็นการอ่านที่ดีสำหรับผู้ที่เริ่มต้นเหมือนตัวฉัน บทที่เชื่อมโยงกับhttp://lme4.r-forge.r-project.org/สำหรับตัวอย่างตรวจสอบลิงค์สไลด์http://lme4.r-forge.r-project.org/slides/ในหน้าโครงการเดียวกัน . หลักสูตรระยะสั้นหลายแห่งมีตัวอย่างรหัส R ซึ่งช่วยได้มาก
คำตอบสั้น ๆ นี้โดยดร. โบลเคอร์http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.