อะไรคือความง่ายในการตีความความดีของการวัดขนาดพอดีสำหรับโมเดลเอฟเฟ็กต์แบบผสมเชิงเส้น


37

ฉันกำลังใช้แพคเกจ R lme4

ฉันกำลังใช้โมเดลเอฟเฟกต์แบบผสมเชิงเส้นที่มีเอฟเฟกต์แบบสุ่ม:

library(lme4)
mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects
mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + 
            # random effects
mod3 <- lmer(r1 ~ p1 + p2 + (1 | site), data = sample_set) #Two fixed effects + 
            # random effects

ในการเปรียบเทียบแบบจำลองฉันใช้anovaฟังก์ชันและดูความแตกต่างใน AIC เทียบกับแบบจำลอง AIC ต่ำสุด:

anova(mod1, mod2, mod3)

ด้านบนเป็นสิ่งที่ดีสำหรับการเปรียบเทียบรุ่น

อย่างไรก็ตามฉันยังต้องการวิธีง่ายๆในการตีความความดีของการวัดขนาดพอดีสำหรับแต่ละรุ่น ใครบ้างมีประสบการณ์กับมาตรการดังกล่าวบ้างไหม? ฉันได้ทำการวิจัยบางอย่างแล้วและมีวารสารที่ R กำลังสองสำหรับผลกระทบคงที่ของแบบผสมลักษณะพิเศษ:

  • เฉิง, เจ, เอ็ดเวิร์ดส์, LJ, มัลโดนาโด - โมลินา, MM, โคโมร, KA, & มุลเลอร์, KE (2010) การวิเคราะห์ข้อมูลระยะยาวที่แท้จริงสำหรับคนจริง: การสร้างแบบผสมที่ดีพอ สถิติทางการแพทย์, 29 (4), 504-520 ดอย: 10.1002 / sim.3775
  • Edwards, LJ, Muller, KE, Wolfinger, RD, Qaqish, BF, & Schabenberger, O. (2008) สถิติ R2 สำหรับเอฟเฟกต์คงที่ในตัวแบบผสมแบบเชิงเส้น สถิติทางการแพทย์, 27 (29), 6137-6157 ดอย: 10.1002 / sim.3429

อย่างไรก็ตามดูเหมือนว่ามีการวิพากษ์วิจารณ์บางอย่างเกี่ยวกับการใช้มาตรการเช่นที่เสนอในเอกสารข้างต้น

มีคนช่วยแนะนำสักสองสามข้อในการตีความง่ายความดีของมาตรการฟิตที่สามารถนำไปใช้กับแบบจำลองของฉันได้หรือไม่?


2
ผมชอบคำถาม แต่ใช้การทดสอบอัตราส่วนในการตรวจสอบหรือไม่ว่าผลกระทบคงมีความจำเป็นคือไม่กลยุทธ์แนะนำให้ดูที่คำถามที่พบบ่อย ดังนั้นข้างต้นจึงไม่ดีสำหรับการเปรียบเทียบแบบจำลอง
Henrik

ขอบคุณเฮนริก คำถามที่พบบ่อยที่คุณระบุไว้มีประโยชน์มาก ดูเหมือนว่าการสุ่มตัวอย่างห่วงโซ่มาร์คอฟ Monte Carlo อาจเป็นกลยุทธ์ที่ดีในการเปรียบเทียบแบบจำลองของฉัน
mjburns

1
ปัญหาเกี่ยวกับ MCMC คือคุณสามารถมีเอฟเฟกต์แบบง่าย ๆ เท่านั้น (ดังตัวอย่าง) ฉันจะใช้การประมาณ kenward-rogers กับองศาอิสระเพราะมันใช้กับโมเดลที่ซับซ้อนมากขึ้น ดูฟังก์ชั่นmixed()ในแพ็คเกจafexของฉัน( เวอร์ชั่นการพัฒนายังมี bootstrap แบบพารามิเตอร์ ) ดูที่นี่สำหรับอ้างอิงบาง
Henrik

ตกลงเฮนริก ฉันจัดการเพื่อให้ฟังก์ชัน mix () ของคุณทำงานจากแพ็คเกจ afex คุณช่วยแนะนำวิธีการใช้ afex เพื่อเปรียบเทียบรุ่นได้ไหม ฉันสามารถใช้การวัดใดในการตัดสินใจว่าแบบจำลองหนึ่งมีความน่าเชื่อถือมากกว่าแบบอื่นหรือไม่ ขอบคุณ
mjburns

นี่ไม่ใช่คำตอบที่ง่ายบางทีคุณอาจถามคำถามแยกต่างหากเพื่อให้รายละเอียดเพิ่มเติม แต่เพียงช่วงสั้น ๆ Afex พยายามช่วยคุณประเมินว่าเอฟเฟกต์บางอย่าง (หรือแบบจำลองที่ดีกว่ารวมถึงเอฟเฟกต์นี้) นั้นสำคัญหรือไม่ ด้วยเหตุนี้มันใช้จากแพคเกจKRmodcomp pbkrtestคุณยังสามารถใช้KRmodcompโดยตรงเพื่อเปรียบเทียบรุ่น
Henrik

คำตอบ:


3

ไม่มีสิ่งใดที่ง่ายต่อการตีความความดีของขนาดพอดีสำหรับโมเดลเชิงเส้นเชิงเส้น :)

การปรับเอฟเฟกต์แบบสุ่ม (mod1) สามารถวัดได้โดยICCและICC2(อัตราส่วนระหว่างความแปรปรวนที่คิดโดยเอฟเฟกต์แบบสุ่มและความแปรปรวนที่เหลือ) แพ็คเกจpsychometric R ประกอบด้วยฟังก์ชั่นในการแตกไฟล์ออกมาเป็นวัตถุ lme

เป็นไปได้ที่จะใช้R2ในการประเมินผลคงที่ (mod2, mod3) แต่สิ่งนี้อาจเป็นเรื่องยุ่งยาก: เมื่อสองรุ่นแสดง R2 ที่คล้ายกันอาจเป็นกรณีที่มี "ความถูกต้อง" มากกว่า การลบ "องค์ประกอบความแปรปรวนที่มากขึ้นสำหรับเอฟเฟกต์แบบสุ่ม ในทางกลับกันมันง่ายที่จะตีความ R2 ที่สูงกว่าของโมเดลลำดับสูงสุด (เช่น mod3) ในบทของ Baayen เกี่ยวกับแบบจำลองต่าง ๆ มีการพูดคุยกันเกี่ยวกับเรื่องนี้ นอกจากนี้การสอนมีความชัดเจนมาก

ทางออกที่เป็นไปได้คือการพิจารณาแต่ละvariance componentอย่างแยกกันจากนั้นใช้เพื่อเปรียบเทียบแบบจำลอง


1
คุณสามารถบอกเราได้ว่าอะไรคือการอ้างอิงที่คุณอ้างถึงเมื่อคุณพูดบทของ Baayen
KH Kim

ใช่การอ้างอิงเสีย!
อยากรู้อยากเห็น

ฉันพบการอ้างอิงนี้ไม่แน่ใจว่าใช่ แต่ไม่สามารถรับ PDF ได้ทุกที่: BaayenR H. , การวิเคราะห์ข้อมูลภาษาศาสตร์: การแนะนำเบื้องต้นเกี่ยวกับสถิติโดยใช้ R. Cambridge: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, 2008 Pp. 368. ISBN-13: 978-0-521-70918-7 - เล่มที่ 37 ฉบับที่ 2 - Grzegorz Krajewski, Danielle Matthews
อยากรู้อยากเห็น

1
มากับพวกคุณสิ google-foo ของคุณอยู่ที่ไหน ค้นหาใน "baayenCUPstats.pdf: ตีครั้งแรก: sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf
dwin
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.