เปรียบเทียบโมเดลเอฟเฟกต์แบบผสมด้วยจำนวนองศาอิสระเท่ากัน


15

ฉันมีการทดลองที่ฉันจะพยายามทำให้เป็นนามธรรมที่นี่ ลองนึกภาพฉันโยนหินสีขาวสามใบไว้หน้าคุณและขอให้คุณตัดสินเกี่ยวกับตำแหน่งของพวกเขา ฉันบันทึกคุณสมบัติต่าง ๆ ของหินและการตอบสนองของคุณ ฉันทำสิ่งนี้กับหลาย ๆ วิชา ฉันสร้างสองรุ่น หนึ่งคือหินที่อยู่ใกล้คุณที่สุดทำนายการตอบสนองของคุณและอีกอย่างคือหินเรขาคณิตที่อยู่ตรงกลางทำนายการตอบสนองของคุณ ดังนั้นการใช้ lmer ใน RI สามารถเขียนได้

mNear   <- lmer(resp ~ nearest + (1|subject), REML = FALSE)
mCenter <- lmer(resp ~ center  + (1|subject), REML = FALSE)

อัปเดตและเปลี่ยน - เวอร์ชันตรงเพิ่มเติมที่รวมความคิดเห็นที่เป็นประโยชน์ไว้หลายประการ

ฉันสามารถลอง

anova(mNear, mCenter)

ซึ่งไม่ถูกต้องแน่นอนเพราะพวกมันไม่ได้ซ้อนกันอยู่และฉันไม่สามารถเปรียบเทียบพวกเขาในแบบนั้นได้ ฉันคาดหวังว่า anova.mer จะโยนข้อผิดพลาด แต่ก็ไม่ได้ แต่ความเป็นไปได้ในการทำรังที่ฉันสามารถลองได้ที่นี่ไม่เป็นธรรมชาติและยังทำให้ฉันมีงบการวิเคราะห์ค่อนข้างน้อย เมื่อแบบจำลองซ้อนกันตามธรรมชาติ (เช่นกำลังสองบนเส้นตรง) การทดสอบเป็นทางเดียวเท่านั้น แต่ในกรณีนี้มันหมายความว่าอย่างไรที่จะมีการค้นพบที่ไม่สมมาตร

ตัวอย่างเช่นฉันสามารถสร้างโมเดลสาม:

mBoth <- lmer(resp ~ center + nearest + (1|subject), REML = FALSE)

จากนั้นฉันก็สามารถ anova

anova(mCenter, mBoth)
anova(mNearest, mBoth)

นี่เป็นสิ่งที่ควรทำและตอนนี้ฉันพบว่าศูนย์กลางเพิ่มผลที่ใกล้ที่สุด (คำสั่งที่สอง) แต่จริง ๆ แล้ว BIC จะเพิ่มขึ้นเมื่อมีการเพิ่มที่ใกล้ที่สุดเข้าไปในศูนย์ สิ่งนี้เป็นการยืนยันสิ่งที่สงสัย

แต่การค้นหานี้เพียงพอหรือไม่ และเป็นงานนี้เมื่อกลางและใกล้ที่สุดมีความสัมพันธ์สูงมาก?

มีวิธีที่ดีกว่าในการวิเคราะห์แบบจำลองเมื่อไม่เกี่ยวกับการเพิ่มและลบตัวแปรอธิบาย (ดีกรีอิสระ) หรือไม่?


แบบจำลองของคุณไม่ซ้อนกันอะไรคือเหตุผลในการใช้ LRT ระหว่างทั้งสอง
chl

สิ่งที่ปรับปรุงใหม่ตามความคิดเห็นของคุณ
John

คำตอบ:


9

ถึงกระนั้นคุณสามารถคำนวณช่วงความมั่นใจสำหรับเอฟเฟกต์คงที่ของคุณและรายงาน AIC หรือ BIC (ดูเช่นCnann et al. , Stat Med 1997 16: 2349)

ตอนนี้คุณอาจสนใจดูการประเมินแบบจำลองล้อเลียนโดยใช้พารามิเตอร์ bootstrapจาก Wagenmakers และคณะ ซึ่งดูเหมือนจะคล้ายคำถามเริ่มต้นของคุณมากขึ้นเกี่ยวกับการประเมินคุณภาพของโมเดลคู่แข่งสองแบบ

มิฉะนั้นสองบทความเกี่ยวกับการวัดความแปรปรวนที่อธิบายใน LMM ที่อยู่ในใจของฉันคือ:

  • ลอยด์เจ. เอ็ดเวิร์ดส์คี ธ อี. มุลเลอร์, รัสเซลดี. โวล์ฟเฟอร์, Bahjat F. Qaqish และโอลิเวอร์ Schabenberger (2008) สถิติ R2 สำหรับผลกระทบคงที่ในตัวแบบผสมแบบเชิงเส้น , สถิติการแพทย์ , 27 (29), 6137–6157
  • Ronghui Xu (2003) การวัดที่อธิบายความแปรปรวนในตัวแบบเอฟเฟกต์แบบผสมเชิงเส้น, สถิติทางการแพทย์ , 22 (22), 3527–3541

แต่อาจมีตัวเลือกที่ดีกว่า


11

การทำตามคำแนะนำของ ronaf นำไปสู่บทความล่าสุดโดย Vuong สำหรับการทดสอบอัตราส่วนความน่าจะเป็นในโมเดลที่ไม่ได้ซ้อนกัน มันขึ้นอยู่กับ KLIC (Kullback-Leibler Information Criterion) ซึ่งคล้ายกับ AIC ซึ่งจะลดระยะทาง KL ให้เหลือน้อยที่สุด แต่มันตั้งค่าข้อกำหนดความน่าจะเป็นสำหรับสมมติฐานเพื่อให้การใช้ LRT นำไปสู่การเปรียบเทียบที่มีหลักการมากขึ้น การทดสอบ Cox และ Vuong รุ่นที่เข้าถึงได้ง่ายขึ้นนำเสนอโดย Clarke et al; โดยเฉพาะดูรูปที่ 3 ซึ่งนำเสนออัลกอริทึมสำหรับการคำนวณการทดสอบ Vuong LRT

ดูเหมือนว่าจะมีการใช้งาน R ของการทดสอบ Vuong ในรุ่นอื่น แต่ไม่ใช่ lmer ถึงกระนั้นโครงร่างดังกล่าวข้างต้นควรจะเพียงพอที่จะใช้ ฉันไม่คิดว่าคุณจะได้รับโอกาสประเมินจากแต่ละจุดข้อมูลจาก lmer ตามที่จำเป็นสำหรับการคำนวณ ในหมายเหตุเกี่ยวกับ sig-ME Douglas Bates มีตัวชี้บางอย่างที่อาจเป็นประโยชน์ (โดยเฉพาะบทความสั้น ๆ ที่เขากล่าวถึง)


เก่ากว่า

อีกทางเลือกหนึ่งคือการพิจารณาค่าติดตั้งจากแบบจำลองในการทดสอบความถูกต้องของการทำนาย สถิติของ Williams-Kloot อาจเหมาะสมที่นี่ วิธีการพื้นฐานคือการถดถอยค่าจริงกับการรวมกันเชิงเส้นของค่าติดตั้งจากทั้งสองรุ่นและทดสอบความชัน:

บทความแรกอธิบายการทดสอบ (และอื่น ๆ ) ในขณะที่บทความที่สองมีการประยุกต์ใช้ในแบบจำลองพาเนลแบบเศรษฐมิติ


เมื่อใช้lmerและเปรียบเทียบ AICs ค่าเริ่มต้นของฟังก์ชันคือการใช้วิธี REML (โอกาสสูงสุดที่ จำกัด ) นี่เป็นเรื่องปกติที่จะได้รับการประเมินแบบเอนเอียงน้อยลง แต่เมื่อเปรียบเทียบแบบจำลองคุณควรปรับให้เข้ากับREML=FALSEวิธีที่มีความเป็นไปได้สูงสุดในการปรับ หนังสือPinheiro / Batesกล่าวถึงเงื่อนไขบางอย่างที่สามารถเปรียบเทียบ AIC / โอกาสกับ REML หรือ ML และสิ่งเหล่านี้อาจนำไปใช้ในกรณีของคุณได้เป็นอย่างดี อย่างไรก็ตามคำแนะนำทั่วไปคือเพียงแค่ปรับให้พอดี ตัวอย่างเช่นดูโพสต์ของดักลาสเบตส์ที่นี่:


ฉันไม่ได้ระบุว่าฉันเหมาะสมกับ REML = FALSE ฉันยังอยู่ในความสงสัยเล็กน้อย ... AIC ให้การวัดความเป็นไปได้ทั้งหมดรวมถึงเอฟเฟกต์แบบสุ่ม นั่นเป็นองค์ประกอบที่มีขนาดใหญ่ และแน่นอนว่า AIC นั้นไม่น่าจะเหมือนกันอย่างแน่นอน ดังนั้นดูเหมือนว่าไม่ฉลาดที่จะเลือกค่าที่มากขึ้นโดยไม่ต้องใช้วิธีการวิเคราะห์ในการบอกว่ามันมีขนาดใหญ่เท่าใด
จอห์น

@ John นี้บรรยายไฮไลท์จุดที่น่าสนใจเกี่ยวกับ REML ML และ AIC (และชี้ไปยังสิ่งที่คุณกล่าวว่าจอห์น) j.mp/bhUVNt รีวิว Bolker ของ GLMM ยังคุ้มค่าที่จะดูได้ที่: j.mp/cAepqA
chl

4

มีกระดาษโดยdrcoxที่กล่าวถึงการทดสอบแบบจำลองที่แยกต่างหาก มันพิจารณาตัวอย่างเล็ก ๆ น้อย ๆ ซึ่งไม่ได้เพิ่มความซับซ้อนของโมเดลผสม [เนื่องจากสิ่งอำนวยความสะดวกของฉันที่มีรหัส R มี จำกัด ฉันไม่แน่ใจว่ารุ่นของคุณคืออะไร]

กระดาษของ altho cox อาจไม่สามารถแก้ปัญหาของคุณโดยตรงอาจเป็นประโยชน์ในสองวิธีที่เป็นไปได้

  1. คุณสามารถค้นหาการอ้างอิง Google scholar จากบทความของเขาเพื่อดูว่าผลลัพธ์ดังกล่าวที่ตามมาจะเข้าใกล้สิ่งที่คุณต้องการมากขึ้นหรือไม่

  2. หากคุณเป็นคนวิเคราะห์งอคุณสามารถลองใช้วิธีการของ cox กับปัญหาของคุณ [อาจไม่เหมาะสำหรับคนที่ใจเสาะ]

btw - cox กล่าวถึงในการผ่านความคิดของ srikant broached ของการรวมสองแบบเป็นแบบที่ใหญ่กว่า เขาไม่ได้ติดตามว่าใครจะตัดสินใจว่าตัวแบบใดจะดีกว่า แต่เขาพูดว่าแม้ว่าตัวแบบจะไม่ดีนักตัวแบบที่รวมกันอาจให้ข้อมูลที่เหมาะสม [ยังไม่ชัดเจนในสถานการณ์ของคุณว่าแบบจำลองที่รวมกันเข้ากันแล้ว]


3

ฉันไม่รู้จัก R ดีพอที่จะแยกรหัสของคุณ แต่นี่เป็นแนวคิดหนึ่ง:

ประเมินแบบจำลองที่คุณมีทั้งกึ่งกลางและใกล้เคียงเป็นโควาเรียต (เรียก mBoth นี้) จากนั้น mCenter และ mNear จะซ้อนกันใน mBoth และคุณสามารถใช้ mBoth เป็นเกณฑ์มาตรฐานเพื่อเปรียบเทียบประสิทธิภาพสัมพัทธ์ของ mCenter และ mNear


1
ฉันคิดว่าสิ่งนี้จะไม่เหมาะสมเพราะทั้งสองจะมีความสัมพันธ์สูงมาก เนื่องจากศูนย์กลางอยู่ไกลดังนั้นจึงมีแนวโน้มที่จะอยู่ใกล้
จอห์น

@ John จุดดี

ฉันคิดว่าประเด็นของคุณดีเช่นกัน ... จริง ๆ แล้วฉันไม่แน่ใจว่ามันสำคัญ ฉันรู้ว่ามันสูง แต่ต่ำกว่า 0.8 ... ยังคงวิเคราะห์ได้
จอห์น
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.