โมเดลเชิงเส้นผสมแบบทั่วไป: การวินิจฉัย


11

ฉันมีการถดถอยแบบลอจิสติกเพื่อสกัดกั้นแบบสุ่ม (เนื่องจากการวัดซ้ำ) และฉันต้องการที่จะทำการวินิจฉัยบางอย่างโดยเฉพาะเกี่ยวกับค่าผิดปกติและการสังเกตที่มีอิทธิพล

ฉันดูที่เหลือเพื่อดูว่ามีข้อสังเกตที่โดดเด่นหรือไม่ แต่ฉันก็อยากจะดูบางอย่างเช่นระยะทางของ Cook หรือ DFFITS Hosmer และ Lemeshow (2000) กล่าวว่าเนื่องจากการขาดเครื่องมือวินิจฉัยแบบจำลองสำหรับข้อมูลที่มีความสัมพันธ์หนึ่งควรจะพอดีกับแบบจำลองการถดถอยโลจิสติกปกติละเว้นความสัมพันธ์และใช้เครื่องมือวินิจฉัยที่มีอยู่สำหรับการถดถอยโลจิสติกปกติ พวกเขายืนยันว่าสิ่งนี้จะดีกว่าไม่ได้ทำการวินิจฉัยใด ๆ เลย

หนังสือเล่มนี้มาจากปี 2000 และฉันสงสัยว่าตอนนี้มีวิธีการสำหรับการวินิจฉัยแบบจำลองที่มีผลกระทบการถดถอยโลจิสติกแบบผสมหรือไม่? สิ่งที่จะเป็นวิธีที่ดีในการตรวจสอบค่าผิดปกติ?

แก้ไข (5 พฤศจิกายน 2013):

เนื่องจากการขาดการตอบสนองฉันสงสัยว่าการทำการวินิจฉัยด้วยโมเดลที่หลากหลายนั้นไม่ได้ทำโดยทั่วไปหรือไม่ใช่ขั้นตอนที่สำคัญเมื่อทำการสร้างแบบจำลองข้อมูล ดังนั้นฉันขอใช้ถ้อยคำใหม่คำถามของฉัน: คุณจะทำอย่างไรเมื่อคุณพบรูปแบบการถดถอยที่ "ดี"?


ซ้ำซ้อนกับคำถามล่าสุดที่คล้ายกันซึ่งยังไม่ได้รับความสนใจมาก: stats.stackexchange.com/q/70783/442
Henrik

คุณอาจพบคำตอบของฉันสำหรับคำถามที่คล้ายกันเป็นประโยชน์
Randel

คำตอบ:


2

วิธีการวินิจฉัยนั้นแตกต่างกันสำหรับโมเดลเชิงเส้นผสมทั่วไป สิ่งที่สมเหตุสมผลที่ฉันได้เห็นว่าเป็นไปตามเศษเหลือจาก GLMM นั้นเกิดจาก Pan and Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x) พวกเขาใช้จำนวนเงินสะสมที่เหลือซึ่งการสั่งซื้อจะถูกกำหนดโดยตัวแปรอธิบายหรือโดยตัวทำนายเชิงเส้นดังนั้นการทดสอบทั้งข้อกำหนดของรูปแบบการทำงานของตัวทำนายที่กำหนดหรือฟังก์ชั่นการเชื่อมโยงโดยรวม การแจกแจงแบบโมฆะขึ้นอยู่กับการจำลองจากพื้นที่การออกแบบจากการแจกแจงโมฆะของข้อกำหนดที่ถูกต้องและพวกมันแสดงให้เห็นถึงขนาดที่เหมาะสมและคุณสมบัติด้านพลังงานของการทดสอบนี้ พวกเขาไม่ได้พูดคุยเกี่ยวกับค่าผิดปกติโดยเฉพาะ แต่ฉันสามารถจินตนาการได้ว่าค่าผิดปกติน่าจะลดลงอย่างน้อยฟังก์ชันลิงก์โดยทำให้โค้งมากเกินไปต่อการสังเกตที่มีอิทธิพล


0

มีความคิดเห็นที่แตกต่างกันมากมายเกี่ยวกับวิธีที่ดีที่สุดในการดูการวินิจฉัยสำหรับรุ่นผสม โดยทั่วไปคุณจะต้องดูทั้งส่วนที่เหลือและด้านมาตรฐานที่จะตรวจสอบสำหรับรูปแบบที่ไม่ใช่มาตรการซ้ำ

นอกจากนั้นโดยทั่วไปแล้วคุณจะต้องการดูเอฟเฟกต์แบบสุ่มด้วยตนเอง วิธีการมักจะเกี่ยวข้องกับการวางแผนผลกระทบแบบสุ่มโดย covariates ต่าง ๆ และมองหา non-normality ในการกระจายลักษณะพิเศษแบบสุ่ม มีวิธีการอีกมากมาย (บางคนกล่าวถึงในความคิดเห็นก่อนหน้า) แต่นี่เป็นการเริ่มต้นที่ดี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.