คำถามติดแท็ก cooks-distance

2
วิธีการอ่านแปลงระยะทางของ Cook?
ไม่มีใครรู้วิธีการทำงานว่าคะแนน 7, 16 และ 29 เป็นคะแนนที่มีอิทธิพลหรือไม่? ฉันอ่านบางที่เพราะระยะทางของ Cook ต่ำกว่า 1 พวกเขาไม่ใช่ ฉันถูกไหม?

2
โมเดลเชิงเส้นผสมแบบทั่วไป: การวินิจฉัย
ฉันมีการถดถอยแบบลอจิสติกเพื่อสกัดกั้นแบบสุ่ม (เนื่องจากการวัดซ้ำ) และฉันต้องการที่จะทำการวินิจฉัยบางอย่างโดยเฉพาะเกี่ยวกับค่าผิดปกติและการสังเกตที่มีอิทธิพล ฉันดูที่เหลือเพื่อดูว่ามีข้อสังเกตที่โดดเด่นหรือไม่ แต่ฉันก็อยากจะดูบางอย่างเช่นระยะทางของ Cook หรือ DFFITS Hosmer และ Lemeshow (2000) กล่าวว่าเนื่องจากการขาดเครื่องมือวินิจฉัยแบบจำลองสำหรับข้อมูลที่มีความสัมพันธ์หนึ่งควรจะพอดีกับแบบจำลองการถดถอยโลจิสติกปกติละเว้นความสัมพันธ์และใช้เครื่องมือวินิจฉัยที่มีอยู่สำหรับการถดถอยโลจิสติกปกติ พวกเขายืนยันว่าสิ่งนี้จะดีกว่าไม่ได้ทำการวินิจฉัยใด ๆ เลย หนังสือเล่มนี้มาจากปี 2000 และฉันสงสัยว่าตอนนี้มีวิธีการสำหรับการวินิจฉัยแบบจำลองที่มีผลกระทบการถดถอยโลจิสติกแบบผสมหรือไม่? สิ่งที่จะเป็นวิธีที่ดีในการตรวจสอบค่าผิดปกติ? แก้ไข (5 พฤศจิกายน 2013): เนื่องจากการขาดการตอบสนองฉันสงสัยว่าการทำการวินิจฉัยด้วยโมเดลที่หลากหลายนั้นไม่ได้ทำโดยทั่วไปหรือไม่ใช่ขั้นตอนที่สำคัญเมื่อทำการสร้างแบบจำลองข้อมูล ดังนั้นฉันขอใช้ถ้อยคำใหม่คำถามของฉัน: คุณจะทำอย่างไรเมื่อคุณพบรูปแบบการถดถอยที่ "ดี"?

1
ประเภทใดที่เหลือและระยะทางของ Cook ที่ใช้สำหรับ GLM
ไม่มีใครรู้ว่าสูตรระยะทางของ Cook คืออะไร? สูตรระยะทางของ Cook ดั้งเดิมใช้ส่วนที่เหลือเป็นราย ๆ แต่ทำไม R จึงใช้ std เพียร์สันที่เหลือเมื่อคำนวณระยะทางพล็อตของ Cook สำหรับ GLM ฉันรู้ว่าเศษที่เหลือเป็นนักเรียนไม่ได้กำหนดไว้สำหรับ GLMs แต่สูตรคำนวณระยะทางของ Cook มีลักษณะอย่างไร สมมติตัวอย่างต่อไปนี้: numberofdrugs <- rcauchy(84, 10) healthvalue <- rpois(84,75) test <- glm(healthvalue ~ numberofdrugs, family=poisson) plot(test, which=5) สูตรสำหรับระยะทางของ Cook คืออะไร กล่าวอีกนัยหนึ่งสูตรการคำนวณเส้นประสีแดงคืออะไร สูตรนี้สำหรับเพียร์สันที่เหลืออยู่นั้นมาจากที่ไหน?

3
ส่วนที่เหลือสำหรับการถดถอยโลจิสติกและระยะทางของคุก
มีข้อสมมติฐานเฉพาะใด ๆ เกี่ยวกับข้อผิดพลาดของการถดถอยโลจิสติกหรือไม่เช่นความแปรปรวนคงที่ของข้อผิดพลาดและค่าปกติของส่วนที่เหลือ? นอกจากนี้โดยทั่วไปเมื่อคุณมีคะแนนที่มีระยะทางของ Cook มากกว่า 4 / n คุณจะลบออกไหม หากคุณลบออกคุณจะทราบได้อย่างไรว่ารุ่นที่มีจุดลบนั้นดีกว่า

1
ค่าการตัดระยะทางของ Cook
ฉันได้อ่านระยะทางของแม่ครัวเพื่อระบุตัวผิดที่มีอิทธิพลต่อการถดถอยของฉัน ในการศึกษาดั้งเดิมของ Cook เขาบอกว่าอัตราการตัด 1 ควรเทียบเคียงเพื่อระบุผู้มีอิทธิพล อย่างไรก็ตามการศึกษาอื่น ๆ ใช้4n4n\frac{4}{n} หรือ 4n - k - 14n-k-1\frac{4}{n-k-1} เป็นตัวตัด ในการศึกษาของฉันไม่มีของเหลือของฉันมีค่า D สูงกว่า 1 อย่างไรก็ตามถ้าฉันใช้ 4n4n\frac{4}{n} เป็นทางลัด (4149= .026 )(4149=0.026)(\frac{4}{149}= .026)แล้วมีจุดข้อมูลต่าง ๆ ซึ่งถือว่าเป็นผู้มีอิทธิพล ฉันตัดสินใจที่จะทดสอบว่าการลบจุดข้อมูลเหล่านี้จะสร้างความแตกต่างให้กับการถดถอยเชิงเส้นทั่วไปของฉันหรือไม่ IV ทั้งหมดของฉันยังคงมีความสำคัญและไม่มีการเปลี่ยนแปลงที่ชัดเจน ฉันควรรักษาจุดข้อมูลทั้งหมดของฉันไว้และใช้อัตราการตัด 1 หรือลบออก?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.