ไม่มีใครรู้วิธีการทำงานว่าคะแนน 7, 16 และ 29 เป็นคะแนนที่มีอิทธิพลหรือไม่? ฉันอ่านบางที่เพราะระยะทางของ Cook ต่ำกว่า 1 พวกเขาไม่ใช่ ฉันถูกไหม?
ไม่มีใครรู้วิธีการทำงานว่าคะแนน 7, 16 และ 29 เป็นคะแนนที่มีอิทธิพลหรือไม่? ฉันอ่านบางที่เพราะระยะทางของ Cook ต่ำกว่า 1 พวกเขาไม่ใช่ ฉันถูกไหม?
คำตอบ:
บางตำราบอกคุณว่าจุดที่ระยะทางของ Cook สูงกว่า 1 จะถือว่ามีอิทธิพล ข้อความอื่น ๆ ให้เกณฑ์ของหรือโดยที่คือจำนวนการสังเกตและจำนวนตัวแปรอธิบาย ในกรณีของคุณสูตรหลังควรให้เกณฑ์ประมาณ 0.1
John Fox (1) ในหนังสือเล่มเล็กของเขาเกี่ยวกับการวินิจฉัยการถดถอยค่อนข้างระมัดระวังเมื่อมันมาถึงการให้เกณฑ์การคำนวณ เขาแนะนำการใช้งานกราฟิกและตรวจสอบรายละเอียดในจุดที่ใกล้เคียงกับ "คุณค่าของ D ที่ยิ่งใหญ่กว่าที่เหลือ" ตามมาตรฐานของ Fox เกณฑ์ควรใช้เพื่อปรับปรุงการแสดงผลกราฟิก
ในกรณีของคุณการสังเกตที่ 7 และ 16 อาจถือได้ว่ามีอิทธิพล อย่างน้อยฉันก็จะได้เห็นพวกเขาอย่างใกล้ชิด การสังเกต 29 ไม่แตกต่างอย่างมีนัยสำคัญจากการสังเกตอื่นสองสามข้อ
(1) Fox, John (1991) การวินิจฉัยการถดถอย: บทนำ สิ่งพิมพ์ Sage
+1 ทั้ง @lejohn และ @whuber ฉันต้องการขยายความคิดเห็นของ @ whuber ไปเล็กน้อย ระยะทางของ Cook สามารถเทียบกับ dfbeta ระยะทางของคุกหมายถึงค่าเฉลี่ยy ที่คาดการณ์ไว้จะเคลื่อนย้ายไปไกลแค่ไหนหากการสังเกตในคำถามลดลงจากชุดข้อมูล dfbeta หมายถึงจำนวนการประมาณพารามิเตอร์ที่เปลี่ยนแปลงหากการสังเกตที่เป็นปัญหาถูกทิ้งจากชุดข้อมูล โปรดทราบว่าด้วย covariates จะมี dfbetas (การสกัด,และ 1สำหรับแต่ละ covariate) ระยะทางของ Cook น่าจะสำคัญกับคุณถ้าคุณทำแบบจำลองการทำนายในขณะที่ dfbeta สำคัญกว่าในการสร้างแบบจำลองอธิบาย
มีอีกจุดหนึ่งที่ทำให้คุ้มค่าที่นี่ ในการวิจัยเชิงสังเกตการณ์มักจะยากที่จะสุ่มตัวอย่างอย่างทั่วถึงในพื้นที่ทำนายและคุณอาจมีเพียงไม่กี่จุดในพื้นที่ที่กำหนด คะแนนดังกล่าวสามารถเบี่ยงเบนจากส่วนที่เหลือ มีบางกรณีที่แตกต่างกันสามารถทำให้เสียโฉม แต่ควรได้รับความคิดอย่างมากก่อนที่จะถูกผลักไสไล่ส่ง อาจมีปฏิสัมพันธ์ระหว่างตัวทำนายหรือระบบอาจเปลี่ยนไปทำงานแตกต่างกันเมื่อค่าตัวทำนายมากเกินไป นอกจากนี้พวกเขาอาจสามารถช่วยให้คุณแก้ปัญหาผลกระทบของการพยากรณ์แบบโคลิเนียร์ได้ จุดที่มีอิทธิพลอาจเป็นพรในการอำพราง