เมื่อมีคนบอกว่าส่วนเบี่ยงเบน / df ที่เหลือควร ~ 1 สำหรับโมเดลปัวซองค่าประมาณเป็นอย่างไร


16

ฉันมักจะเห็นคำแนะนำสำหรับการตรวจสอบว่าแบบจำลองของปัวซองนั้นเต็มไปด้วยการแยกส่วนเบี่ยงเบนที่เหลือด้วยองศาอิสระหรือไม่ อัตราส่วนผลลัพธ์ควรเป็น "ประมาณ 1"

คำถามคือช่วงที่เรากำลังพูดถึงสำหรับ "โดยประมาณ" - อัตราส่วนที่ควรตั้งปิดสัญญาณเตือนเพื่อพิจารณารูปแบบรูปแบบทางเลือกคืออะไร?


2
ไม่ใช่คำตอบสำหรับคำถามที่น่าสนใจนี้ แต่สิ่งที่ฉันมักจะทำคือเรียกใช้หลายรุ่น (เช่น Poissson, NB, อาจเป็นรุ่นที่มีค่าศูนย์เป็นศูนย์) และเปรียบเทียบพวกเขา - ทั้งในการวัดแบบ AIC และค่าคาดการณ์
Peter Flom - Reinstate Monica

ลิงค์นี้อาจเป็นที่สนใจ ส่วน "เกณฑ์สำหรับการประเมินความดีของ Fit" เป็นพิเศษ

@Procrastinator ลิงก์เป็นตัวอย่างที่สมบูรณ์แบบของสิ่งที่ฉันกำลังพูดถึง: "ถ้าแบบจำลองของเราเหมาะกับข้อมูลได้ดีอัตราส่วนของ Deviance ต่อ DF, Value / DF ควรมีค่าประมาณ 1 ค่าอัตราส่วนขนาดใหญ่อาจบ่งบอกถึงรูปแบบ misspecification หรือตัวแปรตอบกลับที่กระจายกันมากเกินไปอัตราส่วนที่น้อยกว่าหนึ่งอาจบ่งบอกถึงรูปแบบของ misspecification หรือตัวแปรตอบสนองที่กระจายน้อยไป " ช่วง "ประมาณ 1" มีอะไรบ้าง 0.99 ถึง 1.01 0.75 ถึง 2?
Fomite

r-bloggers.com/….ยังมีข้อมูลบางอย่างเกี่ยวกับวิธีตอบคำถามนี้แม้ว่าการตอบสนองของ @ StasK จะครอบคลุมได้ดีพอ
บิน

คำตอบ:


14

10 มีขนาดใหญ่ ... 1.01 ไม่ใช่ เนื่องจากความแปรปรวนของการχk2เป็น2k (ดูวิกิพีเดีย ) ค่าเบี่ยงเบนมาตรฐานของχk2มี2kและของχk2/kคือ2/k k นั่นคือไม้วัดของคุณ: สำหรับχ1002 , 1.01 นั้นไม่ใหญ่ แต่ 2 นั้นก็ใหญ่ (ห่างออกไป 7 sds) สำหรับχ10,0002 , 1.01 ก็โอเค แต่ 1.1 ไม่ได้ (ห่างออกไป 7 sds)


1
"ดังนั้นมีค่าเบี่ยงเบนมาตรฐานของχk2/k "คุณช่วยพาฉันไปที่ไหน2/k
ซัก

amazon.com/… . ขออภัยที่จะเป็นคนโง่ แต่นั่นคือการกระจายการอ้างอิงในการอนุมานทางสถิติ หากคุณไม่เข้าใจคุณไม่ควรทำงานกับโมเดลเชิงเส้นทั่วไปเช่น Poisson
StasK

2
สำหรับการอ้างอิงในอนาคตคุณสามารถแทนคำนำหน้า / ขอโทษเกี่ยวกับการเป็นสิ่งที่ไอ้เพียงแค่ระบุข้อมูลและการอ้างอิง มันอาจจะช่วยให้คุณพิมพ์และทำให้คุณดูเหมือนไอ้น้อยลงซึ่งอาจเป็นประสบการณ์ที่แปลกใหม่
baxx

ดูการแก้ไขและการอ้างอิงวิกิพีเดีย ฉันอาสาตอบสองสามร้อยคำตอบในช่วงสองสามปีที่ผ่านมาดังนั้นฉันจึงยอมรับว่ามันเป็นเรื่องยากสำหรับฉันที่จะได้รับประสบการณ์ที่แปลกใหม่
StasK

7

ความเบี่ยงเบนควรเป็นไค - สแควร์กระจายด้วยค่าเฉลี่ยเท่ากับองศาอิสระ ดังนั้นหารด้วยองศาอิสระและคุณควรได้ประมาณ 1 ถ้าข้อมูลไม่กระจายตัวมากเกินไป ในการรับการทดสอบที่เหมาะสมเพียงแค่ค้นหาความเบี่ยงเบนในตารางไค - สแควร์ - แต่โปรดสังเกต (a) ว่าการแจกแจงไคสแควร์เป็นการประมาณ & (b) ที่ค่าสูงสามารถบ่งบอกถึงการขาดแบบอื่น (ซึ่งอาจเป็นสาเหตุ 'ประมาณ 1' ถือว่าดีพอสำหรับงานรัฐบาล)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.