ในการสร้างแบบจำลองข้อมูลการนับการเรียกร้องในสภาพแวดล้อมการประกันภัยฉันเริ่มต้นด้วย Poisson แต่แล้วสังเกตเห็นการทับซ้อนกัน Quasi-Poisson เป็นแบบอย่างที่ดีกว่าความสัมพันธ์แปรปรวนที่ดีกว่า Poisson พื้นฐาน แต่ฉันสังเกตเห็นว่าสัมประสิทธิ์เป็นเหมือนกันทั้งใน Poisson และ Quasi-Poisson
หากนี่ไม่ใช่ข้อผิดพลาดเหตุใดจึงเป็นเช่นนี้ การใช้ Quasi-Poisson บน Poisson มีประโยชน์อย่างไร
สิ่งที่ควรทราบ:
- การสูญเสียที่อยู่ภายใต้พื้นฐานส่วนเกินซึ่ง (ฉันเชื่อว่า) ป้องกัน Tweedie จากการทำงาน - แต่มันเป็นการกระจายครั้งแรกที่ฉันพยายาม ฉันยังตรวจสอบรุ่นของ NB, ZIP, ZINB และ Hurdle แต่ก็ยังพบว่า Quasi-Poisson นั้นเหมาะสมที่สุด
- ฉันทดสอบการกระจายตัวเกินขนาดผ่านการทดสอบการกระจายในแพ็คเกจ AER พารามิเตอร์การกระจายของฉันอยู่ที่ประมาณ 8.4 โดยมีค่า p อยู่ที่ขนาด 10 ^ -16
- ฉันกำลังใช้ glm () กับ family = poisson หรือ quasipoisson และลิงค์บันทึกสำหรับรหัส
- เมื่อเรียกใช้รหัสปัวซองฉันออกมาพร้อมคำเตือนของ "ใน dpois (y, mu, log = TRUE): ไม่ใช่จำนวนเต็ม x = ... "
หัวข้อ SE ที่เป็นประโยชน์ต่อคำแนะนำของ Ben:
counts/exposure
อัตราโดยอัตราส่วนของการคำนวณ คุณควรเพิ่มคำ offset ( offset(log(exposure))
) ลงในแบบจำลองของคุณ