จำเป็นต้องมีการนับศูนย์สำหรับการทดสอบอัตราส่วนความน่าจะเป็นของโมเดลปัวซอง / loglinear หรือไม่


9

หากมี 0 อยู่ในตารางฉุกเฉินและเรากำลังจัดวางแบบจำลอง Poisson / loglinear ที่ซ้อนกัน (ใช้glmฟังก์ชั่นR ) สำหรับการทดสอบอัตราส่วนความน่าจะเป็นเราจำเป็นต้องปรับข้อมูลก่อนที่จะติดตั้งแบบจำลอง glm (เช่นเพิ่ม 1/2 ลงในทั้งหมด จำนวน) เห็นได้ชัดว่าบางพารามิเตอร์ไม่สามารถประมาณได้หากไม่มีการปรับ แต่การปรับ / ขาดการปรับมีผลต่อการทดสอบ LR อย่างไร


สันนิษฐานว่าglmกิจวัตรจะไม่ดีถ้าไม่สามารถจัดการค่าศูนย์ได้ คุณเคยลองไหม
shabbychef

1
ใช่มันไม่ได้ผิดพลาด แต่ขึ้นอยู่กับสูตร (เช่นในรูปแบบอิ่มตัว) พารามิเตอร์บางตัวสามารถมีข้อผิดพลาดมาตรฐานที่ไม่มีที่สิ้นสุดได้อย่างมีประสิทธิภาพ คำถามของฉันคือว่าปัญหานี้เกิดขึ้นหรือไม่เมื่อทำการทดสอบอัตราส่วนความน่าจะเป็น คุณยังสามารถคำนวณความน่าจะเป็นได้แม้ว่าจะไม่ได้ประมาณค่าพารามิเตอร์บางตัว แต่พารามิเตอร์เหล่านั้นจะไม่ส่งผลต่อความน่าจะเป็น มาตรฐานการปฏิบัติคืออะไรและทำไม?
BR1

คำตอบ:


7

หนึ่งในพลังของการสร้างแบบจำลองการถดถอยโดยทั่วไปคือคุณสามารถทำให้พื้นที่ที่ไม่มีข้อมูลราบรื่นได้อย่างที่คุณสังเกตเห็น แต่บางครั้งก็มีปัญหาในการประมาณค่าพารามิเตอร์ ฉันขอแนะนำว่าหากคุณได้รับสิ่งต่าง ๆ เช่นข้อผิดพลาดมาตรฐานที่ไม่มีที่สิ้นสุดถึงเวลาที่จะต้องพิจารณาวิธีการสร้างแบบจำลองของคุณอีกครั้ง

ข้อควรระวังหนึ่งข้อควรระวัง: มีความแตกต่างระหว่าง "ไม่มีการนับ" ในชั้นหนึ่งและมันเป็นไปไม่ได้ที่จะมีการนับในชั้นนั้น ตัวอย่างเช่นลองจินตนาการว่าคุณกำลังศึกษาความผิดปกติทางจิตวิทยาของกองทัพเรือสหรัฐฯระหว่างปี 2000 ถึง 2009 และมีเงื่อนไขการถดถอยแบบไบนารีสำหรับทั้ง "Is a Woman" และ "Serves on a Submarine" รูปแบบการถดถอยอาจจะสามารถที่จะประเมินผลกระทบที่ทั้งสองตัวแปร = 1 แม้จะมีการนับเป็นศูนย์ที่ทั้งสอง = 1 อย่างไรก็ตามที่อนุมานจะไม่ถูกต้อง - สถานการณ์ดังกล่าวเป็นไปไม่ได้ ปัญหานี้เรียกว่า "การไม่ตอบสนอง" และบางครั้งก็เป็นปัญหาในโมเดลที่มีการแบ่งชั้นอย่างมาก


@ skyguy94 ผิดปกติพอฉันไม่ - ฉันรู้ว่าฉันเพิ่งลืมบันทึกการใช้ชุดข้อมูลย้อนหลัง>. < แก้ไขเพื่อสะท้อนว่า
Fomite

Re: "ตัวแบบการถดถอยอาจสามารถประเมินผลกระทบที่ทั้งสองตัวแปร = 1 หรือการมีปฏิสัมพันธ์ระหว่างทั้งสอง " - ฉันไม่คิดว่าเป็นเรื่องจริง หากคุณมีตัวทำนายเลขฐานสองสองตัวที่ไม่เคย '1' อยู่ด้วยกันการโต้ตอบนั้นจะคงที่ (เป็น '0' เสมอ) ดังนั้นผลของมันจะไม่ถูกระบุ
มาโคร

@Macro คุณพูดถูกฉันกำลังแก้ไขอยู่เล็กน้อย ฉันกำลังคิดหาคำศัพท์ที่พวกเขาไม่ได้เป็นตัวบ่งชี้ไบนารี
Fomite

1
(+1) ดังนั้นปัญหาที่ไม่น่าเชื่อถือของกรณีที่ทั้งคู่ = 1 อยู่ข้างกันการประเมินตามโมเดลจะเป็นผลรวมของเอฟเฟ็กต์สองส่วนที่เรารู้ว่าสามารถทำให้เข้าใจผิดได้ในตัวมันเอง :)
มาโคร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.