ความเบี่ยงเบนเป็นแนวคิด GLM โมเดล ZIP และ ZINB ไม่ใช่ glms แต่ได้รับการกำหนดเป็นสูตรผสมแบบ จำกัด ของการแจกแจงซึ่งเป็น GLMs และดังนั้นจึงสามารถแก้ไขได้อย่างง่ายดายผ่านอัลกอริธึม EM
บันทึกเหล่านี้อธิบายทฤษฎีของการเบี่ยงเบนอย่างกระชับ หากคุณอ่านบันทึกเหล่านั้นคุณจะเห็นหลักฐานว่าแบบจำลองอิ่มตัวสำหรับการถดถอยของปัวซองนั้นมีความเป็นไปได้
ℓ ( λs) = ∑i = 1 , ∀ yผม≠ 0n[ yผมl o g( yผม) - yผม- l o g( yผม! ) ]
ซึ่งผลที่ได้จาก plug-in ที่ประมาณการฉันYผม= λ^ผม
ตอนนี้ฉันจะดำเนินการกับ ZIP เพราะคณิตศาสตร์นั้นง่ายกว่าและมีผลลัพธ์ที่คล้ายคลึงกันสำหรับ ZINB น่าเสียดายสำหรับ ZIP ไม่มีความสัมพันธ์แบบง่าย ๆ เหมือนในปัวซอง สังเกต TH เข้าสู่ระบบความน่าจะเป็นผม
ℓผม( ϕ , λ ) = Zผมl o g( ϕ + ( 1 - ϕ ) e- λ) + ( 1 - Zผม) [ - λ + yผมl o g( λ ) - l o g( yผม! ) ]
จะไม่ได้สังเกตเพื่อที่จะแก้ปัญหานี้คุณจะต้องใช้อนุพันธ์ WRT ทั้งλและφตั้งสมการเป็น 0 แล้วแก้ปัญหาสำหรับλและφ ความยากลำบากที่นี่เป็นปีฉัน = 0ค่านิยมเหล่านี้สามารถไปเป็นλหรือเป็นφและมันเป็นไปไม่ได้โดยไม่ต้องสังเกตZ ฉันซึ่งจะนำY ฉัน = 0สังเกตเข้ามาใน อย่างไรก็ตามถ้าเรารู้จักซีฉันZผมλφλϕyi=0λ^ϕ^Ziyi=0Ziค่าที่เราไม่ต้องการรูปแบบ ZIP เพราะเราจะไม่มีข้อมูลที่ขาดหายไป ข้อมูลที่สังเกตสอดคล้องกับความเป็นไปได้ของ "ข้อมูลสมบูรณ์" ในพิธีการ EM
วิธีการหนึ่งที่อาจจะเหมาะสมคือการทำงานร่วมกับความคาดหวังของ WRT ของสมบูรณ์ข้อมูลเข้าสู่ระบบโอกาส, E ( ℓ ฉัน ( φ , λ ) )ซึ่งเอาZ ฉันและแทนที่ด้วยความคาดหวังนี้เป็นส่วนหนึ่งของสิ่งที่ อัลกอริทึม EM คำนวณ (ขั้นตอน E) ด้วยการอัปเดตล่าสุด ฉันไม่รู้วรรณกรรมใด ๆ ที่ได้ศึกษาวิธีการนี้จะอีเอ็กซ์พีอีคทีอีdอันซ์แม้ว่าZiE(ℓi(ϕ,λ))Ziexpected
นอกจากนี้คำถามนี้ถูกถามก่อนดังนั้นฉันจึงตอบโพสต์นี้ อย่างไรก็ตามมีคำถามอีกข้อในหัวข้อเดียวกันที่มีข้อคิดเห็นที่ดีโดย Gordon Smyth ที่นี่: การ
เบี่ยงเบนสำหรับโมเดลปัวซองแบบ zero-inflated, ข้อมูลต่อเนื่อง (R)
ซึ่งเขากล่าวถึงคำตอบเดียวกัน (นี่คือรายละเอียดที่ฉันต้องการ พูด) และพวกเขากล่าวถึงในความคิดเห็นต่อบทความอื่นที่คุณอาจต้องการอ่าน (ข้อจำกัดความรับผิดชอบฉันยังไม่ได้อ่านเอกสารอ้างอิง)