แบบจำลองการถดถอยปัวซงแบบ zero zero ถูกกำหนดไว้สำหรับตัวอย่างโดย
และจะถือว่าพารามิเตอร์และไปY i = { 0 ด้วยความน่าจะเป็นp i + ( 1 - p i ) e - λ i k ด้วยความน่าจะเป็น( 1 - p i ) e - λ ฉัน λ k i / k ! λ = ( λ 1 , … , λ n ) p =( y1, … , yn)
Yผม= { 0kด้วยความน่าจะเป็นp ผม+ ( 1 - pผม) e- λผมด้วยความน่าจะเป็น( 1 - p ผม) e- λผมλkผม/ k!
λ =( λ1, … , λn)p =( p1, … , pn)
เข้าสู่ระบบ( λ )logit ( p )= B β= บันทึก( p / ( 1 - p ) ) = G γ.
ความน่าจะเป็นบันทึกที่สอดคล้องกันของรูปแบบการถดถอยปัวซอง zero-inflated คือ
L ( γ, β; y )= ∑Yผม= 0เข้าสู่ระบบ( eGผมγ+ ประสบการณ์( - eBผมβ) ) + ∑Yผม> 0( yผมBผมβ- eBผมβ)- ∑i = 1nเข้าสู่ระบบ( 1 + eGผมγ) - ∑Yผม> 0เข้าสู่ระบบ( yผม! )
ที่นี่และเป็นเมทริกซ์การออกแบบ เมทริกซ์เหล่านี้อาจเหมือนกันทั้งนี้ขึ้นอยู่กับคุณลักษณะที่ต้องการใช้สำหรับกระบวนการสร้างสองกระบวนการ อย่างไรก็ตามมีจำนวนแถวเท่ากันBG
สมมติว่าเราสามารถสังเกตเห็นเมื่อนั้นมาจากความสมบูรณ์แบบศูนย์รัฐและเมื่อมาจากรัฐปัวซองZผม= 1YผมZผม= 0Yผม
L ( γ, β; y , z ) = ∑i = 1nเข้าสู่ระบบ( ฉ( zผม| γ) ) + ∑i = 1nเข้าสู่ระบบ( ฉ( yผม| Zผม, β) )
= ∑i = 1nZผม( ชผมγ- บันทึก( 1 + eGผมγ) ) + - ∑i = 1n( 1 - zผม) บันทึก( 1 + eGผมγ) +Σi = 1n( 1 - zผม) [ yผมBผมβ- eBผมβ- บันทึก( yผม! ) ]
สองคำแรกคือการสูญเสียในการถดถอยโลจิสติกเพื่อแยก
Zผม= 0จาก
Zผม= 1 1 เทอมที่สองคือการถดถอยของคะแนนที่สร้างโดยกระบวนการปัวซอง
แต่ตัวแปรแฝงไม่สามารถเรียกคืนได้หรือไม่ วัตถุประสงค์คือเพื่อเพิ่มโอกาสในการบันทึกครั้งแรก แต่เราต้องแนะนำตัวแปรแฝงและหาโอกาสในการบันทึกใหม่ จากนั้นใช้อัลกอริทึม EM เราสามารถเพิ่มโอกาสในการบันทึกที่สอง แต่นี่สมมติว่าเรารู้ว่าหรือ ?Zผม= 0Zผม= 1