การวัด“ ความเบี่ยงเบน” สำหรับปัวซอง zero-inflated หรือทวินามลบพองศูนย์?


11

การเบี่ยงเบนสเกลที่กำหนดไว้เป็น D = 2 * (บันทึกความน่าจะเป็นของโมเดลอิ่มตัวลบบันทึกความน่าจะเป็นของโมเดลที่ติดตั้ง) มักใช้เป็นเครื่องวัดความดีพอดีในโมเดล GLM เปอร์เซ็นต์การเบี่ยงเบนที่อธิบายถูกกำหนดเป็น [D (โมเดลว่าง) - D (โมเดลที่พอดี)] / D (โมเดลว่าง) บางครั้งก็ใช้เป็น GLM อนาล็อกเพื่อการถดถอยเชิงเส้นของ R-squared นอกเหนือจากข้อเท็จจริงที่ว่าการแจกแจง ZIP และ ZINB ไม่ได้เป็นส่วนหนึ่งของตระกูลการแจกแจงแบบเลขชี้กำลังฉันกำลังมีปัญหาในการทำความเข้าใจว่าเหตุใดส่วนเบี่ยงเบนส่วนเบี่ยงเบนขนาดและเปอร์เซ็นต์เบี่ยงเบนที่อธิบายไม่ถูกนำมาใช้ ทุกคนสามารถแสดงความเห็นในเรื่องนี้หรือให้การอ้างอิงที่เป็นประโยชน์ ขอบคุณล่วงหน้า!


คำถามที่ดีมาก - ฉันต้องการจะรู้เช่นกัน
user2673238

คำตอบ:


3

ความเบี่ยงเบนเป็นแนวคิด GLM โมเดล ZIP และ ZINB ไม่ใช่ glms แต่ได้รับการกำหนดเป็นสูตรผสมแบบ จำกัด ของการแจกแจงซึ่งเป็น GLMs และดังนั้นจึงสามารถแก้ไขได้อย่างง่ายดายผ่านอัลกอริธึม EM

บันทึกเหล่านี้อธิบายทฤษฎีของการเบี่ยงเบนอย่างกระชับ หากคุณอ่านบันทึกเหล่านั้นคุณจะเห็นหลักฐานว่าแบบจำลองอิ่มตัวสำหรับการถดถอยของปัวซองนั้นมีความเป็นไปได้

(λs)=i=1,yi0n[yilog(yi)yilog(yi!)]

ซึ่งผลที่ได้จาก plug-in ที่ประมาณการฉันyi=λ^i

ตอนนี้ฉันจะดำเนินการกับ ZIP เพราะคณิตศาสตร์นั้นง่ายกว่าและมีผลลัพธ์ที่คล้ายคลึงกันสำหรับ ZINB น่าเสียดายสำหรับ ZIP ไม่มีความสัมพันธ์แบบง่าย ๆ เหมือนในปัวซอง สังเกต TH เข้าสู่ระบบความน่าจะเป็นi

i(ϕ,λ)=Zilog(ϕ+(1ϕ)eλ)+(1Zi)[λ+yilog(λ)log(yi!)].

จะไม่ได้สังเกตเพื่อที่จะแก้ปัญหานี้คุณจะต้องใช้อนุพันธ์ WRT ทั้งλและφตั้งสมการเป็น 0 แล้วแก้ปัญหาสำหรับλและφ ความยากลำบากที่นี่เป็นปีฉัน = 0ค่านิยมเหล่านี้สามารถไปเป็นλหรือเป็นφและมันเป็นไปไม่ได้โดยไม่ต้องสังเกตZ ฉันซึ่งจะนำY ฉัน = 0สังเกตเข้ามาใน อย่างไรก็ตามถ้าเรารู้จักซีฉันZiλϕλϕyi=0λ^ϕ^Ziyi=0Ziค่าที่เราไม่ต้องการรูปแบบ ZIP เพราะเราจะไม่มีข้อมูลที่ขาดหายไป ข้อมูลที่สังเกตสอดคล้องกับความเป็นไปได้ของ "ข้อมูลสมบูรณ์" ในพิธีการ EM

วิธีการหนึ่งที่อาจจะเหมาะสมคือการทำงานร่วมกับความคาดหวังของ WRT ของสมบูรณ์ข้อมูลเข้าสู่ระบบโอกาส, E ( ฉัน ( φ , λ ) )ซึ่งเอาZ ฉันและแทนที่ด้วยความคาดหวังนี้เป็นส่วนหนึ่งของสิ่งที่ อัลกอริทึม EM คำนวณ (ขั้นตอน E) ด้วยการอัปเดตล่าสุด ฉันไม่รู้วรรณกรรมใด ๆ ที่ได้ศึกษาวิธีการนี้จะอีเอ็กซ์พีอีทีอีdอันซ์แม้ว่าZiE(i(ϕ,λ))Ziexpected

นอกจากนี้คำถามนี้ถูกถามก่อนดังนั้นฉันจึงตอบโพสต์นี้ อย่างไรก็ตามมีคำถามอีกข้อในหัวข้อเดียวกันที่มีข้อคิดเห็นที่ดีโดย Gordon Smyth ที่นี่: การ เบี่ยงเบนสำหรับโมเดลปัวซองแบบ zero-inflated, ข้อมูลต่อเนื่อง (R) ซึ่งเขากล่าวถึงคำตอบเดียวกัน (นี่คือรายละเอียดที่ฉันต้องการ พูด) และพวกเขากล่าวถึงในความคิดเห็นต่อบทความอื่นที่คุณอาจต้องการอ่าน (ข้อจำกัดความรับผิดชอบฉันยังไม่ได้อ่านเอกสารอ้างอิง)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.