อคติของตัวประมาณความน่าจะเป็นสูงสุดสำหรับการถดถอยโลจิสติก


10

ฉันต้องการที่จะเข้าใจข้อเท็จจริงบางประการเกี่ยวกับตัวประมาณความน่าจะเป็นสูงสุด (MLEs) สำหรับการถดถอยโลจิสติก

  1. โดยทั่วไป MLE สำหรับการถดถอยโลจิสติกนั้นมีอคติหรือไม่? ฉันจะพูดว่า "ใช่" ตัวอย่างเช่นฉันรู้ว่ามิติของตัวอย่างนั้นเกี่ยวข้องกับอคติของ MLEs

    คุณรู้ตัวอย่างเบื้องต้นของปรากฏการณ์นี้หรือไม่?

  2. ถ้า MLE นั้นเอนเอียงเป็นจริงหรือไม่ที่เมทริกซ์ความแปรปรวนร่วมของ MLEs เป็นค่าผกผันของ Hessian ของฟังก์ชันความน่าจะเป็นสูงสุด?

    แก้ไข : ฉันได้พบสูตรนี้ค่อนข้างบ่อยและไม่มีหลักฐานใด ๆ ; ดูเหมือนจะเป็นทางเลือกที่ค่อนข้างอิสระสำหรับฉัน

คำตอบ:


15

พิจารณาแบบจำลองการถดถอยแบบโลจิสติกไบนารี่อย่างง่ายโดยใช้ตัวแปรขึ้นอยู่กับไบนารีและมีค่าคงที่และไบนารีถดถอยเท่านั้น โดยที่คือโลจิสติก cdf,1}T

Pr(Yi=1Ti=1)=Λ(α+βTi)
ΛΛ(u)=[1+exp{u}]1

ในรูปแบบ logit เรามี

ln(Pr(Yi=1Ti=1)1Pr(Yi=1Ti=1))=α+βTi

คุณมีตัวอย่างที่มีขนาดnแสดงว่าจำนวนของการสังเกตที่และเหล่านั้นที่และ nพิจารณาความน่าจะเป็นตามเงื่อนไขโดยประมาณดังต่อไปนี้:nn1Ti=1n0Ti=0n1+n0=n

Pr^(Y=1T=1)P^1|1=1n1Ti=1yi

Pr^(Y=1T=0)P^1|0=1n0Ti=0yi

จากนั้นแบบจำลองขั้นพื้นฐานนี้จะให้โซลูชันแบบปิดสำหรับตัวประมาณค่า ML:

α^=ln(P^1|01P^1|0),β^=ln(P^1|11P^1|1)ln(P^1|01P^1|0)

BIAS

แม้ว่าและเป็นตัวประมาณค่าที่เป็นกลางของความน่าจะเป็น แต่ MLEs นั้นมีอคติเนื่องจากฟังก์ชันลอการิทึมแบบไม่เป็นเชิงเส้นได้รับมาในรูปแบบที่ซับซ้อนมากขึ้น ด้วยระดับที่ไม่ใช่เชิงเส้นที่สูงขึ้นP^1|1P^1|0

แต่ความไม่เอนเอียงหายไปเนื่องจากการประมาณความน่าจะเป็นมีความสอดคล้องกัน การใส่ตัวดำเนินการโดยตรงภายในค่าที่คาดไว้และลอการิทึมเรามี lim

limnE[α^]=E[ln(limnP^1|01P^1|0)]=E[ln(P1|01P1|0)]=α

และเช่นเดียวกันสำหรับ\ β

VARIANCE-COVARIANCE MATRIX OF MLE
ในกรณีง่าย ๆ ข้างต้นที่ให้นิพจน์แบบปิดสำหรับตัวประมาณค่าอย่างน้อยหนึ่งหลักการสามารถดำเนินการต่อไปและได้รับการกระจายตัวอย่างแน่นอนแบบ จำกัด แน่นอนจากนั้นคำนวณเมทริกซ์ความแปรปรวนความแปรปรวนร่วมแปรปรวนตัวอย่างที่แน่นอน . แต่โดยทั่วไป MLE ไม่มีวิธีแก้ปัญหาแบบปิด จากนั้นเราใช้การประมาณค่าที่สอดคล้องกันของเมทริกซ์ความแปรปรวน - ความแปรปรวนร่วมซึ่งเป็นจริง (ลบ) ของค่าผกผันของ Hessian ของฟังก์ชันบันทึกความน่าจะเป็นของตัวอย่างซึ่งประเมินที่ MLE และไม่มี "ทางเลือกโดยพลการ" ที่นี่เลย แต่มันเป็นผลมาจากทฤษฎี asymptotic และคุณสมบัติเชิงของเอมิลี่ (ความมั่นคงและเป็นปกติ asymptotic) ที่บอกเราว่าสำหรับ , θ0=(α,β)

n(θ^θ0)dN(0,(E[H])1)

โดยที่คือ Hessian ประมาณและสำหรับ (ตัวอย่าง) จำนวนมากสิ่งนี้ทำให้เราH

Var(θ^)1n(E[H])11n(1nH^)1=H^1
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.