เพียร์สัน VS Deviance ตกค้างในการถดถอยโลจิสติก


16

ฉันรู้ว่าเพียร์สันที่เหลือมาตรฐานได้รับในความน่าจะเป็นแบบดั้งเดิม:

ri=yiπiπi(1πi)

และ Deviance Residuals ได้มาจากวิธีการทางสถิติที่มากขึ้น (การสนับสนุนของแต่ละจุดสู่โอกาส):

di=si2[yilogπi^+(1yi)log(1πi)]

โดยที่si = 1 ถ้าyi = 1 และsi = -1 ถ้าyi = 0

คุณสามารถอธิบายให้ฉันอย่างสังหรณ์ใจได้อย่างไรวิธีการตีความสูตรการเบี่ยงเบนที่เหลืออยู่?

ยิ่งไปกว่านั้นถ้าฉันต้องการเลือกอันไหนอันไหนที่เหมาะกว่าและทำไม?

BTW การอ้างอิงบางอย่างอ้างว่าเราได้รับค่าเบี่ยงเบนเหลืออยู่จากคำว่า

12ri2

ที่ถูกกล่าวถึงข้างต้นri


ความคิดใด ๆ ที่จะได้รับการชื่นชม
แจ็คชิ

1
เมื่อคุณพูดว่า "การอ้างอิงบางอย่าง" ... การอ้างอิงใดและพวกเขาจะทำอย่างไร
Glen_b -Reinstate Monica

คำตอบ:


10

การถดถอยโลจิสติกพยายามที่จะเพิ่มฟังก์ชั่นโอกาสในการบันทึก

LL=kln(Pi)+rln(1Pi)

ที่คือความน่าจะเป็นที่คาดการณ์ว่ากรณีฉันคือY = 1 ; kคือจำนวนของกรณีข้อสังเกตเป็นY = 1และRคือจำนวน (ส่วนที่เหลือ) กรณีที่สังเกตเป็นY = 0PiY^=1kY=1rY=0

นิพจน์นั้นเท่ากับ

LL=(kdi2+rdi2)/2

เนื่องจากความเบี่ยงเบนของกรณีถูกกำหนดเป็น:

di={2ln(Pi)if Yi=12ln(1Pi)if Yi=0

Thus, binary logistic regression seeks directly to minimize the sum of squared deviance residuals. It is the deviance residuals which are implied in the ML algorithm of the regression.

The Chi-sq statistic of the model fit is 2(LLfull modelLLreduced model), where full model contains predictors and reduced model does not.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.