ตัวแบบไบนารี (Probit and Logit) ที่มีการชดเชยแบบลอการิทึม


12

ไม่มีใครมีรากศัพท์ว่าออฟเซ็ตทำงานในรูปแบบไบนารีเช่น probit และ logit หรือไม่

ในปัญหาของฉันหน้าต่างติดตามผลอาจมีความยาวแตกต่างกันไป สมมติว่าผู้ป่วยได้รับการยิงป้องกันโรคในการรักษา การยิงเกิดขึ้นในเวลาที่ต่างกันดังนั้นหากผลลัพธ์เป็นตัวบ่งชี้ไบนารีว่ามีการเกิดวูบวาบเกิดขึ้นหรือไม่คุณจำเป็นต้องปรับเปลี่ยนตามความจริงที่ว่าบางคนมีเวลามากขึ้นในการแสดงอาการ ดูเหมือนว่าความน่าจะเป็นของการลุกเป็นไฟจะแปรผันตามความยาวของระยะเวลาติดตามผล มันไม่ชัดเจนสำหรับฉันในทางคณิตศาสตร์ว่าไบนารีโมเดลที่มีอ็อฟเซ็ตบันทึกสัญชาตญาณนี้อย่างไร (เหมือนกับปัวซง)

ออฟเซ็ตเป็นตัวเลือกมาตรฐานทั้งในStata (หน้า 1666)และRและฉันสามารถเห็นมันสำหรับปัวซองได้อย่างง่ายดายแต่กรณีไบนารีนั้นเป็นบิตทึบแสง

ตัวอย่างเช่นถ้าเรามี นี่คือพีชคณิตเทียบเท่ากับแบบจำลองที่ไหน ซึ่งเป็นรูปแบบมาตรฐานที่มีค่าสัมประสิทธิ์ในบีบบังคับให้1นี้เรียกว่าลอการิทึมชดเชย ฉันมีปัญหาในการหาวิธีการทำงานนี้ถ้าเราแทนที่กับหรือ()

E[y|x]Z=exp{xβ},
E[y|x]=exp{xβ+logZ},
logZ1exp{}Φ()Λ()

อัปเดต # 1:

กรณี logit ถูกอธิบายด้านล่าง

อัปเดต # 2:

นี่คือคำอธิบายของสิ่งที่ดูเหมือนว่าเป็นการใช้หลักของ offsets สำหรับโมเดลที่ไม่ใช่ปัวซองเช่น probit ออฟเซ็ตสามารถใช้ในการทดสอบอัตราส่วนความน่าจะเป็นของสัมประสิทธิ์ฟังก์ชั่นดัชนี ก่อนอื่นให้คุณประเมินโมเดลที่ไม่มีข้อ จำกัด และจัดเก็บค่าประมาณ สมมติว่าคุณต้องการที่จะทดสอบสมมติฐานที่ว่า 2 จากนั้นคุณสร้างตัวแปรให้พอดีกับแบบจำลองและใช้เป็นออฟเซ็ตที่ไม่ใช่ลอการิทึม นี่เป็นโมเดลที่มีข้อ จำกัด การทดสอบ LR จะเปรียบเทียบทั้งสองแบบและเป็นทางเลือกแทนการทดสอบแบบปกติของ Waldβx=2z=2xxz

คำตอบ:


8

คุณสามารถรวมออฟเซ็ตในGLM ใด ๆ ได้เสมอ : มันเป็นเพียงตัวแปรทำนายที่มีค่าสัมประสิทธิ์คงที่ 1 การถดถอยปัวซองนั้นเป็นกรณีการใช้งานทั่วไป

โปรดทราบว่าในรูปแบบทวินามอะนาล็อกเพื่อบันทึกการรับแสงในฐานะออฟเซ็ตเป็นเพียงส่วนของทวินามดังนั้นจึงไม่จำเป็นต้องระบุอย่างชัดเจน เช่นเดียวกับที่คุณสามารถสร้างแบบจำลอง Poisson RV เป็นจำนวนที่มีการเปิดรับบันทึกเป็นชดเชยหรือเป็นอัตราส่วนที่มีการเปิดรับแสงเป็นน้ำหนักคุณสามารถสร้างแบบจำลองของ binomial RV เช่นเดียวกับการนับจำนวนของความสำเร็จและความล้มเหลวหรือเป็นความถี่ น้ำหนัก

ในการถดถอยโลจิสติคุณจะตีความชดเชยในแง่ของอัตราส่วนราคาต่อรอง: การเปลี่ยนแปลงสัดส่วนผลให้เกิดการเปลี่ยนแปลงสัดส่วนที่กำหนดใน(1-P)logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

แต่สิ่งนี้ไม่ได้มีความสำคัญใด ๆ เช่นการสัมผัสบันทึกในการถดถอยปัวซอง ที่กล่าวว่าหากความน่าจะเป็นทวินามของคุณมีขนาดเล็กพอโมเดลโลจิสติกส์จะเข้าหาโมเดลปัวซงโดยมีลิงค์บันทึก (เนื่องจากตัวหารของ LHS เข้าใกล้ 1) และออฟเซ็ตสามารถถือว่าเป็นคำศัพท์

(ปัญหาที่อธิบายไว้ในคำถาม R ที่เชื่อมโยงของคุณนั้นค่อนข้างเป็นไปในทางที่ผิด)


ส่วนน้ำหนักหายไปจากความเข้าใจของฉันเกี่ยวกับความเท่ากันของทั้งสอง นั่นเป็นประโยชน์มาก ฉันยังสับสนนิดหน่อยว่าจะเปลี่ยนอะไรได้เหมือนเป็นคำแถลงเกี่ยวกับความน่าจะเป็นของการลุกเป็นไฟตามสัดส่วน ความยาวของการติดตามระยะเวลาแต่ฉันสามารถดูวิธีการที่จะเพิ่มขึ้นในเสื้อPr(Y=1|X)=Φ(xβ+ln(t))tt
Dimitriy V. Masterov

ไม่ใช่ความน่าจะเป็น แต่เป็นอัตราต่อรอง หวังว่าการแก้ไขจะทำให้ชัดเจนยิ่งขึ้น
Hong Ooi

แสดงปัญหาในแง่ของอัตราต่อรองทำให้มันชัดเจนมาก แล้ว probit ล่ะ?
Dimitriy V. Masterov

ฉันจะไม่คาดหวังว่าสิ่งนี้จะทำงานกับ probit หรืออย่างน้อยก็จะมีการตีความที่สะอาดเนื่องจากไม่ใช่ลิงก์แบบบัญญัติและเป็นตัวแปรไบนารี่ที่ขึ้นกับ probit ไม่ได้ตกอยู่ในตระกูลเลขชี้กำลัง Φ()
StasK

@StasK ดูเหมือนจะถูก แต่ทำไมตัวเลือกเหล่านี้ถึงมีอยู่ใน Stata และ R พวกเขาทำอะไรได้บ้าง
Dimitriy V. Masterov

1

การนำปัญหานี้กลับมาใช้ใหม่เป็นเหตุการณ์ที่เกิดขึ้นเป็นครั้งคราวโมเดลโลจิสติกที่มี ln (เวลา) ชดเชยจะไม่ผูกมัดคุณกับฟังก์ชันการอยู่รอดแบบพารามิเตอร์ที่อาจหรือไม่เหมาะสมกับข้อมูลหรือไม่

P / (1-P) = Z * exp (Xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

การอยู่รอดที่คาดการณ์ไว้ในเวลา Z = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.