การถดถอยแบบทวินามและการถดถอยโลจิสติกต่างกันอย่างไร


20

ฉันคิดเสมอว่าการถดถอยแบบลอจิสติกเป็นเพียงกรณีพิเศษของการถดถอยแบบทวินามที่ฟังก์ชันลิงก์เป็นฟังก์ชันลอจิสติก (แทนที่จะพูดฟังก์ชั่น probit)

จากการอ่านคำตอบสำหรับคำถามอื่นที่ฉันมีดูเหมือนว่าฉันอาจจะสับสนและมีความแตกต่างระหว่างการถดถอยโลจิสติกและการถดถอยแบบทวินามด้วยการเชื่อมโยงโลจิสติก

ความแตกต่างคืออะไร?

คำตอบ:


13

Logistic regression เป็นการถดถอยแบบทวินามด้วยฟังก์ชันลิงค์ "logistic":

ก.(พี)=เข้าสู่ระบบ(พี1-พี)=Xβ

แม้ว่าฉันยังคิดว่าการถดถอยโลจิสติกมักใช้กับสัดส่วนทวินามมากกว่าการนับทวินาม


1
คุณหมายถึงอะไรโดยการถดถอยโลจิสติกมักจะใช้กับสัดส่วนแทนที่จะนับ สมมติว่าฉันพยายามที่จะทำนายว่าผู้คนจะเข้าร่วมปาร์ตี้หรือไม่และสำหรับงานปาร์ตี้โดยเฉพาะฉันรู้ว่ามี 9 คนที่เข้าร่วมและ 1 คนไม่ได้ - คุณหมายถึงว่าการถดถอยโลจิสติกใช้สิ่งนี้เป็นตัวอย่างการฝึกอบรม พรรคนี้มีอัตราความสำเร็จ 0.9) ในขณะที่การถดถอยแบบทวินามที่มีลิงค์จะนำสิ่งนี้มาเป็นตัวอย่างการฝึกอบรม 10 ตัวอย่าง (9 ความสำเร็จ 1 ข้อล้มเหลว)
raegtin

@raehtin - ในทั้งสองกรณีมันจะเป็นตัวอย่าง / กรณีการฝึกอบรมโดยมีและตามลำดับ ความแตกต่างคือรูปแบบของฟังก์ชันค่าเฉลี่ยและความแปรปรวน สำหรับทวินามหมายความว่าลิงก์ canoncial ตอนนี้ (เรียกอีกอย่างว่า "พารามิเตอร์ธรรมชาติ") และฟังก์ชันแปรปรวนคือกับการกระจายตัวของพารามิเตอร์ 1 สำหรับโลจิสติกเรามีค่าเฉลี่ย , การเชื่อมโยงดังกล่าวข้างต้นฟังก์ชั่นความแปรปรวนของและการกระจายเท่ากับ{}( n i , f i ) = ( 10 , 0.9 ) ( n i , x i ) = ( 10 , 9 ) μ i = n i p iบันทึก( μ i1(nผม,ผม)=(10,0.9)(nผม,xผม)=(10,9)μผม=nผมพีผมV(μฉัน)=μฉัน(nฉัน-μฉัน)log(μiniμi) ϕi=1μi=piV(μi)=μi(1-μi)ϕi=1V(μผม)=μผม(nผม-μผม)nผมφผม=1μผม=พีผมV(μผม)=μผม(1-μผม)φผม=1nผม
ความน่าจะเป็นทางการ

ด้วยโลจิสติกจะถูกแยกออกจากฟังก์ชั่นค่าเฉลี่ยและความแปรปรวนดังนั้นจึงสามารถนำมาพิจารณาได้ง่ายขึ้นผ่านการถ่วงน้ำหนักnผม
ความน่าจะ

เข้าใจแล้วฉันคิดว่าฉันเห็น นี่หมายความว่าพวกเขาให้ผลลัพธ์ที่เท่าเทียมกันหรือไม่ (มาจากวิธีอื่น)
raegtin

1
@raegtin - ฉันคิดอย่างนั้น น้ำหนัก GLM, , เท่ากันในทั้งสองกรณีและฟังก์ชันลิงก์ สร้างค่า logit เดียวกัน ดังนั้นตราบใดที่ตัวแปร X เหมือนกันก็ควรให้ผลลัพธ์เดียวกัน Wผม2=1φผมV(μผม)[ก.'(μผม)]2
ความน่าจะเป็นที่เป็นไปได้

4

การถดถอยทวินามเป็นประเภทใด ๆ ของ GLM โดยใช้ความสัมพันธ์ค่าเฉลี่ยความแปรปรวนทวินามที่แปรปรวนจะได้รับจาก{Y}) ในการถดถอยโลจิสติกด้วยฟังก์ชัน logit ที่กล่าวว่าเป็นฟังก์ชัน "ลิงก์" แต่ระดับทั่วไปของแบบจำลองการถดถอยทวินามสามารถกำหนดกับชนิดของฟังก์ชั่นการเชื่อมโยงใด ๆ ฟังก์ชั่นการแสดงผลแม้อยู่นอกช่วง[0,1]ตัวอย่างเช่นการถดถอยแบบโปรบิตใช้ลิงก์ของ CDF ปกติผกผันการถดถอยความเสี่ยงแบบสัมพัทธ์ใช้เป็นการเชื่อมโยงฟังก์ชันการบันทึกและแบบจำลองความเสี่ยงเพิ่มเติมจะใช้ตัวแบบลิงค์ตัวตนvar(Y)=Y^(1-Y^)Y^=logit-1(Xβ^)=1/(1-ประสบการณ์(Xβ^))[0,1]

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.