ค่าสัมประสิทธิ์การถดถอยแบบโลจิสติกแบบเอ็กซ์โปเนนเชียลแตกต่างจากอัตราต่อรอง


10

ดังที่ฉันเข้าใจแล้วค่าเบต้าที่ยกกำลังจากการถดถอยโลจิสติกคืออัตราส่วนอัตราต่อรองของตัวแปรนั้นสำหรับตัวแปรตามความสนใจ อย่างไรก็ตามค่าไม่ตรงกับอัตราส่วนอัตราต่อรองที่คำนวณด้วยตนเอง แบบจำลองของฉันกำลังทำนายการสตัน (ตัวชี้วัดการขาดสารอาหาร) โดยใช้ตัวชี้วัดอื่น ๆ ในการประกัน

// Odds ratio from LR, being done in stata
logit stunting insurance age ... etc. 
or_insurance = exp(beta_value_insurance)

// Odds ratio, manually calculated
odds_stunted_insured = num_stunted_ins/num_not_stunted_ins
odds_stunted_unins = num_stunted_unins/num_not_stunted_unins
odds_ratio = odds_stunted_ins/odds_stunted_unins

เหตุผลทางความคิดสำหรับค่าเหล่านี้แตกต่างกันอย่างไร การควบคุมปัจจัยอื่น ๆ ในการถดถอยหรือไม่? เพียงแค่ต้องการที่จะสามารถอธิบายความแตกต่าง


2
คุณกำลังใส่ตัวทำนายเพิ่มเติมลงในโมเดลการถดถอยโลจิสติกหรือไม่? อัตราส่วนอัตราต่อรองที่คำนวณด้วยตนเองจะตรงกับอัตราต่อรองที่คุณได้รับจากการถดถอยโลจิสติกหากคุณไม่มีตัวทำนายอื่น ๆ
มาโคร

นั่นคือสิ่งที่ฉันคิด แต่ต้องการการยืนยัน นั่นเป็นเพราะผลลัพธ์ของการถดถอยนั้นเป็นการบัญชีสำหรับการเปลี่ยนแปลงในตัวทำนายอื่น ๆ ?
ไมค์

ใช่ @ ไมค์ สมมติว่าแบบจำลองมีการระบุอย่างถูกต้องคุณสามารถตีความเป็นอัตราเดิมพันเมื่อตัวทำนายอื่น ๆ ได้รับการแก้ไขทั้งหมด
มาโคร

@Macro: คุณคิดที่จะปรับปรุงความคิดเห็นของคุณเป็นคำตอบหรือไม่?
jrennie

คำตอบ:


22

หากคุณกำลังวางเดียวที่ทำนายคนเดียวในรูปแบบแล้วอัตราส่วนราคาต่อรองระหว่างทำนายและการตอบสนองจะตรงเท่ากับค่าสัมประสิทธิ์การถดถอย exponentiated ฉันไม่คิดว่าจะได้รับผลลัพธ์นี้ในเว็บไซต์ดังนั้นฉันจะใช้โอกาสนี้ในการจัดหา


พิจารณาผลลัพธ์ไบนารีและตัวทำนายไบนารีคู่เดียวX :YX

Y=1Y=0X=1พี11พี10X=0พี01พี00

จากนั้นวิธีหนึ่งในการคำนวณอัตราต่อรองระหว่างและY iคือXผมYผม

OR=พี11พี00พี01พี10

ตามคำนิยามของความน่าจะเป็นเงื่อนไข ) ในอัตราส่วนเขาจะลดความน่าจะเป็นที่เกี่ยวข้องกับXยกเลิกและคุณสามารถเขียนอัตราต่อรองในแง่ของความน่าจะเป็นตามเงื่อนไขของY | X :พีผมJ=P(Y=ผม|X=J)P(X=J)XY|X

OR=P(Y=1|X=1)P(Y=0|X=1)P(Y=0|X=0)P(Y=1|X=0)

ในการถดถอยโลจิสติกคุณจำลองความน่าจะเป็นเหล่านี้โดยตรง:

เข้าสู่ระบบ(P(Yผม=1|Xผม)P(Yผม=0|Xผม))=β0+β1Xผม

ดังนั้นเราสามารถคำนวณความน่าจะเป็นแบบมีเงื่อนไขเหล่านี้ได้โดยตรงจากตัวแบบ อัตราส่วนแรกในนิพจน์สำหรับด้านบนคือ:OR

P(Yผม=1|Xผม=1)P(Yผม=0|Xผม=1)=(11+อี-(β0+β1))(อี-(β0+β1)1+อี-(β0+β1))=1อี-(β0+β1)=อี(β0+β1)

และที่สองคือ:

P(Yผม=0|Xผม=0)P(Yผม=1|Xผม=0)=(อี-β01+อี-β0)(11+อี-β0)=อี-β0

OR=อี(β0+β1)อี-β0=อีβ1

Z1,...,Zพี

P(Y=1|X=1,Z1,...,Zพี)P(Y=0|X=1,Z1,...,Zพี)P(Y=0|X=0,Z1,...,Zพี)P(Y=1|X=0,Z1,...,Zพี)

ดังนั้นมันคืออัตราส่วนอัตราต่อรองที่มีเงื่อนไขกับค่าของตัวทำนายอื่น ๆ ในแบบจำลองและโดยทั่วไปไม่เท่ากับ

P(Y=1|X=1)P(Y=0|X=1)P(Y=0|X=0)P(Y=1|X=0)

ดังนั้นจึงไม่น่าแปลกใจที่คุณสังเกตความแตกต่างระหว่างค่าสัมประสิทธิ์เลขยกกำลังและอัตราส่วนอัตราต่อรองที่สังเกตได้

β


2
ว้าวขอบคุณที่สละเวลาเขียนคำอธิบายที่สมบูรณ์
ไมค์

@Macro ฉันพบว่า "ค่า p น้อยกว่า 0.05" และ "95% CI ไม่รวม 1" ไม่สอดคล้องกันในการถดถอยโลจิสติก (ฉันใช้ SAS) ปรากฏการณ์นี้เกี่ยวข้องกับคำอธิบายของคุณหรือไม่?
user67275

4

ประสบการณ์(β)

μในแบบจำลองของคุณ แต่ยังมีปัญหาหากความสัมพันธ์ที่แท้จริงแตกต่างกันไปตามระดับของ covariate อื่น แต่ไม่รวมคำที่มีปฏิสัมพันธ์เช่น) เมื่อเราได้กำหนดไว้แล้วว่ามันมีความหมายในการคำนวณอัตราส่วนอัตราต่อรองโดย exponentiating เบต้าจาก แบบจำลองการถดถอยโลจิสติกส์เราสามารถถามคำถามว่าอัตราส่วนอัตราต่อรองตามโมเดลและส่วนต่างจะแตกต่างกันเมื่อใดและคุณควรเลือกแบบไหนเมื่อพวกเขาทำ

0/1R0ประสบการณ์(β)

หากขอบเขตหรือและโมเดลตาม OR แตกต่างกันคุณควรใช้ / ตีความเวอร์ชันตามโมเดล เหตุผลก็คือว่าชายขอบหรือไม่ได้บัญชีสำหรับความสับสนในหมู่เพื่อนร่วมทุนของคุณในขณะที่รูปแบบไม่ ปรากฏการณ์นี้เกี่ยวข้องกับSimpson's Paradoxซึ่งคุณอาจต้องการอ่านเกี่ยวกับ (SEP ยังมีรายการที่ดีมีการสนทนาเกี่ยวกับประวัติย่อที่นี่: Basic-simpson's-paradoxและคุณสามารถค้นหาแท็กของ CV ได้ เพื่อความเรียบง่ายและใช้งานได้จริงคุณอาจต้องการใช้รุ่นที่ใช้ OR เท่านั้นเพราะมันจะเป็นที่นิยมมากกว่าหรือเหมือนกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.