การตีความ exp (B) ในการถดถอยโลจิสติกพหุนาม


16

นี่เป็นคำถามเริ่มต้น แต่ผู้แปลตีความผล exp (B) ของ 6.012 ในรูปแบบการถดถอยโลจิสติกพหุนามอย่างไร

1) มันคือ 6.012-1.0 = 5.012 = ความเสี่ยงเพิ่มขึ้น 5012%?

หรือ

2) 6.012 / (1 + 6.012) = 0.857 = ความเสี่ยงที่เพิ่มขึ้น 85.7%?

ในกรณีที่ทางเลือกทั้งสองไม่ถูกต้องใครช่วยพูดถึงวิธีที่ถูกต้องได้ไหม?

ฉันได้ค้นหาแหล่งข้อมูลมากมายบนอินเทอร์เน็ตและฉันได้รับทางเลือกสองทางนี้และฉันไม่แน่ใจว่าสิ่งใดถูกต้อง

คำตอบ:


35

จะใช้เวลาสักครู่ก่อนที่เราจะไปถึงที่นั่น แต่โดยสรุปการเปลี่ยนแปลงหนึ่งหน่วยในตัวแปรที่เกี่ยวข้องกับ B จะทวีคูณความเสี่ยงสัมพัทธ์ของผลลัพธ์ (เทียบกับผลลัพธ์พื้นฐาน) 6.012

หนึ่งอาจแสดงสิ่งนี้ว่าเป็นการเพิ่มความเสี่ยงแบบสัมพัทธ์ "5012%" แต่นั่นเป็นวิธีที่ทำให้เกิดความสับสนและอาจทำให้เข้าใจผิดเพราะมันชี้ให้เห็นว่าเราควรคิดถึงการเปลี่ยนแปลงที่เพิ่มเข้ามาเมื่อในความเป็นจริง คิดทวีคูณ โมดิฟายเออร์ "สัมพัทธ์" เป็นสิ่งจำเป็นเนื่องจากการเปลี่ยนแปลงในตัวแปรกำลังเปลี่ยนแปลงความน่าจะเป็นที่คาดการณ์ของผลลัพธ์ทั้งหมดไม่เพียง แต่เป็นหนึ่งในคำถามดังนั้นเราจึงต้องเปรียบเทียบความน่าจะเป็น (โดยใช้อัตราส่วนไม่แตกต่างกัน)

ส่วนที่เหลือของคำตอบนี้จะพัฒนาคำศัพท์และสัญชาตญาณที่จำเป็นในการตีความคำสั่งเหล่านี้อย่างถูกต้อง

พื้นหลัง

เริ่มต้นด้วยการถดถอยโลจิสติกส์ธรรมดาก่อนที่จะไปยังกรณีพหุนาม

สำหรับตัวแปรพึ่งพา (ไบนารี) และตัวแปรอิสระX i , โมเดลคือYXi

Pr[Y=1]=exp(β1X1++βmXm)1+exp(β1X1++βmXm);

เท่ากันสมมติว่า ,0Pr[Y=1]1

log(ρ(X1,,Xm))=logPr[Y=1]Pr[Y=0]=β1X1++βmXm.

(นี่เป็นเพียงการนิยามซึ่งเป็นอัตราต่อรองเป็นฟังก์ชั่นของX i .)ρXi

โดยไม่มีการสูญเสียความสามารถทั่วไปให้ทำดัชนีเพื่อให้X mเป็นตัวแปรและβ mคือ "B" ในคำถาม (ดังนั้นexp ( β m ) = 6.012 ) แก้ไขค่าของX ฉัน , 1 ฉัน< เมตรและที่แตกต่างกันX เมตรตามจำนวนเงินที่มีขนาดเล็กδอัตราผลตอบแทนXiXmβmexp(βm)=6.012Xi,1i<mXmδ

log(ρ(,Xm+δ))log(ρ(,Xm))=βmδ.

ดังนั้นคือการเปลี่ยนแปลงเล็กน้อยในอัตราต่อรองการเข้าสู่ระบบที่เกี่ยวกับXเมตรβm Xm

ในการกู้คืนเราต้องตั้งค่าδ = 1อย่างชัดเจนและยกกำลังด้านซ้ายมือ:exp(βm)δ=1

exp(βm)=exp(βm×1)=exp(log(ρ(,Xm+1))log(ρ(,Xm)))=ρ(,Xm+1)ρ(,Xm).

การจัดแสดงนิทรรศการนี้เป็นอัตราส่วนราคาต่อรองสำหรับการเพิ่มขึ้นหนึ่งหน่วยในXเมตร ในการพัฒนาสัญชาตญาณสำหรับความหมายของสิ่งนี้ให้จัดระเบียบค่าบางอย่างสำหรับช่วงของอัตราต่อรองเริ่มต้นการปัดเศษอย่างหนักเพื่อให้รูปแบบโดดเด่น:exp(βm)Xm

Starting odds  Ending odds  Starting Pr[Y=1]  Ending Pr[Y=1]
0.0001         0.0006       0.0001            0.0006
0.001          0.006        0.001             0.006
0.01           0.06         0.01              0.057
0.1            0.6          0.091             0.38
1.             6.           0.5               0.9
10.            60.          0.91              1.
100.           600.         0.99              1.

สำหรับอัตราต่อรองที่เล็กมากซึ่งสอดคล้องกับความน่าจะเป็นที่เล็กมากผลของการเพิ่มขึ้นหนึ่งหน่วยในคือการคูณอัตราต่อรองหรือความน่าจะเป็นประมาณ 6.012 ปัจจัยคูณจะลดลงเมื่ออัตราต่อรอง (และความน่าจะเป็น) มีขนาดใหญ่ขึ้นและจะหายไปเมื่ออัตราต่อรองเกิน 10 (ความน่าจะเป็นสูงกว่า 0.9)Xm

อัตราส่วนการเปลี่ยนแปลงในความน่าจะเป็น

จากการเปลี่ยนแปลงที่เพิ่มขึ้นมีความแตกต่างไม่มากระหว่างความน่าจะเป็น 0.0001 และ 0.0006 (เพียง 0.05%) และไม่มีความแตกต่างระหว่าง 0.99 ถึง 1 (เพียง 1%) ผลของสารเติมแต่งที่ใหญ่ที่สุดเกิดขึ้นเมื่ออัตราต่อรองเท่ากับโดยที่ความน่าจะเป็นเปลี่ยนจาก 29% เป็น 71%: การเปลี่ยนแปลงที่ + 42%1/6.0120.408

การเปลี่ยนแปลงความน่าจะเป็นเพิ่มเติม

จากนั้นเราจะเห็นว่าหากเราแสดง "ความเสี่ยง" เป็นอัตราเดิมพัน = "B" มีการตีความอย่างง่าย - อัตราต่อรองเท่ากับβ mสำหรับการเพิ่มหน่วยในX mβmβmXm - แต่เมื่อเราแสดงความเสี่ยงใน แฟชั่นอื่น ๆ เช่นการเปลี่ยนแปลงความน่าจะเป็นการตีความต้องใช้ความระมัดระวังเพื่อระบุความน่าจะเป็นเริ่มต้น

การถดถอยโลจิสติกพหุนาม

(สิ่งนี้ถูกเพิ่มเป็นการแก้ไขในภายหลัง)

การรับรู้คุณค่าของการใช้อัตราต่อรองเพื่อแสดงโอกาสลองมาที่กรณีพหุนาม ตอนนี้ตัวแปรตามสามารถเท่ากับหนึ่งในYประเภทจัดทำดัชนีโดยฉัน= 1 , 2 , ... , k ญาติน่าจะเป็นว่ามันอยู่ในหมวดหมู่ของฉันคือk2i=1,2,,ki

Pr[Yi]exp(β1(i)X1++βm(i)Xm)

กับพารามิเตอร์ที่จะได้รับการพิจารณาและการเขียนY ฉันสำหรับPr [ Y = หมวดหมู่  ฉัน ] ในฐานะตัวย่อลองเขียนนิพจน์ทางขวามือเป็นpβj(i)YiPr[Y=category i]หรือที่ Xและ βมีความชัดเจนจากบริบทเพียงหน้าฉัน การทำให้เป็นปกติน่าจะทำให้ความน่าจะเป็นสัมพัทธ์เหล่านี้รวมกับความสามัคคีpi(X,β)Xβpi

Pr[Yi]=pi(X,β)p1(X,β)++pm(X,β).

(มีความกำกวมในพารามิเตอร์: มีจำนวนมากเกินไปตามอัตภาพหนึ่งเลือกหมวดหมู่ "ฐาน" สำหรับการเปรียบเทียบและบังคับให้สัมประสิทธิ์ทั้งหมดเป็นศูนย์อย่างไรก็ตามถึงแม้ว่านี่เป็นสิ่งจำเป็นในการรายงานการประเมินที่ไม่ซ้ำกันของ betas มันจะไม่จำเป็นที่จะตีความค่าสัมประสิทธิ์เพื่อรักษาความสมมาตร -. นั่นคือการหลีกเลี่ยงความแตกต่างใด ๆ เทียมหมู่หมวดหมู่ - ให้ไม่บังคับใช้ข้อ จำกัด ดังกล่าวใด ๆ จนกว่าเราจะต้อง).

วิธีหนึ่งในการตีความโมเดลนี้คือการขออัตราการเปลี่ยนแปลงของอัตราต่อรองการบันทึกสำหรับหมวดหมู่ใด ๆ (พูดหมวดหมู่ ) ที่เกี่ยวกับตัวแปรอิสระตัวใดตัวหนึ่ง (พูด X j ) นั่นคือเมื่อเราเปลี่ยน X Jโดยนิด ๆ หน่อย ๆ ที่ก่อให้เกิดการเปลี่ยนแปลงในอัตราต่อรองเข้าสู่ระบบของ Yฉัน เรามีความสนใจในค่าคงที่ของสัดส่วนที่เกี่ยวข้องกับการเปลี่ยนแปลงทั้งสองนี้ กฎลูกโซ่ของแคลคูลัสพร้อมกับพีชคณิตเล็กน้อยบอกเราว่าอัตราการเปลี่ยนแปลงนี้คือiXjXjYi

 log odds(Yi) Xj=βj(i)βj(1)p1++βj(i1)pi1+βj(i+1)pi+1++βj(k)pkp1++pi1+pi+1++pk.

สิ่งนี้มีการตีความที่ค่อนข้างง่ายเนื่องจากสัมประสิทธิ์ของX jในสูตรสำหรับโอกาสที่Yอยู่ในหมวดหมู่ฉันลบด้วย "การปรับ" การปรับเป็นค่าเฉลี่ยถ่วงน้ำหนักของความน่าจะเป็นของสัมประสิทธิ์ของX jในหมวดอื่น ๆทั้งหมด น้ำหนักจะคำนวณโดยใช้ความน่าจะเป็นที่เกี่ยวข้องกับค่าปัจจุบันของตัวแปรอิสระX ดังนั้นการเปลี่ยนแปลงเล็กน้อยในบันทึกจึงไม่จำเป็นต้องคงที่: มันขึ้นอยู่กับความน่าจะเป็นของหมวดหมู่อื่น ๆ ทั้งหมดไม่ใช่แค่ความน่าจะเป็นของหมวดหมู่ในคำถาม (หมวดที่1)βj(i)XjYiXjXi)

เมื่อมีเพียงหมวดหมู่สิ่งนี้ควรลดการถดถอยโลจิสติกสามัญ อันที่จริงน้ำหนักน่าจะไม่ทำอะไรเลยและ (เลือกฉัน= 2 ) ให้เพียงแค่ความแตกต่างβ ( 2 )เจ - β ( 1 )เจ ปล่อยให้หมวดหมู่ฉันเป็นกรณีฐานลดต่อไปนี้เพื่อเบต้า( 2 )เจเพราะเราบังคับβ ( 1 ) J = 0 ดังนั้นการตีความใหม่ทำให้ภาพเก่าแก่k=2i=2βj(2)βj(1)iβj(2)βj(1)=0

หากต้องการตีความโดยตรงจากนั้นเราจะแยกมันออกทางด้านหนึ่งของสูตรก่อนหน้าซึ่งนำไปสู่:βj(i)

ค่าสัมประสิทธิ์ของสำหรับหมวดหมู่ฉันเท่ากับการเปลี่ยนแปลงเล็กน้อยในอัตราต่อรองการเข้าสู่ระบบของหมวดหมู่ฉันเกี่ยวกับตัวแปรX J , บวกค่าเฉลี่ยของความน่าจะเป็น-ถ่วงน้ำหนักของค่าสัมประสิทธิ์ของทั้งหมดอื่น ๆX J 'สำหรับหมวดหมู่ฉันXjiiXjXji

การตีความอีกแม้จะเล็ก ๆ น้อย ๆ โดยตรงน้อยเป็น afforded โดย (ชั่วคราว) การตั้งหมวดหมู่เป็นกรณีฐานจึงทำให้β ( ฉัน) J = 0สำหรับทุกตัวแปรอิสระX J :iβj(i)=0Xj

อัตรากำไรขั้นต้นของการเปลี่ยนแปลงในอัตราต่อรองของกรณีพื้นฐานสำหรับตัวแปรเป็นค่าลบของค่าเฉลี่ยความน่าจะเป็นน้ำหนักของค่าสัมประสิทธิ์สำหรับทุกกรณีอื่น ๆXj

โดยทั่วไปแล้วการใช้การตีความเหล่านี้จำเป็นต้องมีการแยก betas และความน่าจะเป็นจากผลลัพธ์ของซอฟต์แวร์และทำการคำนวณตามที่แสดง

Finally, for the exponentiated coefficients, note that the ratio of probabilities among two outcomes (sometimes called the "relative risk" of i compared to i) is

YiYi=pi(X,β)pi(X,β).

Let's increase Xj by one unit to Xj+1. This multiplies pi by exp(βj(i)) and pi by exp(βj(i)), whence the relative risk is multiplied by exp(βj(i))/exp(βj(i)) = exp(βj(i)βj(i)). Taking category i to be the base case reduces this to exp(βj(i)), leading us to say,

The exponentiated coefficient exp(βj(i)) is the amount by which the relative risk Pr[Y=category i]/Pr[Y=base category] is multiplied when variable Xj is increased by one unit.


1
Great explanations, but the OP explicitly asked for the multinomial model. I may be reading more into the question than the OP intended, and the explanation for the binary case may be adequate, but I would love to see this answer cover the general multinomial case too. Even though the parametrization is similar, the "log-odds" are in general with respect to an (arbitrary) reference category, and they are not really log-odds, and a unit change in Xi results in a combined change of these "log-odds", and an increasing "log-odds" does not imply and increasing probability.
NRH

@NRH That's an excellent point. I had somehow read "multivariate" instead of "multinomial." If I get a chance to return to this I will try to flesh out those details. Fortunately the same mode of analysis is effective in finding the correct interpretation.
whuber

@NRH Done. I welcome your suggestions (or anyone else's) about how to make the interpretation clearer, or for alternative interpretations.
whuber

1
thanks for writing this down. The complete answer is a very good reference.
NRH

1

Try considering this bit of explanation in addition to what @whuber has already written so well. If exp(B) = 6, then the odds ratio associated with an increase of 1 on the predictor in question is 6. In a multinomial context, by "odds ratio" we mean the ratio of these two quantities: a) the odds (not probability, but rather p/[1-p]) of a case taking the value of the dependent variable indicated in the output table in question, and b) the odds of a case taking the reference value of the dependent variable.

You seem to be looking to quantify the probability--rather than odds-- of a case being in one or the other category. To do this you would need to know what probabilities the case "started with" -- i.e., before we assumed the increase of 1 on the predictor in question. Ratios of probabilities will vary case by case, while the ratio of odds connected with an increase of 1 on the predictor stays the same.


"If exp(B) = 6, then the odds ratio associated with an increase of 1 on the predictor in question is 6", if I read @whuber's answer correctly it says that the odds ratio will be multiplied by 6 with an increase of 1 on the predictor. That is, the new odds ratio will not be 6. Or am I intepreting things incorrectly?
rbm

Where you say "the new odds ratio will not be 6" I would say "the new odds will not be 6...but the ratio of the new to the old odds will be 6."
rolando2

Yes, I agree with that! But I just thought that "the odds ratio associated with an increase of 1 on the predictor in question is 6" does not really say that. But maybe I am just misinterpreting it then. Thanks for the clarification!
rbm

1

I was also looking for the same answer, but the once above were not satisfying for me. It seemed to complex for what it really is. So I will give my interpretation, please correct me if I am wrong.

Do however read to the end, since it is important.

First of all the values B and Exp(B) are the once you are looking for. If the B is negative your Exp(B) will be lower than one, which means odds decrease. If higher the Exp(B) will be higher than 1, meaning odds increase. Since you are multiplying by the factor Exp(B).

Unfortunately you are not there yet. Because in a multinominal regression your dependent variable has multiple categories, let's call these categories D1, D2 and D3. Of which your last is the reference category. And let's assume your first independent variable is sex (males vs females).

Let's say the output for D1 -> males is exp(B)= 1.21, this means for males the odds increase by a factor 1.21 for being in the category D1 rather than D3 (reference category) compared to females (reference category).

So you are always comparing against your reference category of the dependent but also independent variables. This is not true if you have a covariate variable. In that case it would mean; a one unit increase in X increases the odds by a factor of 1.21 of being in category D1 rather than D3.

For those with an ordinal dependent variable:

If you have an ordinal dependent variable and did not do an ordinal regression because of the assumption of proportional odds for instance. Keep in mind your highest category is the reference category. Your result as above are valid to report. But keep in mind that an increase in odds than in fact means an increase in odds of being in the lower category rather than the higher! But that's only if you have an ordinal dependant variable.

If you want to know the increase in percentage, well take a fictive odds-number, let's say 100 and multiply it by 1.21 which is 121? Compared to 100 how much did it change percentage wise?


0

พูดว่า exp (b) ใน mlogit เท่ากับ 1.04 ถ้าคุณคูณตัวเลขด้วย 1.04 มันจะเพิ่มขึ้น 4% นั่นคือความเสี่ยงสัมพัทธ์ของการอยู่ในหมวด a แทน b ฉันสงสัยว่าส่วนหนึ่งของความสับสนที่นี่อาจจะเกี่ยวข้องกับ 4% (ความหมายแบบทวีคูณ) และ 4 เปอร์เซ็นต์คะแนน (ความหมายเพิ่มเติม) การตีความ% ถูกต้องถ้าเราพูดถึงการเปลี่ยนแปลงเปอร์เซ็นต์ไม่ใช่การเปลี่ยนแปลงจุดร้อยละ (อันหลังจะไม่สมเหตุสมผล แต่อย่างใดเนื่องจากความเสี่ยงสัมพัทธ์ไม่แสดงเป็นเปอร์เซ็นต์)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.