จะใช้เวลาสักครู่ก่อนที่เราจะไปถึงที่นั่น แต่โดยสรุปการเปลี่ยนแปลงหนึ่งหน่วยในตัวแปรที่เกี่ยวข้องกับ B จะทวีคูณความเสี่ยงสัมพัทธ์ของผลลัพธ์ (เทียบกับผลลัพธ์พื้นฐาน) 6.012
หนึ่งอาจแสดงสิ่งนี้ว่าเป็นการเพิ่มความเสี่ยงแบบสัมพัทธ์ "5012%" แต่นั่นเป็นวิธีที่ทำให้เกิดความสับสนและอาจทำให้เข้าใจผิดเพราะมันชี้ให้เห็นว่าเราควรคิดถึงการเปลี่ยนแปลงที่เพิ่มเข้ามาเมื่อในความเป็นจริง คิดทวีคูณ โมดิฟายเออร์ "สัมพัทธ์" เป็นสิ่งจำเป็นเนื่องจากการเปลี่ยนแปลงในตัวแปรกำลังเปลี่ยนแปลงความน่าจะเป็นที่คาดการณ์ของผลลัพธ์ทั้งหมดไม่เพียง แต่เป็นหนึ่งในคำถามดังนั้นเราจึงต้องเปรียบเทียบความน่าจะเป็น (โดยใช้อัตราส่วนไม่แตกต่างกัน)
ส่วนที่เหลือของคำตอบนี้จะพัฒนาคำศัพท์และสัญชาตญาณที่จำเป็นในการตีความคำสั่งเหล่านี้อย่างถูกต้อง
พื้นหลัง
เริ่มต้นด้วยการถดถอยโลจิสติกส์ธรรมดาก่อนที่จะไปยังกรณีพหุนาม
สำหรับตัวแปรพึ่งพา (ไบนารี) และตัวแปรอิสระX i , โมเดลคือYXi
Pr[Y=1]=exp(β1X1+⋯+βmXm)1+exp(β1X1+⋯+βmXm);
เท่ากันสมมติว่า ,0≠Pr[Y=1]≠1
log(ρ(X1,⋯,Xm))=logPr[Y=1]Pr[Y=0]=β1X1+⋯+βmXm.
(นี่เป็นเพียงการนิยามซึ่งเป็นอัตราต่อรองเป็นฟังก์ชั่นของX i .)ρXi
โดยไม่มีการสูญเสียความสามารถทั่วไปให้ทำดัชนีเพื่อให้X mเป็นตัวแปรและβ mคือ "B" ในคำถาม (ดังนั้นexp ( β m ) = 6.012 ) แก้ไขค่าของX ฉัน , 1 ≤ ฉัน< เมตรและที่แตกต่างกันX เมตรตามจำนวนเงินที่มีขนาดเล็กδอัตราผลตอบแทนXiXmβmexp(βm)=6.012Xi,1≤i<mXmδ
log(ρ(⋯,Xm+δ))−log(ρ(⋯,Xm))=βmδ.
ดังนั้นคือการเปลี่ยนแปลงเล็กน้อยในอัตราต่อรองการเข้าสู่ระบบที่เกี่ยวกับXเมตรβm Xm
ในการกู้คืนเราต้องตั้งค่าδ = 1อย่างชัดเจนและยกกำลังด้านซ้ายมือ:exp(βm)δ=1
exp(βm)=exp(βm×1)=exp(log(ρ(⋯,Xm+1))−log(ρ(⋯,Xm)))=ρ(⋯,Xm+1)ρ(⋯,Xm).
การจัดแสดงนิทรรศการนี้เป็นอัตราส่วนราคาต่อรองสำหรับการเพิ่มขึ้นหนึ่งหน่วยในXเมตร ในการพัฒนาสัญชาตญาณสำหรับความหมายของสิ่งนี้ให้จัดระเบียบค่าบางอย่างสำหรับช่วงของอัตราต่อรองเริ่มต้นการปัดเศษอย่างหนักเพื่อให้รูปแบบโดดเด่น:exp(βm)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
สำหรับอัตราต่อรองที่เล็กมากซึ่งสอดคล้องกับความน่าจะเป็นที่เล็กมากผลของการเพิ่มขึ้นหนึ่งหน่วยในคือการคูณอัตราต่อรองหรือความน่าจะเป็นประมาณ 6.012 ปัจจัยคูณจะลดลงเมื่ออัตราต่อรอง (และความน่าจะเป็น) มีขนาดใหญ่ขึ้นและจะหายไปเมื่ออัตราต่อรองเกิน 10 (ความน่าจะเป็นสูงกว่า 0.9)Xm
จากการเปลี่ยนแปลงที่เพิ่มขึ้นมีความแตกต่างไม่มากระหว่างความน่าจะเป็น 0.0001 และ 0.0006 (เพียง 0.05%) และไม่มีความแตกต่างระหว่าง 0.99 ถึง 1 (เพียง 1%) ผลของสารเติมแต่งที่ใหญ่ที่สุดเกิดขึ้นเมื่ออัตราต่อรองเท่ากับโดยที่ความน่าจะเป็นเปลี่ยนจาก 29% เป็น 71%: การเปลี่ยนแปลงที่ + 42%1/6.012−−−−√∼0.408
จากนั้นเราจะเห็นว่าหากเราแสดง "ความเสี่ยง" เป็นอัตราเดิมพัน = "B" มีการตีความอย่างง่าย - อัตราต่อรองเท่ากับβ mสำหรับการเพิ่มหน่วยในX mβmβmXm - แต่เมื่อเราแสดงความเสี่ยงใน แฟชั่นอื่น ๆ เช่นการเปลี่ยนแปลงความน่าจะเป็นการตีความต้องใช้ความระมัดระวังเพื่อระบุความน่าจะเป็นเริ่มต้น
การถดถอยโลจิสติกพหุนาม
(สิ่งนี้ถูกเพิ่มเป็นการแก้ไขในภายหลัง)
การรับรู้คุณค่าของการใช้อัตราต่อรองเพื่อแสดงโอกาสลองมาที่กรณีพหุนาม ตอนนี้ตัวแปรตามสามารถเท่ากับหนึ่งในYประเภทจัดทำดัชนีโดยฉัน= 1 , 2 , ... , k ญาติน่าจะเป็นว่ามันอยู่ในหมวดหมู่ของฉันคือk≥2i=1,2,…,ki
Pr[Yi]∼exp(β(i)1X1+⋯+β(i)mXm)
กับพารามิเตอร์ที่จะได้รับการพิจารณาและการเขียนY ฉันสำหรับPr [ Y = หมวดหมู่ ฉัน ] ในฐานะตัวย่อลองเขียนนิพจน์ทางขวามือเป็นpβ(i)jYiPr[Y=category i]หรือที่ Xและ βมีความชัดเจนจากบริบทเพียงหน้าฉัน การทำให้เป็นปกติน่าจะทำให้ความน่าจะเป็นสัมพัทธ์เหล่านี้รวมกับความสามัคคีpi(X,β)Xβpi
Pr[Yi]=pi(X,β)p1(X,β)+⋯+pm(X,β).
(มีความกำกวมในพารามิเตอร์: มีจำนวนมากเกินไปตามอัตภาพหนึ่งเลือกหมวดหมู่ "ฐาน" สำหรับการเปรียบเทียบและบังคับให้สัมประสิทธิ์ทั้งหมดเป็นศูนย์อย่างไรก็ตามถึงแม้ว่านี่เป็นสิ่งจำเป็นในการรายงานการประเมินที่ไม่ซ้ำกันของ betas มันจะไม่จำเป็นที่จะตีความค่าสัมประสิทธิ์เพื่อรักษาความสมมาตร -. นั่นคือการหลีกเลี่ยงความแตกต่างใด ๆ เทียมหมู่หมวดหมู่ - ให้ไม่บังคับใช้ข้อ จำกัด ดังกล่าวใด ๆ จนกว่าเราจะต้อง).
วิธีหนึ่งในการตีความโมเดลนี้คือการขออัตราการเปลี่ยนแปลงของอัตราต่อรองการบันทึกสำหรับหมวดหมู่ใด ๆ (พูดหมวดหมู่ ) ที่เกี่ยวกับตัวแปรอิสระตัวใดตัวหนึ่ง (พูด X j ) นั่นคือเมื่อเราเปลี่ยน X Jโดยนิด ๆ หน่อย ๆ ที่ก่อให้เกิดการเปลี่ยนแปลงในอัตราต่อรองเข้าสู่ระบบของ Yฉัน เรามีความสนใจในค่าคงที่ของสัดส่วนที่เกี่ยวข้องกับการเปลี่ยนแปลงทั้งสองนี้ กฎลูกโซ่ของแคลคูลัสพร้อมกับพีชคณิตเล็กน้อยบอกเราว่าอัตราการเปลี่ยนแปลงนี้คือiXjXjYi
∂ log odds(Yi)∂ Xj=β(i)j−β(1)jp1+⋯+β(i−1)jpi−1+β(i+1)jpi+1+⋯+β(k)jpkp1+⋯+pi−1+pi+1+⋯+pk.
สิ่งนี้มีการตีความที่ค่อนข้างง่ายเนื่องจากสัมประสิทธิ์ของX jในสูตรสำหรับโอกาสที่Yอยู่ในหมวดหมู่ฉันลบด้วย "การปรับ" การปรับเป็นค่าเฉลี่ยถ่วงน้ำหนักของความน่าจะเป็นของสัมประสิทธิ์ของX jในหมวดอื่น ๆทั้งหมด น้ำหนักจะคำนวณโดยใช้ความน่าจะเป็นที่เกี่ยวข้องกับค่าปัจจุบันของตัวแปรอิสระX ดังนั้นการเปลี่ยนแปลงเล็กน้อยในบันทึกจึงไม่จำเป็นต้องคงที่: มันขึ้นอยู่กับความน่าจะเป็นของหมวดหมู่อื่น ๆ ทั้งหมดไม่ใช่แค่ความน่าจะเป็นของหมวดหมู่ในคำถาม (หมวดที่1)β(i)jXjYiXjXi)
เมื่อมีเพียงหมวดหมู่สิ่งนี้ควรลดการถดถอยโลจิสติกสามัญ อันที่จริงน้ำหนักน่าจะไม่ทำอะไรเลยและ (เลือกฉัน= 2 ) ให้เพียงแค่ความแตกต่างβ ( 2 )เจ - β ( 1 )เจ ปล่อยให้หมวดหมู่ฉันเป็นกรณีฐานลดต่อไปนี้เพื่อเบต้า( 2 )เจเพราะเราบังคับβ ( 1 ) J = 0 ดังนั้นการตีความใหม่ทำให้ภาพเก่าแก่k=2i=2β(2)j−β(1)jiβ(2)jβ(1)j=0
หากต้องการตีความโดยตรงจากนั้นเราจะแยกมันออกทางด้านหนึ่งของสูตรก่อนหน้าซึ่งนำไปสู่:β(i)j
ค่าสัมประสิทธิ์ของสำหรับหมวดหมู่ฉันเท่ากับการเปลี่ยนแปลงเล็กน้อยในอัตราต่อรองการเข้าสู่ระบบของหมวดหมู่ฉันเกี่ยวกับตัวแปรX J , บวกค่าเฉลี่ยของความน่าจะเป็น-ถ่วงน้ำหนักของค่าสัมประสิทธิ์ของทั้งหมดอื่น ๆX J 'สำหรับหมวดหมู่ฉันXjiiXjXj′i
การตีความอีกแม้จะเล็ก ๆ น้อย ๆ โดยตรงน้อยเป็น afforded โดย (ชั่วคราว) การตั้งหมวดหมู่เป็นกรณีฐานจึงทำให้β ( ฉัน) J = 0สำหรับทุกตัวแปรอิสระX J :iβ(i)j=0Xj
อัตรากำไรขั้นต้นของการเปลี่ยนแปลงในอัตราต่อรองของกรณีพื้นฐานสำหรับตัวแปรเป็นค่าลบของค่าเฉลี่ยความน่าจะเป็นน้ำหนักของค่าสัมประสิทธิ์สำหรับทุกกรณีอื่น ๆXj
โดยทั่วไปแล้วการใช้การตีความเหล่านี้จำเป็นต้องมีการแยก betas และความน่าจะเป็นจากผลลัพธ์ของซอฟต์แวร์และทำการคำนวณตามที่แสดง
Finally, for the exponentiated coefficients, note that the ratio of probabilities among two outcomes (sometimes called the "relative risk" of i compared to i′) is
YiYi′=pi(X,β)pi′(X,β).
Let's increase Xj by one unit to Xj+1. This multiplies pi by exp(β(i)j) and pi′ by exp(β(i′)j), whence the relative risk is multiplied by exp(β(i)j)/exp(β(i′)j) = exp(β(i)j−β(i′)j). Taking category i′ to be the base case reduces this to exp(β(i)j), leading us to say,
The exponentiated coefficient exp(β(i)j) is the amount by which the relative risk Pr[Y=category i]/Pr[Y=base category] is multiplied when variable Xj is increased by one unit.