ฉันจะตีความโมเดล probit ใน Stata ได้อย่างไร


13

ฉันไม่แน่ใจว่าจะตีความการถดถอยของโปรบิตนี้ได้อย่างไรฉันวิ่งบน Stata ข้อมูลอยู่ในการอนุมัติสินเชื่อและสีขาวเป็นตัวแปรจำลองที่ = 1 หากบุคคลเป็นสีขาวและ = 0 หากบุคคลนั้นไม่ใช่ ความช่วยเหลือเกี่ยวกับวิธีการอ่านนี้จะได้รับการชื่นชมอย่างมาก สิ่งที่ฉันกำลังมองหาส่วนใหญ่คือวิธีการค้นหาความน่าจะเป็นโดยประมาณของการอนุมัติสินเชื่อสำหรับทั้งขาวและไม่ใช่ขาว บางคนสามารถช่วยฉันด้วยข้อความที่นี่และวิธีการทำให้เป็นเรื่องปกติได้หรือไม่? ฉันขอโทษฉันไม่รู้วิธีการทำเช่นนี้

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

สำหรับตัวแปรสีขาว:

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985  

สำหรับค่าคงที่:

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962  

คำตอบ:


44

โดยทั่วไปแล้วคุณไม่สามารถตีความค่าสัมประสิทธิ์จากผลลัพธ์ของการถดถอยแบบโปรบิต (ไม่ได้อยู่ในวิธีมาตรฐานอย่างน้อยที่สุด) คุณจำเป็นต้องตีความผลกระทบเล็กน้อยของ regressors นั่นคือความน่าจะเป็น (เงื่อนไข) ของตัวแปรผลลัพธ์เปลี่ยนแปลงเมื่อคุณเปลี่ยนค่าของ regressor ให้คงที่ regressors อื่น ๆ ทั้งหมดที่ค่าบางค่า สิ่งนี้แตกต่างจากกรณีการถดถอยเชิงเส้นตรงซึ่งคุณตีความค่าสัมประสิทธิ์โดยประมาณโดยตรง เป็นเช่นนี้เพราะในกรณีการถดถอยเชิงเส้นค่าสัมประสิทธิ์การถดถอยมีผลกระทบเล็กน้อย

ในการถดถอย probit มีขั้นตอนเพิ่มเติมของการคำนวณที่จำเป็นในการได้รับผลกระทบเล็กน้อยเมื่อคุณได้คำนวณพอดีกับการถดถอย probit

ตัวแบบการถดถอยเชิงเส้นและแบบโปรบิต

  • การถดถอยแบบ Probit : จำได้ว่าในแบบจำลอง probit คุณกำลังสร้างแบบจำลองความน่าจะเป็น (เงื่อนไข) ของผลลัพธ์ที่ "สำเร็จ" นั่นคือ , โดยที่คือ ฟังก์ชันการแจกแจงสะสมของการแจกแจงแบบปกติมาตรฐาน สิ่งนี้บอกโดยทั่วไปแล้วว่าเงื่อนไขของ regressors ความน่าจะเป็นที่ตัวแปรผลลัพธ์คือ 1 เป็นฟังก์ชันหนึ่งของการรวมกันเชิงเส้นของ regressorsYi=1

    P[Yi=1X1i,,XKi;β0,,βK]=Φ(β0+k=1KβkXki)
    Φ()Yi
  • การถดถอยเชิงเส้น : เปรียบเทียบสิ่งนี้กับโมเดลการถดถอยเชิงเส้นที่

E(YiX1i,,XKi;β0,,βK)=β0+k=1KβkXki
ค่าเฉลี่ย (เงื่อนไข) ของผลลัพธ์คือการรวมกันเชิงเส้นของ regressors

ผลกระทบเล็กน้อย

นอกเหนือจากแบบจำลองการถดถอยเชิงเส้นค่าสัมประสิทธิ์ไม่ค่อยมีการตีความโดยตรง เรามีความสนใจโดยทั่วไปในceteris paribusผลกระทบของการเปลี่ยนแปลงใน regressors ที่มีผลต่อคุณสมบัติของตัวแปรผลที่ นี่คือความคิดที่ว่าการวัดผลกระทบเล็กน้อย

  • การถดถอยเชิงเส้น : ตอนนี้ฉันต้องการที่จะรู้ว่าค่าเฉลี่ยของตัวแปรผลลัพธ์ย้ายไปเท่าใดเมื่อฉันย้ายหนึ่งใน regressors

E(YiX1i,,XKi;β0,,βK)Xki=βk

แต่นี่เป็นเพียงสัมประสิทธิ์การถดถอยซึ่งหมายความว่าผลกระทบเล็กน้อยจากการเปลี่ยนแปลงของ -th regressor เป็นเพียงสัมประสิทธิ์การถดถอยk

  • การถดถอย Probit : อย่างไรก็ตามมันเป็นเรื่องง่ายที่จะเห็นว่านี่ไม่ใช่กรณีของการถดถอยProbit

P[Yi=1X1i,,XKi;β0,,βK]Xki=βkϕ(β0+k=1KβkXki)
ซึ่งไม่เหมือนกับสัมประสิทธิ์การถดถอย นี่คือผลกระทบส่วนเพิ่มสำหรับโมเดล probit และปริมาณที่เราใช้ โดยเฉพาะอย่างยิ่งสิ่งนี้ขึ้นอยู่กับค่าของ regressors อื่น ๆ ทั้งหมดและสัมประสิทธิ์การถดถอย ที่นี่คือฟังก์ชันความหนาแน่นของความน่าจะเป็นปกติแบบมาตรฐานϕ()

คุณจะคำนวณปริมาณนี้อย่างไรและตัวเลือกของ regressors อื่น ๆ ที่ควรป้อนสูตรนี้มีอะไรบ้าง โชคดีที่ Stata ให้การคำนวณนี้หลังจากการถดถอยแบบ probit และให้ค่าเริ่มต้นของตัวเลือกของ regressors อื่น ๆ (ไม่มีข้อตกลงสากลสำหรับค่าเริ่มต้นเหล่านี้)

การถดถอยแบบไม่ต่อเนื่อง

โปรดทราบว่าส่วนใหญ่ข้างต้นใช้กับกรณีของการถดถอยต่อเนื่องเนื่องจากเราใช้แคลคูลัส ในกรณีของการแยกแบบไม่ต่อเนื่องคุณจำเป็นต้องใช้การเปลี่ยนแปลงแบบแยก ตัวอย่างเช่นการเปลี่ยนแปลงแบบไม่ต่อเนื่องใน regressorที่รับค่าคือXki{0,1}

ΔXkiP[Yi=1X1i,,XKi;β0,,βK]=βkϕ(β0+l=1k1βlXli+βk+l=k+1KβlXli)βkϕ(β0+l=1k1βlXli+l=k+1KβlXli)

การคำนวณหาผลกระทบเล็กน้อยใน Stata

การถดถอย Probit : นี่คือตัวอย่างของการคำนวณผลกระทบเล็กน้อยหลังจากการถดถอย Probitใน Stata

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

นี่คือผลลัพธ์ที่คุณจะได้รับจากmarginsคำสั่ง

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

สิ่งนี้สามารถตีความได้ว่าการเปลี่ยนแปลงหนึ่งหน่วยในageตัวแปรเพิ่มความน่าจะเป็นของสถานะสหภาพโดย 0.003442 ในทำนองเดียวกันจากทางใต้ลดความน่าจะเป็นของสถานะสหภาพลง 0.1054928

การถดถอยเชิงเส้น : เป็นการตรวจสอบขั้นสุดท้ายเราสามารถยืนยันได้ว่าผลกระทบเล็กน้อยในตัวแบบการถดถอยเชิงเส้นเหมือนกับค่าสัมประสิทธิ์การถดถอย (ที่มีการบิดเล็กน้อย) ใช้การถดถอยต่อไปนี้และคำนวณผลกระทบเล็กน้อยหลังจาก

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

เพียงแค่ให้ค่าสัมประสิทธิ์การถดถอยกลับคืนมา สังเกตความจริงที่น่าสนใจว่า Stata คำนวณผลกระทบส่วนเพิ่มสุทธิของ regressor รวมถึงผลกระทบจากเงื่อนไขกำลังสองถ้ารวมอยู่ในแบบจำลอง

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------

ฉันคิดว่านิพจน์ของคุณสำหรับสำหรับกรณีการถดถอยแบบแยกกันผิด คุณจะพาความแตกต่างของที่มาของแต่มันควรจะเป็นความแตกต่างของ1] มันควรจะเป็นคำที่สองของ RHS แต่ไม่มีเครื่องหมายลบ ΔXkP[Y=1]P[Y=1]
Ravi

1

ยิ่งไปกว่านั้นสัมประสิทธิ์ในการถดถอย probit สามารถตีความได้ว่า "การเพิ่มขึ้นหนึ่งหน่วยในยุคสอดคล้องกับเพิ่มขึ้นในคะแนน z สำหรับความน่าจะเป็นที่จะอยู่ในสหภาพ" ( ดูลิงค์ )βage

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

จากนั้นทำ

predict yhat

และคุณจะเห็นว่าสำหรับ OBS 1, ค่าติดตั้งจะเทียบเท่ากับ{} เสียบที่funciton เพื่อคืนความน่าจะเป็นที่สอดคล้องกัน:βage20+βgrade12+βconsnormal()

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

ดังนั้นการเพิ่มอายุหนึ่งหน่วยที่สอดคล้องกับเพิ่มขึ้นในคะแนน z ของความน่าจะเป็นที่จะอยู่ในสหภาพβage

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.