การทดสอบ Wald สำหรับการถดถอยโลจิสติก


55

เท่าที่ฉันเข้าใจการทดสอบ Wald ในบริบทของการถดถอยโลจิสติกใช้ในการพิจารณาว่าตัวแปรตัวทำนายบางตัวมีความสำคัญหรือไม่ มันปฏิเสธสมมติฐานว่างของสัมประสิทธิ์ที่สอดคล้องกันว่าเป็นศูนย์X

การทดสอบประกอบด้วยหารค่าของค่าสัมประสิทธิ์โดยข้อผิดพลาดมาตรฐานσσ

สิ่งที่ฉันสับสนคือเป็นที่รู้จักกันในชื่อ Z-score และระบุว่ามีโอกาสมากน้อยเพียงใดที่การสังเกตที่ได้รับจะเกิดจากการแจกแจงแบบปกติ (โดยมีค่าเฉลี่ยเป็นศูนย์)X/σ



2
บางทีอาจเป็นวิธีอื่นในขณะที่คำตอบในที่นี้มีการพัฒนามากขึ้น
Firebug

คำตอบ:


86

θ^θ0θ^θ0σ

W=(β^β0)se^(β^)N(0,1)
W2=(β^β0)2Var^(β^)χ12
χ12χ22

β0=0

W=β^se^(β^)N(0,1)

zt

ztzptzVar[β^|X]=σ2(XX)1σ2Xσ2σ^2=s2se^(βj^)=s2(XX)jj1tt

YBin(n,p)E(Y)=npVar(Y)=np(1p)ϕϕ=1ϕ<1ϕ>1ztp-values ในRดูที่ทั้งสองตัวอย่าง:

การถดถอยโลจิสติก

mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")

mydata$rank <- factor(mydata$rank)

my.mod <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")

summary(my.mod)

Coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -3.989979   1.139951  -3.500 0.000465 ***
gre          0.002264   0.001094   2.070 0.038465 *  
gpa          0.804038   0.331819   2.423 0.015388 *  
rank2       -0.675443   0.316490  -2.134 0.032829 *  
rank3       -1.340204   0.345306  -3.881 0.000104 ***
rank4       -1.551464   0.417832  -3.713 0.000205 ***
   ---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

(Dispersion parameter for binomial family taken to be 1)

z


การถดถอยเชิงเส้นปกติ (OLS)

summary(lm(Fertility~., data=swiss))

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)      66.91518   10.70604   6.250 1.91e-07 ***
Agriculture      -0.17211    0.07030  -2.448  0.01873 *  
Examination      -0.25801    0.25388  -1.016  0.31546    
Education        -0.87094    0.18303  -4.758 2.43e-05 ***
Catholic          0.10412    0.03526   2.953  0.00519 ** 
Infant.Mortality  1.07705    0.38172   2.822  0.00734 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 7.165 on 41 degrees of freedom

tzt

อีกโพสต์ที่เกี่ยวข้องสามารถพบได้ที่นี่


1
ขอบคุณมากสำหรับโพสต์ที่ดีนี้ซึ่งตอบคำถามของฉันทั้งหมด
user695652

1
ดังนั้นในทางปฏิบัติเกี่ยวกับส่วนแรกของคำตอบที่ยอดเยี่ยมของคุณ: ถ้าด้วยเหตุผลบางอย่างที่ฉันมีในฐานะเอาท์พุทอัตราส่วนอัตราต่อรองและสถิติ Wald ฉันสามารถคำนวณข้อผิดพลาดมาตรฐานจากสิ่งเหล่านี้ได้เช่น: SE = (1 / Wald- สถิติ) * ln (OR) ถูกต้องหรือไม่ ขอบคุณ!
Sander W. van der Laan

1
@ SanderW.vanderLaan ขอบคุณสำหรับความคิดเห็นของคุณ ใช่ฉันเชื่อว่าถูกต้อง หากคุณทำการถดถอยโลจิสติกสถิติของ Wald จะเป็นค่า z
COOLSerdash

2
ช่างเป็นคำตอบที่ยอดเยี่ยมมาก !! ฉันมีข้อเสนอแนะการแก้ไข: โดยส่วนตัวแล้วฉันรู้สึกว่าคำตอบนี้กำลังผสมรายละเอียดกับรายการหมัด ฉันจะใส่รายละเอียดว่าการถดถอยเชิงเส้นใช้ความแปรปรวนของเศษเหลือในกราฟแยกกันอย่างไร
Haitao Du

1
นอกจากนี้สำหรับพารามิเตอร์การกระจายและการเชื่อมต่อกับรหัส R อาจเป็นเราสามารถเปิดส่วนอื่นหรือแยกบรรทัดเพื่อพูดคุยเกี่ยวกับ
Haitao Du
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.