ทดสอบโมเดล GLM โดยใช้ค่าศูนย์และค่าเบี่ยงเบนของโมเดล


11

ฉันสร้างแบบจำลอง glm ใน R และได้ทำการทดสอบโดยใช้กลุ่มการทดสอบและการฝึกอบรมเพื่อให้มั่นใจว่ามันทำงานได้ดี ผลลัพธ์จาก R คือ:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

ค่า p ทั้งหมดสำหรับสัมประสิทธิ์มีค่าน้อยตามที่คาดไว้

เมื่อดูที่คำถามนี้ (การตีความที่เหลือและค่า Null Deviance ใน GLM R ) ฉันควรจะสามารถคำนวณได้หากสมมติฐานว่างถือโดยใช้สมการต่อไปนี้:

p-value = 1 - pchisq(deviance, degrees of freedom)

การผสานสิ่งนี้ในการให้:

1 - pchisq(256600, 671266)
[1] 1

ดังนั้นฉันถูกต้องในการคิดว่าสมมติฐานว่างเปล่าไม่สามารถปฏิเสธได้ที่นี่แม้ว่าค่า p สำหรับสัมประสิทธิ์ทั้งหมดมีขนาดเล็กมากหรือฉันตีความตีความวิธีการคำนวณนี้ผิดหรือไม่

คำตอบ:


18

มีความเข้าใจผิดที่นี่ ความแตกต่างระหว่างความเบี่ยงเบนว่างและการเบี่ยงเบนของโมเดลนั้นถูกกระจายเป็นไค - สแควร์พร้อมองศาอิสระเท่ากับ null df ลบกับ df ของโมเดล สำหรับแบบจำลองของคุณนั่นก็คือ:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

โดยค่าเริ่มต้นpchisq()ให้สัดส่วนของการกระจายทางด้านซ้ายของค่า เพื่อให้ได้สัดส่วนที่มากกว่าความแตกต่างของคุณคุณสามารถระบุlower.tail = FALSEหรือลบผลที่ได้จาก (ตามที่คุณและฉันได้ทำ) 1


2
คุณกำลังทดสอบสมมติฐานอะไรกับข้อความนั้นอยู่1-pchisq(256600 - 237230, df=(671266 - 671263))?
jII

5
@jesterII คุณกำลังตรวจสอบว่าความเบี่ยงเบนเปลี่ยนไปมากกว่าที่คาดไว้หรือไม่ นั่นคือคุณกำลังทดสอบว่าโมเดลโดยรวมดีกว่าโมเดลโมฆะหรือไม่ มันคล้ายคลึงกับการทดสอบระดับโลกในรูปแบบเชิงเส้น
gung - Reinstate Monica

สมมติฐานว่างคือ 'แบบจำลองโดยรวมดีกว่าแบบจำลองแบบโมฆะ' และคุณปฏิเสธสมมติฐานว่างซึ่งหมายความว่าแบบจำลองนั้นแย่หรือไม่
jII

3
@jesterII ไม่มีสมมติฐานว่างคือ: 'โมเดลโดยรวมไม่ ดีไปกว่าโมเดล null' เนื่องจากสิ่งนี้ถูกปฏิเสธเราจึงสรุปได้ว่าข้อมูลไม่สอดคล้องกับตัวแบบ null หมายเหตุนี่ไม่ได้หมายความว่าแบบจำลองของเราจะดีหรือถูกต้อง
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.