เรียนคุณทุกคน - ฉันสังเกตเห็นบางสิ่งแปลก ๆ ที่ไม่สามารถอธิบายได้ไหม โดยสรุป: แนวทางแบบแมนนวลเพื่อคำนวณช่วงความมั่นใจในโมเดลการถดถอยโลจิสติกและฟังก์ชัน R confint()
ให้ผลลัพธ์ที่แตกต่างกัน
ฉันเคยผ่านการถดถอยโลจิสติกประยุกต์ของ Hosmer & Lemeshow แล้ว (ฉบับที่ 2) ในบทที่ 3 มีตัวอย่างของการคำนวณอัตราส่วนอัตราต่อรองและช่วงความมั่นใจ 95% ด้วย R ฉันสามารถสร้างโมเดลได้อย่างง่ายดาย:
Call:
glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial")
Deviance Residuals:
Min 1Q Median 3Q Max
-1.734 -0.847 -0.847 0.709 1.549
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.8408 0.2551 -3.296 0.00098 ***
as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 136.66 on 99 degrees of freedom
Residual deviance: 117.96 on 98 degrees of freedom
AIC: 121.96
Number of Fisher Scoring iterations: 4
อย่างไรก็ตามเมื่อฉันคำนวณช่วงความเชื่อมั่นของพารามิเตอร์ฉันได้รับช่วงเวลาที่แตกต่างจากช่วงเวลาที่กำหนดในข้อความ:
> exp(confint(model))
Waiting for profiling to be done...
2.5 % 97.5 %
(Intercept) 0.2566283 0.7013384
as.factor(dataset$dich.age)1 3.0293727 24.7013080
Hosmer & Lemeshow แนะนำสูตรต่อไปนี้:
และพวกเขาคำนวณช่วงความมั่นใจสำหรับas.factor(dataset$dich.age)1
การเป็น (2.9, 22.9)
ดูเหมือนจะตรงไปตรงมาที่จะทำใน R:
# upper CI for beta
exp(summary(model)$coefficients[2,1]+1.96*summary(model)$coefficients[2,2])
# lower CI for beta
exp(summary(model)$coefficients[2,1]-1.96*summary(model)$coefficients[2,2])
ให้คำตอบเดียวกับหนังสือ
อย่างไรก็ตามความคิดใด ๆ เกี่ยวกับสาเหตุที่confint()
ดูเหมือนจะให้ผลลัพธ์ที่แตกต่างกันอย่างไร ฉันเห็นตัวอย่างของผู้ใช้จำนวนconfint()
มาก