ฉันใช้การถดถอยโลจิสติกแบบทวินามเพื่อระบุว่าการสัมผัสhas_x
หรือhas_y
ส่งผลกระทบต่อโอกาสที่ผู้ใช้จะคลิกบนบางสิ่ง โมเดลของฉันมีดังต่อไปนี้:
fit = glm(formula = has_clicked ~ has_x + has_y,
data=df,
family = binomial())
นี่คือผลลัพธ์จากรุ่นของฉัน:
Call:
glm(formula = has_clicked ~ has_x + has_y,
family = binomial(), data = active_domains)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.9869 -0.9719 -0.9500 1.3979 1.4233
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.504737 0.008847 -57.050 < 2e-16 ***
has_xTRUE -0.056986 0.010201 -5.586 2.32e-08 ***
has_yTRUE 0.038579 0.010202 3.781 0.000156 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 217119 on 164182 degrees of freedom
Residual deviance: 217074 on 164180 degrees of freedom
AIC: 217080
Number of Fisher Scoring iterations: 4
เนื่องจากสัมประสิทธิ์แต่ละอย่างมีความสำคัญการใช้แบบจำลองนี้ฉันสามารถบอกได้ว่ามูลค่าของชุดค่าผสมใด ๆ เหล่านี้ใช้วิธีการต่อไปนี้:
predict(fit, data.frame(has_x = T, has_y=T), type = "response")
ฉันไม่เข้าใจว่าฉันสามารถรายงานเกี่ยวกับ Std ได้อย่างไร ข้อผิดพลาดของการทำนาย
ฉันต้องใช้หรือไม่ หรือฉันต้องการแปลง S Eโดยใช้วิธีการที่อธิบายไว้ที่นี่ ?
หากฉันต้องการเข้าใจข้อผิดพลาดมาตรฐานสำหรับตัวแปรทั้งสองฉันจะพิจารณาได้อย่างไร
ต่างจากคำถามนี้ฉันสนใจที่จะเข้าใจว่าข้อผิดพลาดส่วนบนและล่างเป็นเปอร์เซ็นต์ ยกตัวอย่างเช่นการแสดงการคาดการณ์ของฉันมีค่า 37% สำหรับTrue,True
ผมสามารถคำนวณได้ว่านี่คือสำหรับ95 % C ฉัน ? (เลือก 0.3% เพื่ออธิบายจุดของฉัน)