การเขียนของ Christopher Manning เกี่ยวกับการถดถอยโลจิสติกใน Rแสดงการถดถอยโลจิสติกใน R ดังนี้:
ced.logr <- glm(ced.del ~ cat + follows + factor(class),
family=binomial)
เอาท์พุทบาง:
> summary(ced.logr)
Call:
glm(formula = ced.del ~ cat + follows + factor(class),
family = binomial("logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-3.24384 -1.34325 0.04954 1.01488 6.40094
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.31827 0.12221 -10.787 < 2e-16
catd -0.16931 0.10032 -1.688 0.091459
catm 0.17858 0.08952 1.995 0.046053
catn 0.66672 0.09651 6.908 4.91e-12
catv -0.76754 0.21844 -3.514 0.000442
followsP 0.95255 0.07400 12.872 < 2e-16
followsV 0.53408 0.05660 9.436 < 2e-16
factor(class)2 1.27045 0.10320 12.310 < 2e-16
factor(class)3 1.04805 0.10355 10.122 < 2e-16
factor(class)4 1.37425 0.10155 13.532 < 2e-16
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 958.66 on 51 degrees of freedom
Residual deviance: 198.63 on 42 degrees of freedom
AIC: 446.10
Number of Fisher Scoring iterations: 4
จากนั้นเขาจะพูดถึงรายละเอียดเกี่ยวกับวิธีตีความค่าสัมประสิทธิ์เปรียบเทียบแบบจำลองต่างๆและอื่น ๆ มีประโยชน์มากทีเดียว
อย่างไรก็ตามโมเดลมีความแปรปรวนเท่าไร หน้า Stata ในการถดถอยโลจิสติกพูดว่า:
ในทางเทคนิคแล้วไม่สามารถคำนวณแบบเดียวกับการถดถอยโลจิสติกได้เช่นเดียวกับในการถดถอย OLS pseudo-ในการถดถอยโลจิสติกถูกกำหนดเป็นโดยที่แสดงถึงโอกาสในการบันทึกสำหรับโมเดล "ค่าคงที่เท่านั้น" และเป็นโอกาสในการบันทึกสำหรับแบบจำลองเต็มรูปแบบด้วย ค่าคงที่และตัวทำนายR 2 1 - L 1 L0L1
ฉันเข้าใจสิ่งนี้ในระดับสูง แบบจำลองค่าคงที่เท่านั้นจะไม่มีพารามิเตอร์ใด ๆ (เฉพาะคำดักจับ) ความน่าจะเป็นบันทึกคือการวัดความใกล้ชิดของพารามิเตอร์ที่เหมาะสมกับข้อมูล ในความเป็นจริง Manning เรียงลำดับของคำแนะนำที่เบี่ยงเบนอาจจะL บางทีความเบี่ยงเบนเป็นโมฆะเป็นแบบคงที่เท่านั้นและส่วนเบี่ยงเบนเหลืออยู่คือของโมเดล? อย่างไรก็ตามฉันไม่ได้ใสกับมัน- 2 บันทึกL
ใครสามารถตรวจสอบวิธีการคำนวณหลอกจริงในโดยใช้ตัวอย่างนี้