ทำความเข้าใจเกี่ยวกับการทำนายจากการถดถอยโลจิสติก


13

การคาดการณ์ของฉันมาจากแบบจำลองการถดถอยโลจิสติก (glm ใน R) ไม่ได้ล้อมรอบระหว่าง 0 ถึง 1 เหมือนที่ฉันคาดไว้ ความเข้าใจของฉันเกี่ยวกับการถดถอยโลจิสติกคือพารามิเตอร์อินพุตและโมเดลของคุณรวมกันเป็นเส้นตรงและการตอบสนองจะเปลี่ยนเป็นความน่าจะเป็นโดยใช้ฟังก์ชั่นลิงค์ logit เนื่องจากฟังก์ชั่น logit มีขอบเขตระหว่าง 0 ถึง 1 ฉันคาดว่าการคาดการณ์ของฉันจะถูกล้อมรอบระหว่าง 0 ถึง 1

อย่างไรก็ตามนั่นไม่ใช่สิ่งที่ฉันเห็นเมื่อฉันใช้การถดถอยโลจิสติกใน R:

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

ป้อนคำอธิบายรูปภาพที่นี่

หากสิ่งใดผลลัพธ์ของการทำนาย (รุ่น) ดูเป็นเรื่องปกติสำหรับฉัน ใครสามารถอธิบายให้ฉันฟังได้ว่าทำไมค่าที่ฉันได้รับไม่ใช่ความน่าจะเป็น


3
คำตอบของ Corone ด้านล่างครอบคลุมรายละเอียดอย่างมาก ตัวเลขดั้งเดิมที่คุณมีอยู่ด้านบนแสดงค่าล็อก - ค่าบนแกน x ซึ่งสามารถแปลงทางคณิตศาสตร์เป็นความน่าจะเป็น (เช่นตามคำตอบของ Corone โดยการส่งผ่านฟังก์ชันลิงก์)
James Stanley

คำตอบ:


16

predict.glmวิธีโดยค่าเริ่มต้นส่งกลับทำนายโยทำนายเชิงเส้น นั่นคือพวกเขายังไม่ได้ผ่านฟังก์ชั่นลิงค์เลย

ลอง

hist(predict(model, type = "response"))

แทน

ป้อนคำอธิบายรูปภาพที่นี่


4
คุณทำงานได้อย่างยอดเยี่ยมในการควบคุมความสามารถในการมาร์กอัปและภาพประกอบของเราในเวลาอันสั้น: คำตอบนี้เป็นตัวอย่างที่ดี ทำได้ดี!
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.