การตีความการถดถอยโลจิสติกอันดับ


17

ฉันใช้การถดถอยโลจิสติกอันดับนี้ใน R:

mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)

ฉันได้รับข้อมูลสรุปของโมเดลนี้:

summary(mtcars_ordinal)

Re-fitting to get Hessian

Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)

Coefficients:
      Value Std. Error t value
mpg -0.2335    0.06855  -3.406

Intercepts:
    Value   Std. Error t value
1|2 -6.4706  1.6443    -3.9352
2|3 -4.4158  1.3634    -3.2388
3|4 -3.8508  1.3087    -2.9425
4|6 -1.2829  1.3254    -0.9679
6|8 -0.5544  1.5018    -0.3692

Residual Deviance: 81.36633 
AIC: 93.36633 

ฉันจะได้รับอัตราต่อรองของค่าสัมประสิทธิ์mpgเช่นนี้

exp(coef(mtcars_ordinal))
 mpg 
0.7917679 

และอัตราต่อรองของเกณฑ์เช่น:

exp(mtcars_ordinal$zeta)

       1|2         2|3         3|4         4|6         6|8 
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353 

มีคนบอกฉันได้ไหมว่าการตีความแบบจำลองนี้ถูกต้อง

เมื่อmpgเพิ่มขึ้นหนึ่งหน่วยอัตราต่อรองของการย้ายจากหมวด 1 ของcarbไปยังหมวดอื่น ๆ 5 หมวดหมู่ลดลง -0.23 หากราคาต่อรองล็อกข้ามเกณฑ์ของ 0.0015 แล้วค่าคาดการณ์ไว้สำหรับรถจะเป็นประเภทที่ 2 carbของ หากอัตราต่อรองผ่านเกณฑ์ที่ 0.0121 ค่าที่คาดการณ์สำหรับรถยนต์จะเป็นประเภทที่ 3 ของcarbและอื่น ๆ

คำตอบ:


10

คุณมีอัตราต่อรองที่สับสนอย่างสมบูรณ์และราคาต่อรอง อัตราต่อรองเข้าสู่ระบบเป็นค่าสัมประสิทธิ์; อัตราต่อรองเป็นค่าสัมประสิทธิ์เลขยกกำลัง นอกจากนี้การตีความการต่อรองไปรอบวิธีอื่น(ฉันเติบโตขึ้นมาพร้อมกับเศรษฐมิติที่คิดเกี่ยวกับตัวแปรที่ จำกัด และการตีความอัตราต่อรองของการถดถอยอันดับคือ ... เอ่อ ... สนุกกับฉัน) ดังนั้นคำแถลงแรกของคุณควรอ่านว่า" mpg เพิ่มขึ้นทีละหน่วย ของการสังเกตหมวดที่ 1 ของ carb เมื่อเทียบกับ 5 หมวดหมู่อื่นเพิ่มขึ้น 21% "

เท่าที่การตีความของธรณีประตูยังคงดำเนินอยู่คุณต้องวางแผนโค้งทั้งหมดที่คาดการณ์ไว้เพื่อที่จะสามารถพูดได้ว่าคำทำนายนั้นเป็นอย่างไร:

mpg   <- seq(from=5, to=40, by=1)
xbeta <- mpg*(-0.2335)
logistic_cdf <- function(x) {
  return( 1/(1+exp(-x) ) )
}

p1 <- logistic_cdf( -6.4706 - xbeta )
p2 <- logistic_cdf( -4.4158 - xbeta ) - logistic_cdf( -6.4706 - xbeta )
p3 <- logistic_cdf( -3.8508 - xbeta ) - logistic_cdf( -4.4158 - xbeta )
p4 <- logistic_cdf( -1.2829 - xbeta ) - logistic_cdf( -3.8508 - xbeta )
p6 <- logistic_cdf( -0.5544 - xbeta ) - logistic_cdf( -1.2829 - xbeta )
p8 <- 1 - logistic_cdf( -0.5544 - xbeta )

plot(mpg, p1, type='l', ylab='Prob')
  lines(mpg, p2, col='red')
  lines(mpg, p3, col='blue')
  lines(mpg, p4, col='green')
  lines(mpg, p6, col='purple')
  lines(mpg, p8, col='brown')
  legend("topleft", lty=1, col=c("black", "red", "blue", "green", "purple", "brown"), 
         legend=c("carb 1", "carb 2", "carb 3", "carb 4", "carb 5", "carb 6"))

ป้อนคำอธิบายรูปภาพที่นี่

เส้นโค้งสีน้ำเงินสำหรับประเภทที่ 3 ไม่เคยหยิบขึ้นมาและไม่มีเส้นโค้งสีม่วงสำหรับประเภทที่ 6 ดังนั้นหากมีสิ่งใดที่ฉันอยากจะบอกว่าสำหรับค่าที่mpgสูงกว่า 27 มีประเภทที่น่าจะเป็นมากที่สุดคือ 1; ระหว่างวันที่ 18 ถึง 27 หมวดหมู่ 2; ระหว่าง 4 ถึง 18 หมวดหมู่ 4; และต่ำกว่า 4 ประเภท 8 (ฉันสงสัยว่าคุณกำลังศึกษาอะไรอยู่ - รถบรรทุกเพื่อการพาณิชย์? รถยนต์นั่งส่วนใหญ่ในปัจจุบันควรมี mpg> 25) คุณอาจต้องการลองกำหนดจุดตัดให้แม่นยำยิ่งขึ้น

ฉันยังสังเกตเห็นว่าคุณมีหมวดหมู่แปลก ๆ เหล่านี้ที่มี 1, 2, 3, 4, 6 และ 6 (ข้าม 5) และ 8 (ข้าม 7) หาก 5 และ 7 ขาดหายไปจากการออกแบบก็ไม่เป็นไร หากสิ่งเหล่านี้เป็นหมวดหมู่ที่ถูกต้องที่carbไม่ได้ตกอยู่ในสภาพที่ไม่ดี


สังเกตว่าฉันใช้ "การย้ายจากหมวด 1 ของคาร์โบไฮเดรตไปยัง 5 หมวดหมู่อื่น ๆ " ได้อย่างไร มันผิดหรือเปล่า? ฉันพยายามที่จะจับกับ "เมื่อ MPG เพิ่มขึ้นหนึ่งหน่วยอัตราต่อรองของการสังเกตหมวด 1 ของคาร์โบไฮเดรตเทียบกับ 5 หมวดหมู่เพิ่มขึ้น 21%" นี่ก็หมายความว่าหาก mpg เพิ่มขึ้นประมาณ 5 หน่วยจะมีโอกาส 100% ในการสังเกตหมวด 1 แต่ถ้า mpg เพิ่มขึ้น 5 หน่วยควรมีโอกาสสูงกว่าในการสังเกตหมวด 8 ไม่ใช่หมวด 1
luciano

3
ฉันเพิ่มรูป; ฉันสงสัยว่ามันจะทำให้คำตอบของคุณง่ายต่อการตีความ - หวังว่าคุณจะชอบมัน (BTW เอกสารสำหรับ? mtcarsกล่าวว่าข้อมูลดังกล่าวเป็นผลการทดสอบจากMotor Trendsฉบับปี 1974 )
gung - Reinstate Monica

ใครช่วยกรุณาตอบคำถามสุดท้ายของ luciano? ฉันคิดว่านี่น่าสนใจมาก
Erosennin

1
mpg23134515

1
ตามที่polrกำหนดรูปแบบว่าlogit P(Y <= k | x) = zeta_k - etaหากการตีความของ @ StasK ไม่ได้อ่าน"เมื่อ mpg เพิ่มขึ้นหนึ่งหน่วยอัตราเดิมพันของการสังเกตหมวดที่ 1 ของ carb vs. 5 หมวดอื่น ๆ เพิ่มขึ้น26% ( exp(-(-0.2335)) = 1.26)
moremo

3

ในรูปแบบ logit ที่สั่งอัตราต่อรองจะสร้างอัตราส่วนของความน่าจะเป็นที่อยู่ในหมวดหมู่ใด ๆ ที่ต่ำกว่าขีด จำกัด ที่เฉพาะเจาะจงเทียบกับความน่าจะเป็นที่อยู่ในหมวดหมู่เหนือขีด จำกัด เดียวกัน (เช่นด้วยสามหมวดหมู่: ความน่าจะเป็น . C รวมถึงความน่าจะเป็นที่จะอยู่ในหมวดหมู่ A กับ B หรือ C)

นำไปสู่รูปแบบนี้ตามที่ระบุในรายละเอียดของlogit P(Y <= k | x) = zeta_k - eta polr()ดังนั้นอัตราต่อรองสามารถสร้างได้สำหรับประเภทที่แตกต่างกันหรือสำหรับ regressors ที่แตกต่างกัน หลังยิ่งพบบ่อยเปรียบเทียบอัตราต่อรองสำหรับประเภทเดียวกัน แต่ regressors และเท่ากับต่างกัน

โอdds(Yak|xa)โอdds(Yk|x) = ประสบการณ์(-(ηa-η)).

อัตราส่วนอัตราต่อรองสำหรับประเภทที่แตกต่างกันถูกกำหนด

โอdds(Yผมk|xผม)โอdds(Yผมม.|xผม) = ประสบการณ์(ζk-ζม.),

โดยอัตราส่วนจะเป็นอิสระจาก regressors คุณสมบัตินี้นำไปสู่รูปแบบอัตราต่อรองชื่อที่เป็นทางเลือก

ในตัวอย่างง่ายๆนี้ แต่อาจจะไม่ง่ายนักคุณสามารถกำหนด: สำหรับการเพิ่มหนึ่งหน่วยใน regressor mpgโอกาสของการสังเกตหมวดที่ 1 เทียบกับการสังเกตหมวดหมู่ที่สูงกว่าใด ๆ (หรือโอกาสของการสังเกตหมวดหมู่ใด ๆ การสังเกตหมวดหมู่ใด ๆ ที่สูงกว่าเกณฑ์เดียวกัน) จะถูกคูณด้วย 1.26 หรือเพิ่มขึ้น 26% ( exp(-(-0.233 - 0)) = 1.263) หากคุณต้องการที่จะกำหนดอัตราส่วนราคาต่อรองของประเภทที่แตกต่างกันคุณสามารถเช่นบอกว่าอัตราต่อรองของการอยู่ในหมวดหมู่ที่ 1 กับหมวดหมู่ใด ๆ ดังกล่าวข้างต้นเมื่อเทียบกับอัตราต่อรองของการอยู่ในประเภทที่ 1 หรือ 2 เทียบกับหมวดหมู่ใด ๆ exp((-6.470) - (-4.415)) = 0.128ดังกล่าวข้างต้นเท่ากับที่ โดยที่การตีความหลังไม่เป็นประโยชน์ในการตั้งค่านี้โดยเฉพาะ ตัวอย่างของอัตราส่วนอัตราต่อรองสำหรับประเภทที่แตกต่างกันอาจเป็นอัตราต่อรองของการไปเรียนเมื่อเทียบกับอัตราต่อรองของการไปโรงเรียนมัธยม

(ζk-ζk-1)k

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.