จาก exp (สัมประสิทธิ์) ถึงอัตราต่อรองและการตีความใน Logistic Regression พร้อมปัจจัย


14

ฉันใช้การถดถอยเชิงเส้นตรงของการยอมรับเข้าเรียนในวิทยาลัยกับคะแนน SAT และภูมิหลังของครอบครัว / ชาติพันธุ์ ข้อมูลเป็นตัวละคร นี่คือการติดตามคำถามก่อนหน้านี้ตอบแล้ว คำถามที่มุ่งเน้นในการรวบรวมและการตีความอัตราส่วนอัตราต่อรองเมื่อออกจาก SAT คะแนนกันเพื่อความเรียบง่าย

ตัวแปรคือAccepted(0 หรือ 1) และBackground("red" หรือ "blue") ฉันตั้งค่าข้อมูลเพื่อให้ผู้คนในพื้นหลัง "สีแดง" มีแนวโน้มที่จะเข้าไป:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))

                        Odds_Ratio_RedvBlue             2.5 %       97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

คำถาม:

  1. 0.7 เป็นอัตราส่วนที่ผิดปกติของบุคคลที่มีพื้นหลังเป็น "สีน้ำเงิน" หรือไม่? ฉันถามสิ่งนี้เพราะฉันได้รับ 0.7 " Backgroundblue" ถ้าฉันเรียกใช้รหัสต่อไปนี้แทน:

    fit <- glm(Accepted~Background-1, data=dat, family="binomial")
    exp(cbind(OR=coef(fit), confint(fit)))
  2. Aอีพีเสื้ออีd/Rอีd:Aอีพีเสื้ออีd/Bล.ยูอีOddsBล.ยูอี=1/OddsRอีd


1
สิ่งที่Rเรียกสัมประสิทธิ์ (ผ่านฟังก์ชั่นcoef) อย่างชัดเจนว่าคุณกำลังเรียก "อัตราส่วนอัตราต่อรอง" ในการส่งออกของคุณ ที่แนะนำคุณอาจต้องการตรวจสอบความแตกต่างระหว่างทั้งสอง
whuber

ฉันอ่านโพสต์บนไฮเปอร์ลิงก์ของคุณแล้ว
Antoni Parellada

สัมประสิทธิ์มีการยกกำลัง: exp (coef (พอดี))
Antoni Parellada

ใช่: และตามที่อธิบายไว้ในคำตอบของฉันในเธรดนั้นการยกกำลังของการดักจับนั้นให้โอกาสของคดีอ้างอิง
whuber

คำตอบ:


13

ฉันทำงานเพื่อตอบคำถามของฉันโดยการคำนวณอัตราต่อรองและอัตราต่อรองด้วยตนเอง:

Acceptance   blue            red            Grand Total
0            158             102                260
1            112             177                289
Total        270             279                549

ดังนั้นอัตราต่อรองของการเข้าโรงเรียน Red over Blue คือ:

Odds Aอีพีเสื้อ ผม RอีdOdds Aอีพีเสื้อ ผม Bล.ยูอี=177/102112/158=1.73530.7089=2.448

และนี่คือการBackgroundredกลับมาของ:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))

                      Odds_and_OR                         2.5 %      97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

(Intercept)112/158=0.7089

ถ้าเป็นเช่นนั้นฉันจะเรียกใช้:

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))

                        Odds            2.5 %      97.5 %
Backgroundblue     0.7088608        0.5553459   0.9017961
Backgroundred      1.7352941        1.3632702   2.2206569

ผลตอบแทนที่ได้คืออัตราต่อรองที่แท้จริงของการเป็น 'สีน้ำเงิน': Backgroundblue(0.7089) และโอกาสที่จะได้รับการยอมรับว่าเป็น "สีแดง": Backgroundred(1.7353) ไม่มีอัตราต่อรองที่นั่น ดังนั้นค่าที่ส่งคืนทั้งสองจึงไม่คาดว่าจะเป็นกลับกัน

ในที่สุดวิธีการอ่านผลหากมี 3 ปัจจัยใน regressor เด็ดขาด?

คู่มือเดียวกันกับการคำนวณ [R]:

ฉันสร้างชุดข้อมูลปลอมที่แตกต่างกันโดยใช้หลักฐานเดียวกัน แต่คราวนี้มีภูมิหลังทางชาติพันธุ์สามแบบ: "สีแดง", "สีฟ้า" และ "สีส้ม" และวิ่งตามลำดับเดียวกัน:

อันดับแรกตารางฉุกเฉิน:

Acceptance  blue    orange  red   Total
0             86        65  130     281
1             64        42  162     268
Total        150       107  292     549

และคำนวณอัตราต่อรองในการเข้ากลุ่มชาติพันธุ์แต่ละกลุ่ม:

  • ราคาต่อรองยอมรับถ้าสีแดง = 1.246154;
  • ราคาต่อรองยอมรับถ้าฟ้า = 0.744186;
  • ราคาต่อรองยอมรับถ้าสีส้ม = 0.646154

เช่นเดียวกับอัตราส่วนราคาต่อรองที่แตกต่างกัน:

  • OR red v blue = 1.674519;
  • OR red v orange = 1.928571;
  • หรือ blue v red = 0.597186;
  • OR blue v orange = 1.151717;
  • หรือ orange v red = 0.518519; และ
  • OR orange v blue = 0.868269

และดำเนินการกับการถดถอยโลจิสติกประจำวันตามด้วยการยกกำลังของสัมประสิทธิ์:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))

                      ODDS     2.5 %   97.5 %
(Intercept)      0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred    1.6745192 1.1271430 2.497853

ผลผลิตอัตราต่อรองในการได้รับในสำหรับ "บลูส์" เป็น(Intercept)และราคาต่อรองอัตราส่วนของสีส้มกับสีฟ้าและสีแดงหรือของโวลต์สีฟ้าBackgroundorangeBackgroundred

ในทางกลับกันการถดถอยที่ไม่มีการสกัดกั้นนั้นคาดว่าจะส่งกลับเพียงสามโอกาสเท่านั้น :

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))

                      ODDS     2.5 %    97.5 %
Backgroundblue   0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred    1.2461538 0.9900426 1.5715814

ขอแสดงความยินดีคุณทำได้ดีมากในการหาสิ่งนี้
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.