การตีความเอาต์พุตการถดถอยโลจิสติกใน R


13

ผมทำงานในการถดถอยโลจิสติกในหลาย R glmโดยใช้ ตัวแปรทำนายนั้นต่อเนื่องและจัดหมวดหมู่ แยกข้อมูลสรุปของแบบจำลองแสดงดังต่อไปนี้:

Coefficients:
               Estimate Std. Error z value Pr(>|z|)
(Intercept)   2.451e+00  2.439e+00   1.005   0.3150
Age           5.747e-02  3.466e-02   1.658   0.0973 .
BMI          -7.750e-02  7.090e-02  -1.093   0.2743
...
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

ช่วงความเชื่อมั่น:

                  2.5 %       97.5 %
(Intercept)  0.10969506 1.863217e+03
Age          0.99565783 1.142627e+00
BMI          0.80089276 1.064256e+00
...

อัตราส่วนคี่:

                 Estimate Std. Error   z value Pr(>|z|)
(Intercept)  1.159642e+01  11.464683 2.7310435 1.370327
Age          1.059155e+00   1.035269 5.2491658 1.102195
B            9.254228e-01   1.073477 0.3351730 1.315670
...

AgeAgeAgeAge


8
เป็นสิ่งสำคัญที่ระดับความเชื่อมั่น 10% เท่านั้น แต่ช่วงความเชื่อมั่นอยู่ที่ 5%
Nick Sabbe

ดังนั้นช่วงความมั่นใจ 10% จะไม่รวม 1 แล้ว?
SabreWolfy

p-value (ตารางแรกคอลัมน์สุดท้าย) คือโอกาสที่ผลลัพธ์ที่ได้รับหรือแย่กว่านั้นจะบรรลุได้หากสมมติฐานว่างเป็นจริง ช่วงความมั่นใจคือ / ภูมิภาคที่จะเก็บค่าที่แท้จริงในเช่น 95% ของเวลา ถ้ามันไม่ได้เก็บค่าจริงที่ตั้งสมมติฐานนั้นมีโอกาสมากที่สุด 5% ที่เราจะได้รับผลลัพธ์ที่ได้หรือแย่ลงถ้าสมมติฐานนั้นเป็นจริง ดังนั้นนี่จะหมายความว่าค่า p ของคุณต่ำกว่า 5% มีความสัมพันธ์อย่างใกล้ชิดระหว่างค่า p กับช่วงความมั่นใจ (สถิติ 101) แต่ในระยะสั้น: ใช่ CI สำหรับ 10% จะรวมถึง 1
Nick Sabbe

ดูเหมือนว่าคุณกำลังสมมติว่าเป็นเส้นตรง นั่นเป็นวิธีที่ชอบธรรม?
Frank Harrell

คำตอบ:


8

มีโฮสต์ของคำถามที่นี่ในเว็บไซต์ที่จะช่วยในการตีความผลลัพธ์ของแบบจำลอง (นี่คือสามตัวอย่างที่แตกต่างกัน1 2 3และฉันแน่ใจว่ามีมากขึ้นถ้าคุณขุดผ่านที่เก็บถาวร) ที่นี่ยังมีการสอนเกี่ยวกับ เว็บไซต์สถิติของUCLAเกี่ยวกับวิธีการตีความค่าสัมประสิทธิ์สำหรับการถดถอยโลจิสติก

แม้ว่าอัตราต่อรองสำหรับค่าสัมประสิทธิ์อายุใกล้เคียงกับค่ามันไม่จำเป็นต้องหมายถึงผลกระทบที่มีขนาดเล็ก (ไม่ว่าจะเป็นผลกระทบที่มีขนาดเล็กหรือใหญ่มักจะเป็นคำถามเชิงบรรทัดฐานเท่าที่มันเป็นเชิงประจักษ์) เราจะต้องรู้ถึงความผันแปรทั่วไปของอายุระหว่างการสังเกตเพื่อให้ความเห็นที่มีข้อมูลมากขึ้น


ขอบคุณสำหรับลิงค์ไปยังบทช่วยสอนซึ่งมีลักษณะครอบคลุม ฉันค้นหาที่นี่ก่อนโพสต์คำถามของฉัน ลิงก์ 1 และ 3 ดูเหมือนจะไม่เกี่ยวข้องกับคำถามของฉัน
SabreWolfy

@ SabreWolfy ลิงก์ 1 อธิบายเพิ่มเติมเกี่ยวกับวิธีตีความค่าสัมประสิทธิ์ในหน่วยดั้งเดิมลิงค์ 3 อธิบายขั้นตอนในการตีความผลกระทบในแง่ของความน่าจะเป็น (ซึ่งใช้ได้จริงกับคำถามของคุณและแผนการที่แนะนำในคำถามนั้นคือ การตอบสนองที่สมเหตุสมผลกับฉันโดยบอกว่าขนาดของผลกระทบโดยตรงนั้นยากที่จะตีความโดยไม่ทราบว่าการเปลี่ยนแปลงในอายุ)
Andy W

5
(1.059301)×100%=458%

ลิงก์ UCLA นั้นตายแล้ว แต่สิ่งนี้อาจสอดคล้อง (อย่างน้อยเนื้อหาจะช่วยให้ฉันเข้าใจคำถามนี้)
MBR
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.