การถดถอยโลจิสติก - ความกังวลหลายฝ่าย / ข้อผิดพลาด


16

ใน Logistic Regression คุณจำเป็นต้องมีความกังวลเกี่ยวกับ multicollinearity เหมือนกับที่คุณต้องการในการถดถอย OLS หรือไม่

ตัวอย่างเช่นเมื่อมีการถดถอยโลจิสติกที่มีความสัมพันธ์หลายสีอยู่คุณจะต้องระมัดระวัง (เช่นเดียวกับใน OLS ถดถอย) ด้วยการอนุมานจากค่าสัมประสิทธิ์เบต้าหรือไม่

สำหรับ OLS regression หนึ่ง "แก้ไข" เพื่อความหลากสีสูงคือการถดถอยสันมีอะไรแบบนั้นสำหรับการถดถอยโลจิสติก? นอกจากนี้การวางตัวแปรหรือการรวมตัวแปร

วิธีใดที่เหมาะสมสำหรับการลดผลกระทบของความหลากสีในการถดถอยโลจิสติก พวกมันเหมือนกับ OLS หรือเปล่า?

(หมายเหตุ: นี่ไม่ได้มีวัตถุประสงค์เพื่อการทดสอบที่ออกแบบมา)

คำตอบ:


16

หลักการเดียวกันทั้งหมดที่เกี่ยวข้องกับความสัมพันธ์อันหลากหลายนั้นใช้กับการถดถอยโลจิสติกเช่นเดียวกับ OLS สามารถใช้การวินิจฉัยเดียวกันที่ประเมินความหลากหลายทางสัณฐานวิทยา (เช่น VIF, หมายเลขเงื่อนไข, การถดถอยเชิงเสริม) และเทคนิคการลดขนาดเดียวกันสามารถนำมาใช้ได้ (เช่นการรวมตัวแปรผ่านการวิเคราะห์องค์ประกอบหลัก)

คำตอบนี้โดย chl ​​จะนำคุณไปสู่แหล่งข้อมูลและแพ็คเกจ R สำหรับการปรับตัวแบบลอจิสติกที่ถูกลงโทษ (เช่นเดียวกับการสนทนาที่ดีเกี่ยวกับขั้นตอนการลงโทษแบบลงโทษเหล่านี้) แต่ความคิดเห็นของคุณบางส่วนเกี่ยวกับ "วิธีแก้ปัญหา" ต่อความหลากหลายทางชีวภาพนั้นค่อนข้างน่ารำคาญสำหรับฉัน หากคุณสนใจเพียงแค่การประเมินความสัมพันธ์ของตัวแปรที่ไม่ใช่ collinear "การแก้ปัญหา" เหล่านี้อาจใช้ได้ แต่ถ้าคุณสนใจที่จะประเมินค่าสัมประสิทธิ์ของตัวแปรที่เป็นแบบ collinear เทคนิคเหล่านี้ไม่สามารถแก้ปัญหาของคุณได้ แม้ว่าปัญหาของ multicollinearity เป็นเทคนิคในการที่เมทริกซ์ของตัวแปรทำนายไม่สามารถคว่ำ แต่มันมีตรรกะแบบอะนาล็อกในการทำนายของคุณไม่เป็นอิสระและผลกระทบของพวกเขาไม่สามารถระบุได้โดยเฉพาะ


2
(+1) ใช่มีอยู่บางรุ่นลงโทษของการถดถอยโลจิสติก (หรือมากกว่าโดยทั่วไป GLMs) ดูแหล่งอ้างอิงบางอย่างมี: stats.stackexchange.com/questions/4272/...
chl

@chl ขอบคุณ ฉันได้อัปเดตเพื่อเชื่อมโยงกับคำตอบก่อนหน้าของคุณ
Andy W

ขอบคุณเช่นกัน นี่เป็นเพียงความคิดเห็นเกี่ยวกับการตอบสนองที่ยอดเยี่ยมของคุณ
chl
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.