ตัวพยากรณ์ที่สำคัญไม่ได้มีนัยสำคัญในการถดถอยหลายครั้ง


11

เมื่อฉันวิเคราะห์ตัวแปรของฉันในแบบจำลองการถดถอยโลจิสติกสองแบบที่แยกกัน

Predictor 1:    B= 1.049,    SE=.352,    Exp(B)=2.85,    95% CI=(1.43, 5.69),    p=.003
   Constant:    B=-0.434,    SE=.217,    Exp(B)=0.65,                            p=.046

Predictor 2:    B= 1.379,    SE=.386,    Exp(B)=3.97,    95% CI=(1.86, 8.47),    p<.001
   Constant:    B=-0.447,    SE=.205,    Exp(B)=0.64,                            p=.029

แต่เมื่อฉันป้อนลงในโมเดลการถดถอยโลจิสติกหลายรายการเดียวฉันจะได้รับ:

Predictor 1:    B= 0.556,    SE=.406,    Exp(B)=1.74,    95% CI=(0.79, 3.86),    p=.171
Predictor 2:    B= 1.094,    SE=.436,    Exp(B)=2.99,    95% CI=(1.27, 7.02),    p=.012
   Constant:    B=-0.574,    SE=.227,    Exp(B)=0.56,                            p=.012

ตัวทำนายทั้งสองเป็นแบบแยกส่วน (เด็ดขาด) ฉันได้ตรวจสอบความหลากสีแล้ว

ฉันไม่แน่ใจว่าฉันได้รับข้อมูลเพียงพอหรือไม่ แต่ฉันไม่เข้าใจว่าเหตุใดตัวทำนาย 1 จึงไม่สำคัญและไม่สำคัญและทำไมอัตราต่อรองจึงแตกต่างกันในรูปแบบการถดถอยหลายแบบ ทุกคนสามารถให้คำอธิบายเบื้องต้นเกี่ยวกับสิ่งที่เกิดขึ้นได้หรือไม่?


2
หลายตัวแปรมักจะระบุตัวแปรตามหลายตัว - คุณหมายถึงตัวทำนายหลายตัวใช่ไหม ซึ่งโดยปกติจะเรียกว่าการถดถอยหลายครั้ง
มาโคร

1
นอกจากนี้จากแบบจำลองการถดถอยโลจิสติกที่แตกต่างกันมักจะไม่สามารถเทียบเคียงได้ นี่เป็นเพราะมาตราส่วนมีการเปลี่ยนแปลง - นี่เป็นปัญหาที่ละเอียดอ่อน แต่แนวคิดพื้นฐานคือความแปรปรวนทั้งหมด (ในระดับแฝงที่การถดถอยโลจิสติกเกิดขึ้นตามธรรมชาติ - ดูen.wikipedia.org/wiki/ … ) ไม่ได้ถูกแก้ไขในทุกรุ่น ดังนั้นคุณไม่ควรคาดหวังว่าสัมประสิทธิ์จะเหมือนกันในทุกรุ่นแม้ว่าจะไม่จำเป็นต้องอธิบายการเปลี่ยนแปลงในนัยสำคัญทางสถิติ คุณตรวจสอบการพึ่งพาระหว่างตัวทำนายสองตัวอย่างไร β
มาโคร

อ้าโอเคขอบคุณ ฉันตรวจสอบการวินิจฉัย collinearity ผ่านการถดถอยเชิงเส้นใน spss & ตรวจสอบความอดทนและ VIF - สิ่งนี้ถูกต้องหรือไม่
Annie

Nice comment @Macro ฉันจำการอ่านเกี่ยวกับวิธีการแก้ไขปัญหานี้เกี่ยวกับเครื่องชั่ง แต่ฉันจำไม่ได้ว่าอยู่ที่ไหน
Peter Flom

1
@PeterFlom สิ่งหนึ่งที่คุณทำได้คือการปรับสเกลสัมประสิทธิ์ด้วยความแปรปรวนของตัวทำนายแบบเชิงเส้น (บวกความแปรปรวนของการแจกแจงแบบโลจิสติกมาตรฐาน) - นี่ทำให้พวกมันอยู่ในระดับเดียวกัน แน่นอนว่าพวกเขาไม่สามารถตีความได้ว่าเป็นอัตราต่อรองเมื่อคุณทำเช่นนี้ π2/3
มาโคร

คำตอบ:


20

มีเหตุผลหลายประการ (ไม่มีสิ่งใดที่เกี่ยวข้องกับการถดถอยแบบโลจิสติกส์โดยเฉพาะ แต่อาจเกิดขึ้นในการถดถอยใด ๆ )

  1. การสูญเสียองศาอิสระ: เมื่อพยายามประเมินพารามิเตอร์เพิ่มเติมจากชุดข้อมูลที่ระบุคุณกำลังถามอย่างมีประสิทธิภาพมากขึ้นซึ่งค่าใช้จ่ายมีความแม่นยำจึงนำไปสู่สถิติค่า t ที่ต่ำลงดังนั้นค่า p ที่สูงขึ้น
  2. ความสัมพันธ์ของ Regressors: Regressors ของคุณอาจเกี่ยวข้องซึ่งกันและกันวัดสิ่งที่คล้ายกันได้อย่างมีประสิทธิภาพ สมมติว่าแบบจำลอง logit ของคุณคือการอธิบายสถานะตลาดแรงงาน (ทำงาน / ไม่ทำงาน) เป็นฟังก์ชั่นของประสบการณ์และอายุ ทีละตัวแปรทั้งสองมีความสัมพันธ์เชิงบวกกับสถานะเป็นประสบการณ์มากขึ้น / เก่า (ปกครองพนักงานเก่ามากเพราะการโต้แย้ง) พนักงานหางานง่ายกว่าบัณฑิตที่เพิ่งจบ ตอนนี้เห็นได้ชัดว่าตัวแปรสองตัวนั้นมีความสัมพันธ์กันอย่างมากเนื่องจากคุณต้องมีอายุมากขึ้นเพื่อให้มีประสบการณ์มากขึ้น ดังนั้นตัวแปรสองตัวนั้นโดยทั่วไป "แข่งขัน" เพื่ออธิบายสถานะซึ่งอาจโดยเฉพาะอย่างยิ่งในกลุ่มตัวอย่างขนาดเล็กส่งผลให้ทั้งสองตัวแปร "สูญเสีย" เนื่องจากไม่มีผลกระทบใด ๆ ที่อาจแข็งแกร่งเพียงพอและแม่นยำพอที่จะควบคุมได้อย่างแม่นยำ ประมาณการที่สำคัญ โดยพื้นฐานแล้วคุณจะถามว่า: อะไรเป็นผลบวกของประสบการณ์อีกปีหนึ่งเมื่อถืออายุคงที่ อาจมีพนักงานเพียงเล็กน้อยที่ไม่มีในชุดข้อมูลของคุณที่จะตอบคำถามนั้นดังนั้นผลกระทบนั้นจะถูกประเมินอย่างไม่แม่นยำทำให้เกิดค่า p จำนวนมาก

  3. แบบจำลองที่ไม่ได้รับการรับรอง: ทฤษฎีพื้นฐานสำหรับ t-stats / p-values ​​ต้องการให้คุณประเมินโมเดลที่ระบุอย่างถูกต้อง ทีนี้ถ้าคุณถดถอยตัวทำนายเพียงตัวเดียวโอกาสจะค่อนข้างสูงที่ตัวแบบ univariate จะทนทุกข์ทรมานจากตัวแปรอคติที่ละไว้ ดังนั้นการเดิมพันทั้งหมดจะปิดเป็นวิธีการทำงานของค่า p โดยทั่วไปคุณจะต้องระมัดระวังในการไว้วางใจพวกเขาเมื่อแบบจำลองของคุณไม่ถูกต้อง


ขอบคุณสำหรับการตอบสนองอย่างละเอียดและรวดเร็ว ฉันจะพยายามกำจัด multicollinearity ก่อน ฉันใช้ความสัมพันธ์ระหว่างตัวแปรและพบว่ามีบางอย่างและจะลองใช้ปัจจัยเงินเฟ้อความแปรปรวนเนื่องจากฉันได้ยินมาว่าเป็นวิธีที่ดีในการตรวจสอบสิ่งนี้เช่นกัน ถ้ามันกลายเป็นประเด็นอิสระที่มีอยู่แล้วฉันจะทำอะไรกับเรื่องนี้บ้าง? ฉันสามารถอธิบายได้ว่าสิ่งนี้กำลังเกิดขึ้น แต่ดูเหมือนว่าจะประนีประนอมความสมบูรณ์ของการถดถอยหากความสำคัญลดลงอย่างรุนแรง
Sam O'Brien

3
@ SamO'Brien: โปรดทราบว่าหากเป้าหมายของคุณคือสิ่งที่คุณพูดจริง ๆ แล้วก็คือ - "พยายามกำหนด" ว่าตัวแปรอิสระใดที่อาจทำให้เกิดการตอบสนอง "- โดยไม่สนใจบางคนเพราะพวกเขามีความสัมพันธ์กับผู้อื่น จะไม่ช่วยให้บรรลุ
Scortchi - Reinstate Monica

1
เป็นไปได้หรือไม่ที่จะมีวิธีอื่น ๆ เช่นตัวพยากรณ์ที่ไม่สำคัญในการถดถอยอย่างง่าย แต่มีนัยสำคัญในการถดถอยหลายครั้ง?
gkcn

8

ไม่มีเหตุผลใดทำไมนี้ควรจะเป็นไม่ได้เกิดขึ้น การถดถอยหลายครั้งถามคำถามที่แตกต่างจากการถดถอยอย่างง่าย โดยเฉพาะอย่างยิ่งการถดถอยหลายครั้ง (ในกรณีนี้การถดถอยโลจิสติกหลายรายการ) ถามเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระควบคุมตัวแปรอิสระอื่น ๆ การถดถอยแบบง่ายจะถามเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ (เดี่ยว)

หากคุณเพิ่มบริบทของการศึกษาของคุณ (เช่นอะไรคือตัวแปรเหล่านี้) อาจเป็นไปได้ที่จะให้คำตอบที่เฉพาะเจาะจงมากขึ้น นอกจากนี้เนื่องจากตัวแปรทั้งสามตัวในกรณีของคุณเป็นแบบแยกส่วนคุณสามารถแสดงข้อมูลให้เราได้อย่างง่ายดาย ... มีเพียง 8 บรรทัดที่จำเป็นในการสรุป:

DVIV1IV2CountAAA10AAB20

เป็นต้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.