เข้าสู่ระบบพลิกเมื่อเพิ่มตัวแปรอีกหนึ่งตัวในการถดถอยและมีขนาดที่ใหญ่กว่ามาก


9

การตั้งค่าพื้นฐาน:

แบบจำลองการถดถอย: โดยที่ C คือเวกเตอร์ของตัวแปรควบคุมy=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵ

ฉันสนใจและคาดว่าและเป็นลบ อย่างไรก็ตามมีปัญหาความสัมพันธ์แบบหลายค่าในตัวแบบสัมประสิทธิ์สหสัมพันธ์โดย corr ( , 0.9345, corr ( , 0.1765, corr ( , 0.3019ββ1β2x1x2)=x1x3)=x2x3)=

ดังนั้นและมีความสัมพันธ์กันสูงและควรให้ข้อมูลเดียวกัน ฉันใช้การถดถอยสามครั้ง: x1x2

  1. ยกเว้นตัวแปร ; 2. ยกเว้นตัวแปร3. รูปแบบเดิมที่มีทั้งและx_2x1x2x1x2

ผลลัพธ์:
สำหรับการถดถอย 1 และ 2 จะให้สัญญาณที่คาดไว้สำหรับและตามลำดับและมีขนาดใกล้เคียงกัน และและมีความสำคัญในระดับ 10% ในทั้งสองรุ่นหลังจากฉันทำการแก้ไข HAC ในข้อผิดพลาดมาตรฐาน เป็นค่าบวก แต่ไม่มีนัยสำคัญในทั้งสองรุ่นβ2β1β2β1β3

แต่สำหรับ 3,มีสัญญาณที่คาดไว้ แต่เครื่องหมายสำหรับนั้นเป็นค่าบวกด้วยขนาดที่ใหญ่กว่าสองเท่าในค่าสัมบูรณ์ และทั้งและนั้นไม่มีนัยสำคัญ ยิ่งกว่านั้นขนาดของลดลงเกือบครึ่งเมื่อเทียบกับการถดถอย 1 และ 2β1β2β1β1β2β3

คำถามของฉันคือ:

ทำไมใน 3 เครื่องหมายของจึงเป็นค่าบวกและมากกว่าในค่าสัมบูรณ์ มีเหตุผลทางสถิติที่สามารถพลิกสัญญาณและมีขนาดใหญ่ได้หรือไม่? หรือเป็นเพราะรุ่น 1 และ 2 ประสบปัญหาตัวแปรที่ละเว้นซึ่งทำให้พองได้ให้มีผลเชิงบวกต่อ y? แต่ในรูปแบบการถดถอย 1 และ 2 ทั้งและควรเป็นค่าบวกแทนค่าลบเนื่องจากผลรวมของและในรูปแบบการถดถอย 3 เป็นค่าบวกβ2β1β2β3x2β2β1x1x2

คำตอบ:


8

นึกถึงตัวอย่างนี้:

รวบรวมชุดข้อมูลตามเหรียญในกระเป๋าคนตัวแปร y / การตอบสนองคือมูลค่ารวมของเหรียญตัวแปร x1 คือจำนวนเหรียญทั้งหมดและ x2 คือจำนวนเหรียญที่ไม่ใช่ควอเตอร์ (หรืออะไรก็ตามที่มีค่ามากที่สุด ของเหรียญทั่วไปสำหรับท้องถิ่น)

มันง่ายที่จะเห็นว่าการถดถอยด้วย x1 หรือ x2 จะให้ความชันเป็นบวก แต่เมื่อ incuding ทั้งสองในแบบจำลองความชันบน x2 จะเป็นค่าลบเนื่องจากการเพิ่มจำนวนเหรียญขนาดเล็กโดยไม่เพิ่มจำนวนเหรียญทั้งหมดจะหมายถึงการแทนที่ เหรียญขนาดใหญ่ที่มีขนาดเล็กและลดค่าโดยรวม (y)

สิ่งเดียวกันสามารถเกิดขึ้นได้ทุกครั้งที่คุณมีตัวแปร x ที่สัมพันธ์กันสัญญาณสามารถอยู่ตรงข้ามกันได้ง่ายเมื่อคำนั้นอยู่ในเงื่อนไขของตัวเองและต่อหน้าคนอื่น ๆ


3

คุณได้ตอบคำถามของคุณเอง - มี collinearity

คำอธิบายเล็กน้อย:และนั้นมีความละเอียดสูง แต่เมื่อคุณป้อนทั้งสองลงในการถดถอยการถดถอยกำลังพยายามควบคุมผลกระทบของตัวแปรอื่น ๆ ในคำอื่น ๆ ถือคงทำในสิ่งที่เปลี่ยนแปลงในทำเพื่อYแต่ความจริงที่ว่าพวกเขาเกี่ยวข้องกันอย่างมากหมายความว่าคำถามนี้โง่และสิ่งแปลก ๆ สามารถเกิดขึ้นได้x1x2x1x2y


ขอบคุณมาก. แต่เนื่องจาก multicolinearity ในทฤษฎีเท่านั้นแปรปรวน inflatesthe แต่ไม่ส่งผลกระทบต่ออำนาจการทำนายโดยรวมของตัวแปรความสัมพันธ์อย่างมากดังนั้นฉันคิดว่าในรูปแบบ 3 ควรจะให้ผลที่คล้ายกันเป็นในรูปแบบที่ 1 หรือในรุ่น 2 เนื่องจากความสัมพันธ์แบบคู่ของ x1 x2 กับ x3 ไม่สูง (อันที่จริงนี่คือส่วนที่ทำให้ฉันสับสน) แต่เนื่องจากความสัมพันธ์อาจยุ่งเหยิงจริงๆและในทางปฏิบัติฉันไม่ควรคาดหวังสิ่งนี้เนื่องจากแบบจำลองของฉันเป็นเพียงการประมาณค่า DGP และความสัมพันธ์กับตัวแปรอื่น ๆ ที่มีความสำคัญ β1x1+β2x2β2x2β1x1
ting

หากคุณต้องการเข้าสู่คณิตศาสตร์ของเรื่องนี้ฉันขอแนะนำหนังสือจาก David Belsley
Peter Flom

เยี่ยมมากขอบคุณมาก !!! เพียงแค่ขอหนังสือจากห้องสมุด :)
การใช้งาน

2

ทำไมใน 3 เครื่องหมายของβ2จึงเป็นบวกและมากกว่าβ1ในค่าสัมบูรณ์ มีเหตุผลทางสถิติที่β2สามารถพลิกสัญญาณและมีขนาดใหญ่ได้หรือไม่?

คำตอบง่ายๆคือไม่มีเหตุผลลึก

วิธีคิดเกี่ยวกับมันคือเมื่อหลายวิธีการเข้าใกล้สมบูรณ์แบบค่านิยมเฉพาะที่คุณได้รับจากการติดตั้งจะมากขึ้นเรื่อย ๆ ขึ้นอยู่กับรายละเอียดของข้อมูลที่น้อยลง หากคุณต้องสุ่มตัวอย่างข้อมูลจำนวนเท่ากันจากการแจกแจงต้นแบบที่เหมือนกันแล้วพอดีคุณจะได้รับค่าการติดตั้งที่แตกต่างกันโดยสิ้นเชิง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.