การเพิ่มตัวทำนายการถดถอยเชิงเส้นจะลด R กำลังสอง


10

ชุดข้อมูลของฉัน (ยังไม่มีข้อความ10,000) มีตัวแปรตาม (DV), "baseline" อิสระห้าตัวแปร (P1, P2, P3, P4, P5) และหนึ่งตัวแปรอิสระที่น่าสนใจ (Q)

ฉันใช้การถดถอยเชิงเส้น OLS สำหรับรุ่นสองรุ่นต่อไปนี้:

DV ~ 1 + P1 + P2 + P3 + P4 + P5
                                  -> R-squared = 0.125

DV ~ 1 + P1 + P2 + P3 + P4 + P5 + Q
                                  -> R-squared = 0.124

นั่นคือการเพิ่มตัวทำนาย Q ได้ลดจำนวนความแปรปรวนที่อธิบายไว้ในตัวแบบเชิงเส้น เท่าที่ผมเข้าใจนี้ไม่ควรเกิดขึ้น

เพื่อความชัดเจนค่าเหล่านี้คือค่า R-squared และไม่ได้ปรับค่า R-squared

ฉันได้รับการตรวจสอบค่า R-squared ใช้Jaspและ ธstatsmodels

มีเหตุผลอะไรบ้างที่ฉันเห็นปรากฏการณ์นี้? มีบางอย่างที่เกี่ยวข้องกับวิธีการ OLS หรือไม่?


1
ปัญหาเชิงตัวเลข? ตัวเลขค่อนข้างใกล้กัน ...

@ user2137591 นี่คือสิ่งที่ฉันคิด แต่ฉันไม่มีความคิดวิธีการตรวจสอบนี้ ความแตกต่างแน่นอนในค่า R-squared เป็น 0.000513569 ซึ่งมีขนาดเล็ก แต่ไม่ว่าขนาดเล็ก
Cai

1
ฉันหวังว่าคุณจะรู้ว่าพีชคณิตเชิงเส้น: ถ้า X เป็นเมทริกซ์การออกแบบด้านบนคุณช่วยคำนวณได้ไหม เดชอุดมXTXที่ไหน T เมทริกซ์คือทรานสและ เดชอุดมเมทริกซ์ดีเทอร์มิแนนต์คืออะไร?
Clarinetist

8
ค่าที่หายไปจะถูกปล่อยโดยอัตโนมัติ?
generic_user

1
0.000513569 เป็นจำนวนน้อยมาก: มันเปลี่ยน 0.41 เปอร์เซ็นต์ มันอาจเป็นปัญหาที่เป็นตัวเลขมาก สิ่งที่นักคลาริเน็ตพยายามพูดคือบางทีเมทริกซ์การออกแบบของคุณอาจมีจำนวนเงื่อนไขไม่ดีและเมื่อทำการย้อนกลับมันไม่เสถียรเชิงตัวเลข ...

คำตอบ:


25

เป็นไปได้หรือไม่ที่คุณมีค่าที่ขาดหายไปในQการทำให้ดรอปอัตโนมัติ นั่นจะมีผลกระทบต่อตัวอย่างทำให้การถดถอยทั้งสองนั้นไม่สามารถเปรียบเทียบกันได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.