ทำไม R ถึงส่งกลับ NA เป็นสัมประสิทธิ์ lm ()


32

ฉันปรับlm()โมเดลให้เหมาะสมกับชุดข้อมูลที่มีตัวบ่งชี้สำหรับไตรมาสทางการเงิน (Q1, Q2, Q3 ทำให้ Q4 เป็นค่าเริ่มต้น) ใช้lm(Y~., data = data) ฉันได้รับNAเป็นค่าสัมประสิทธิ์สำหรับไตรมาสที่ 3 และคำเตือนว่าตัวแปรหนึ่งตัวถูกแยกออกเนื่องจากภาวะเอกฐาน

ฉันต้องเพิ่มคอลัมน์ Q4 หรือไม่

คำตอบ:


39

NA เป็นสัมประสิทธิ์ในการถดถอยบ่งชี้ว่าตัวแปรในคำถามเกี่ยวข้องเชิงเส้นกับตัวแปรอื่น ๆ ในกรณีของคุณที่นี้หมายถึงว่าสำหรับบาง, , หากเป็นกรณีนี้ไม่มีวิธีแก้ปัญหาเฉพาะสำหรับการถดถอยโดยไม่ต้องวางตัวแปรตัวใดตัวหนึ่ง การเพิ่มคำถาม4จะทำให้เรื่องแย่ลงเท่านั้นQ3=a×Q1+×Q2+a,,Q4


1
ฉันเห็นด้วย ... ดูเหมือนว่าจะมีปัญหากับคำจำกัดความของตัวแปรจำลอง
Dominic Comtois

14
(+1) โดยทั่วไป NA หมายถึงค่าสัมประสิทธิ์ไม่สามารถประมาณได้ สิ่งนี้สามารถเกิดขึ้นได้เนื่องจาก collinearity ที่แน่นอนดังที่คุณพูด แต่ก็สามารถเกิดขึ้นได้เนื่องจากมีข้อสังเกตไม่เพียงพอที่จะประมาณค่าพารามิเตอร์ที่เกี่ยวข้อง (เช่นถ้า ) หากคุณคาดคะเนว่าเป็นหมวดหมู่และคุณกำลังเพิ่มคำศัพท์การโต้ตอบ NA อาจหมายถึงว่าไม่มีการสังเกตด้วยการรวมกันของระดับของปัจจัยต่างๆ พี>n
มาโคร

2
พี>n

ตัวแปรไม่เกี่ยวข้องกันเป็นเส้นตรงในฐานะ Q3 = 1 iff Q1 = Q2 = 0 ยิ่งกว่านั้นการใช้ stepAIC () และบังคับให้ตัวแบบรวมตัวแปรทั้งสามตัวเหล่านั้นไม่ทำให้เกิดปัญหา นอกจากนี้ฉันมีประมาณ 3 เท่าของจำนวนการสังเกตตัวแปร การเดาที่ดีที่สุดของฉันคือมี colinearity ระหว่างไตรมาสที่ 3 และตัวแปรอื่น ๆ ซึ่งฉันเดาว่าไม่รวมอยู่ใน stepAIC
Fraijo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.