ฉันสับสนเล็กน้อยว่าสมมติฐานของการถดถอยเชิงเส้นคืออะไร
จนถึงตอนนี้ฉันตรวจสอบว่า:
- ตัวแปรอธิบายทั้งหมดมีความสัมพันธ์เชิงเส้นตรงกับตัวแปรตอบกลับ (ในกรณีนี้)
- มี collinearity ใด ๆ ในหมู่ตัวแปรอธิบาย (มี collinearity น้อย)
- ระยะทางของชุดข้อมูลของโมเดลของ Cook ต่ำกว่า 1 (ในกรณีนี้ระยะทางทั้งหมดอยู่ต่ำกว่า 0.4 ดังนั้นจึงไม่มีคะแนนอิทธิพล)
- ส่วนที่เหลือจะกระจายตามปกติ (อาจไม่เป็นเช่นนั้น)
แต่ฉันก็อ่านต่อไปนี้:
การฝ่าฝืนกฎเกณฑ์มักเกิดขึ้นเพราะ (ก) การกระจายของตัวแปรตามและ / หรือตัวแปรอิสระเป็นตัวของตัวเองอย่างมีนัยสำคัญที่ไม่ปกติและ / หรือ (ข) ข้อสมมติเชิงเส้นถูกละเมิด
คำถามที่ 1 สิ่งนี้ทำให้ฟังดูเหมือนว่าตัวแปรอิสระและตัวแปรตามต้องได้รับการกระจายตามปกติ แต่เท่าที่ฉันรู้ว่านี่ไม่ใช่กรณี ตัวแปรตามของฉันเช่นเดียวกับหนึ่งในตัวแปรอิสระของฉันไม่ได้กระจายตามปกติ พวกเขาควรจะเป็นอย่างไร
คำถามที่ 2 พล็อต QQ ของฉันปกติมีลักษณะดังนี้:
นั่นแตกต่างจากการแจกแจงแบบปกติเล็กน้อยและshapiro.test
ยังปฏิเสธสมมติฐานว่าง ๆ ว่าส่วนที่เหลือมาจากการแจกแจงแบบปกติ:
> shapiro.test(residuals(lmresult))
W = 0.9171, p-value = 3.618e-06
ค่าที่เหลือเทียบกับค่าติดตั้งมีลักษณะดังนี้:
ฉันจะทำอย่างไรถ้าไม่ได้แจกจ่ายสิ่งที่เหลืออยู่ตามปกติ หมายความว่าแบบจำลองเชิงเส้นไม่มีประโยชน์ทั้งหมดหรือไม่