สมมติฐานปกติในการถดถอยเชิงเส้น


11

ในฐานะที่เป็นข้อสันนิษฐานของการถดถอยเชิงเส้นปกติของการกระจายของข้อผิดพลาดบางครั้งก็ผิด "ขยาย" หรือตีความว่าเป็นความจำเป็นสำหรับความปกติของ y หรือ x

เป็นไปได้หรือไม่ที่จะสร้างสถานการณ์ / ชุดข้อมูลที่ที่ X และ Y ไม่ได้เป็นแบบปกติ แต่มีข้อผิดพลาดเกิดขึ้นดังนั้นค่าประมาณการถดถอยเชิงเส้นที่ได้รับจึงถูกต้อง?


5
ตัวอย่างเล็กน้อย: X มีการแจกแจงแบบ Bernoulli (เช่นการรับค่า 0 หรือ 1); Y = X + N (0, 0.1) โดยปกติ X หรือ Y จะไม่ได้รับการแจกจ่ายด้วยตัวเอง แต่การถดถอย Y บน X ยังคงใช้งานได้
Hong Ooi

ฉันเดาว่าคุณกำลังคิดถึงการกระจายตัวของเศษซากไม่ใช่การกระจายตัวของตัวแปร
tashuhka


คำตอบ:


16

ขยายความคิดเห็น Hong Oois ด้วยรูปภาพ นี่คือภาพของชุดข้อมูลที่ไม่มีการกระจายระยะขอบตามปกติ แต่ส่วนที่เหลือยังคงอยู่ดังนั้นสมมติฐานของการถดถอยเชิงเส้นจึงยังคงใช้ได้:

ป้อนคำอธิบายรูปภาพที่นี่

ภาพถูกสร้างขึ้นโดยรหัส R ต่อไปนี้:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.