สังเกตพบการกระจายตัวแบบเบ้ซ้ายและสมมาตร


10

มันค่อนข้างยากสำหรับฉันที่จะอธิบาย แต่ฉันจะพยายามทำให้ปัญหาของฉันเป็นที่เข้าใจได้ ก่อนอื่นคุณต้องรู้ว่าฉันได้ทำการถดถอยเชิงเส้นอย่างง่ายจนถึงตอนนี้ ก่อนที่ผมจะประมาณค่าสัมประสิทธิ์ฉันดูการกระจายของฉันYมันหนักไปทางซ้ายเบ้ หลังจากที่ฉันประเมินแบบจำลองแล้วฉันค่อนข้างแน่ใจว่าจะสังเกตสิ่งที่เหลืออยู่แบบเบ้ซ้ายในรูปแบบ QQ-Plot เป็น wel แต่ฉันไม่ได้ทำอย่างแน่นอน อะไรคือสาเหตุของการแก้ไขนี้? ความผิดพลาดอยู่ที่ไหน หรือมีการกระจายอะไรจะทำอย่างไรกับการกระจายของระยะข้อผิดพลาดหรือไม่YY


@Aniko ให้คำตอบที่ดีในการตอบคำถามก่อนหน้านี้ของคุณ
whuber

คำตอบ:


22

เพื่อตอบคำถามของคุณลองมาเป็นตัวอย่างง่ายๆ รูปแบบที่เรียบง่ายการถดถอยจะได้รับโดยที่2) ทีนี้สมมติว่านั้นมีการแบ่งขั้ว หากไม่เท่ากับศูนย์แล้วกระจายของจะไม่เป็นปกติ แต่จริง ๆ แล้วเป็นส่วนผสมของทั้งสองแจกแจงปกติหนึ่งที่มีค่าเฉลี่ยและเป็นหนึ่งที่มีค่าเฉลี่ย\Yผม=β0+β1xผม+εผมεผม~ยังไม่มีข้อความ(0,σ2)xผมβ1Yผมβ0β0+β1

หากมีขนาดใหญ่พอและมีขนาดเล็กพอฮิสโตแกรมของจะดู bimodal อย่างไรก็ตามหนึ่งสามารถรับฮิสโตแกรมของที่ดูเหมือนการกระจายแบบ "เดี่ยว" นี่คือตัวอย่างหนึ่ง (โดยใช้ R):β1σ2YผมYผม

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

ไม่ใช่การกระจายของที่สำคัญ - แต่การกระจายของข้อผิดพลาดYผม

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

และนั่นก็ดูเป็นปกติอย่างสมบูรณ์ - ไม่เพียง แต่เป็นการพูดเปรียบเทียบเท่านั้น


"แต่การกระจายของข้อผิดพลาด" คุณหมายถึงที่นี่ไม่ใช่ข้อผิดพลาดใช่ไหม ข้อมูลเพิ่มเติมเกี่ยวกับส่วนที่เหลือ vs ข้อผิดพลาด: stats.stackexchange.com/questions/133389/…
vasili111

7

อ้างอิงถึงคำตอบที่ยอดเยี่ยมจาก @ Wolfgang ต่อไปนี้เป็นพล็อตจากรหัส R ของเขา:

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.