เงื่อนไขปกติจะเริ่มเล่นเมื่อคุณพยายามรับช่วงความมั่นใจและ / หรือค่า p
ไม่ได้เป็นเงื่อนไข Gauss มาร์คอฟε|X∼N(0,σ2In)
X=x
ถ้าเรารันการวินิจฉัย R แปลงข้อมูล "ประชากร" จำลองเราจะได้รับ ...
X.
พล็อตทั่วไปจะเป็น:
แนวคิดการแนะนำตัวลงทะเบียนหลายตัวหรือตัวแปรอธิบายไม่ได้เปลี่ยนความคิด ฉันพบว่าบทเรียนแบบฝึกหัดบนมือswirl()
มีประโยชน์อย่างมากในการทำความเข้าใจว่าการถดถอยหลายครั้งเป็นกระบวนการของการถดถอยตัวแปรตามซึ่งกันและกันต่อการดำเนินการต่อการเปลี่ยนแปลงที่เหลือไม่ได้อธิบายในรูปแบบ; หรือมากกว่านั้นง่ายๆคือรูปแบบเวกเตอร์ของการถดถอยเชิงเส้นอย่างง่าย :
เทคนิคทั่วไปคือการเลือกหนึ่ง regressor และแทนที่ตัวแปรอื่น ๆ ทั้งหมดโดยส่วนที่เหลือของการถดถอยของพวกเขากับหนึ่ง
E[ ε2i | X ]=σ2
ปัญหาเกี่ยวกับการละเมิดเงื่อนไขนี้คือ:
Heteroskedasticity มีผลกระทบร้ายแรงสำหรับตัวประมาณ OLS แม้ว่าตัวประมาณ OLS จะไม่เอนเอียง แต่ SE ที่ประมาณไว้นั้นผิด ด้วยเหตุนี้จึงไม่สามารถเชื่อมั่นในการทดสอบช่วงเวลาและทดสอบสมมติฐานได้ นอกจากนี้ตัวประมาณ OLS จะไม่เป็นสีน้ำเงินอีกต่อไป
ในพล็อตนี้ความแปรปรวนจะเพิ่มขึ้นตามค่าของ regressor (ตัวแปรอธิบาย) ซึ่งตรงข้ามกับค่าคงที่ ในกรณีนี้ส่วนที่เหลือจะกระจายตามปกติ แต่ความแปรปรวนของการแจกแจงแบบปกตินี้จะเปลี่ยน (เพิ่มขึ้น) ด้วยตัวแปรอธิบาย
โปรดสังเกตว่าบรรทัดการถดถอย "จริง" (ประชากร) จะไม่เปลี่ยนแปลงตามส่วนที่เกี่ยวกับเส้นการถดถอยของประชากรภายใต้ homoskedasticity ในพล็อตแรก (สีน้ำเงินเข้มทึบ) แต่เป็นที่ชัดเจนโดยสังหรณ์ว่าการประมาณการจะมีความไม่แน่นอนมากขึ้น
ชุดการวินิจฉัยบนชุดข้อมูลคือ ...
ซึ่งสอดคล้องกับการกระจาย "หนักหาง"ซึ่งทำให้รู้สึกคือเราต้องกล้องโทรทรรศน์ทั้งหมด "แบบเคียงข้างกัน" แนวตั้งแบบเกาส์แปลงเป็นหนึ่งเดียวซึ่งจะรักษารูปร่างระฆัง แต่มีหางยาวมาก
@Glen_b "... ความครอบคลุมที่สมบูรณ์ของความแตกต่างระหว่างทั้งสองจะพิจารณาถึง homoskedastic-but-not-normal"
ส่วนที่เหลือจะเบ้สูงและความแปรปรวนเพิ่มขึ้นตามค่าของตัวแปรอธิบาย
นี่จะเป็นแผนการวินิจฉัย ...
ตรงกับการทำเครื่องหมายเบ้ด้านขวา
หากต้องการปิดลูปเราจะเห็นการเปลี่ยนแปลงแบบเนสในโมเดลแบบ homoskedastic พร้อมการกระจายข้อผิดพลาดแบบไม่ใช่เกาส์:
พร้อมแปลงวินิจฉัยเป็น ...