ทำไมความสัมพันธ์ของคนตกค้างจึงไม่สำคัญเมื่อทำการทดสอบความเป็นปกติ?


9

เมื่อไหร่ Y=AX+ε (เช่น Y มาจากตัวแบบการถดถอยเชิงเส้น)

εN(0,σ2I)e^=(IH)Y~ยังไม่มีข้อความ(0,(ผม-H)σ2)
และในกรณีที่เหลือ e^1,,e^nมีความสัมพันธ์และไม่เป็นอิสระ แต่เมื่อเราทำการวิเคราะห์การถดถอยและต้องการทดสอบสมมติฐาน εN(0,σ2I)หนังสือเรียนทุกเล่มแนะนำให้ใช้แผนการถาม - ตอบและการทดสอบทางสถิติเกี่ยวกับส่วนที่เหลือ e^ ที่ถูกออกแบบมาเพื่อทดสอบว่า e^N(0,σ2I) สำหรับบางคน σ2R.

ทำไมมันไม่สำคัญสำหรับการทดสอบเหล่านี้ว่ามีความสัมพันธ์กับส่วนที่เหลือและไม่เป็นอิสระ? มันมักจะแนะนำให้ใช้สารตกค้างมาตรฐาน:

e^i=e^i1hii,
แต่นั่นทำให้พวกเขาเป็นคนรักร่วมเพศไม่เป็นอิสระ

ในการเรียบเรียงคำถามใหม่:เศษเหลือจากการถดถอยของ OLS มีความสัมพันธ์กัน ฉันเข้าใจว่าในทางปฏิบัติความสัมพันธ์เหล่านี้มีขนาดเล็กมาก (เกือบตลอดเวลาหรือไม่เสมอไป) พวกเขาสามารถเพิกเฉยเมื่อทำการทดสอบว่าส่วนที่เหลือมาจากการแจกแจงแบบปกติหรือไม่ คำถามของฉันคือทำไม


1
ทำให้พวกเขากระเทย
Scortchi - Reinstate Monica

1
คุณกำลังถามเกี่ยวกับการบังคับใช้การทดสอบเหล่านี้เมื่อส่วนที่เหลือมีความสัมพันธ์ที่ดีหรือคุณเพียงแค่กังวลเกี่ยวกับความสัมพันธ์เชิงลบ (เล็กน้อยมากและไม่สำคัญ) ที่เกิดขึ้นจากขั้นตอนการประมาณกำลังสองน้อยที่สุด?
whuber

1
@ คนที่ฉันถามเกี่ยวกับความสัมพันธ์ที่เกิดขึ้นจากขั้นตอนการประมาณกำลังสองน้อยที่สุด หากพวกเขาเล็กน้อยและไม่สมเหตุผลฉันอยากจะรู้ว่าทำไม
Zoran Loncarevic

คำตอบ:


3

ในสัญลักษณ์ของคุณ H คือการประมาณการพื้นที่คอลัมน์ของ Xนั่นคือ subspace ซึ่งประกอบไปด้วย regressors ทั้งหมด ดังนั้นM:=InH คือการฉายภาพทุกอย่างที่ตั้งฉากกับพื้นที่ย่อยที่ถูกขยายโดย regressors ทั้งหมด

ถ้า XRn×kจากนั้น e^Rn คือการกระจายแบบเอกพจน์ปกติและองค์ประกอบมีความสัมพันธ์ตามที่คุณระบุ

ข้อผิดพลาด ε ไม่สามารถสังเกตเห็นได้และโดยทั่วไปไม่ได้ตั้งฉากกับพื้นที่ย่อยที่ถูกขยายโดย X. เพื่อประโยชน์ในการโต้แย้งสมมติว่าข้อผิดพลาดεspan(X). ถ้านี่เป็นเรื่องจริงเราก็คงจะมีy=Xβ+ε=y~+ε กับ y~ε. ตั้งแต่y~=Xβspan(X)เราสามารถย่อยสลายได้ y และรับความจริง ε.

สมมติว่าเรามีพื้นฐาน b1,,bn ของ Rnที่แรก b1,,bk เวกเตอร์พื้นฐานขยายพื้นที่ย่อย span(X) และที่เหลือ bk+1,,bn ระยะ span(X). In general, the error ε=α1b1++αnbn จะมีองค์ประกอบที่ไม่ใช่ศูนย์ αi สำหรับ i{1,,k}. ส่วนประกอบที่ไม่เป็นศูนย์นี้จะได้รับการผสมกับXβ และดังนั้นจึงไม่สามารถกู้คืนได้โดยการฉายบน span(X).

เนื่องจากเราไม่สามารถหวังที่จะกู้คืนข้อผิดพลาดที่แท้จริง ε และ e^ มีความสัมพันธ์เอกพจน์ nมิติปกติเราเปลี่ยนได้ e^RneRnk. ที่นั่นเราสามารถมีสิ่งนั้นได้

eNnk(0,σ2Ink),
กล่าวคือ eไม่มีการแจกแจงแบบไม่มีเอกพจน์และ homoscedastic ปกติ ของตกค้างeจะเรียกว่าTheil ของเหลือ

ในบทความสั้น ๆเกี่ยวกับการทดสอบการถดถอยเพื่อความเป็นปรกติคุณจะพบการเปรียบเทียบของ OLS และ BLUS ที่เหลือ ในการตั้งค่า Monte Carlo ที่ทดสอบแล้วค่าตกค้าง OLS นั้นเหนือกว่าค่า BLUS แต่นี่ควรเป็นจุดเริ่มต้นให้คุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.