เหตุใดข้อผิดพลาดที่ไม่ได้กระจายทั่วไปทำให้ความถูกต้องของข้อความสำคัญของเราไม่เป็นจริง

มีการสันนิษฐานว่าเป็นเรื่องปกติเมื่อพิจารณารูปแบบของ OLS และนั่นคือข้อผิดพลาดที่ได้รับการกระจายตามปกติ ฉันเรียกดูผ่านการตรวจสอบข้ามและดูเหมือนว่า Y และ X ไม่จำเป็นต้องเป็นปกติเพื่อให้ข้อผิดพลาดเป็นปกติ คำถามของฉันคือสาเหตุที่เมื่อเรามีข้อผิดพลาดที่ไม่ได้กระจายทั่วไปความถูกต้องของข้อความสำคัญของเราถูกบุกรุก ทำไมช่วงความมั่นใจจะกว้างหรือแคบเกินไป

— user44278
แหล่งที่มา

ทำไมเมื่อเรามีข้อผิดพลาดที่ไม่ได้กระจายทั่วไปความถูกต้องของข้อความสำคัญของเราถูกบุกรุก ทำไมช่วงความมั่นใจจะกว้างหรือแคบเกินไป

ช่วงความเชื่อมั่นจะขึ้นอยู่กับวิธีที่ตัวเศษและตัวส่วนกระจายในรูปแบบสถิติ

ด้วยข้อมูลปกติตัวเศษของสถิติ t มีการแจกแจงแบบปกติและการกระจายของกำลังสองของตัวส่วน (ซึ่งก็คือความแปรปรวน) เป็นพหุคูณของการแจกแจงแบบไคสแควร์ เมื่อตัวเศษและส่วนนั้นเป็นอิสระเช่นกัน (เช่นในกรณีที่มีข้อมูลปกติเท่านั้นเนื่องจากการสังเกตนั้นเป็นอิสระ) สถิติทั้งหมดมีการแจกแจงแบบ t

$\frac{\hat \beta - \beta}{s_{\hat\beta}}$ $\beta$ $t$

หากข้อมูลมาจากการแจกแจงแบบอื่นสถิติจะไม่มีการแจกแจงแบบ t ตัวอย่างเช่นถ้ามันหนักเทลด์การแจกแจงแบบ t จะมีแนวโน้มที่จะเบากว่าเทลด์เล็กน้อย (การสังเกตจากภายนอกส่งผลกระทบต่อตัวส่วนมากกว่าตัวเศษ) นี่คือตัวอย่าง ในทั้งสองกรณีฮิสโตแกรมมีไว้สำหรับการถดถอย 10,000 ครั้ง:

ป้อนคำอธิบายรูปภาพที่นี่

$\beta=0$ $(-2,2)$

ช่วงเวลา 95% t (ซึ่งควรรวม 95% ของความลาดชันในตัวอย่างของเรา) เริ่มจาก -2.048 ถึง 2.048 สำหรับข้อมูลปกติมันรวม 95.15% ของความชันตัวอย่าง 10,000 ตัวอย่าง สำหรับข้อมูลที่เอียงนั้นรวมถึง 99.91%

— Glen_b -Reinstate Monica
แหล่งที่มา

คุณใช้การกระจายแบบไหนกับเวอร์ชั่นที่เอียงและหนัก?

— gung - Reinstate Monica

t

$t$