ทำไมเมื่อเรามีข้อผิดพลาดที่ไม่ได้กระจายทั่วไปความถูกต้องของข้อความสำคัญของเราถูกบุกรุก ทำไมช่วงความมั่นใจจะกว้างหรือแคบเกินไป
ช่วงความเชื่อมั่นจะขึ้นอยู่กับวิธีที่ตัวเศษและตัวส่วนกระจายในรูปแบบสถิติ
ด้วยข้อมูลปกติตัวเศษของสถิติ t มีการแจกแจงแบบปกติและการกระจายของกำลังสองของตัวส่วน (ซึ่งก็คือความแปรปรวน) เป็นพหุคูณของการแจกแจงแบบไคสแควร์ เมื่อตัวเศษและส่วนนั้นเป็นอิสระเช่นกัน (เช่นในกรณีที่มีข้อมูลปกติเท่านั้นเนื่องจากการสังเกตนั้นเป็นอิสระ) สถิติทั้งหมดมีการแจกแจงแบบ t
β^- βsβ^βเสื้อ
หากข้อมูลมาจากการแจกแจงแบบอื่นสถิติจะไม่มีการแจกแจงแบบ t ตัวอย่างเช่นถ้ามันหนักเทลด์การแจกแจงแบบ t จะมีแนวโน้มที่จะเบากว่าเทลด์เล็กน้อย (การสังเกตจากภายนอกส่งผลกระทบต่อตัวส่วนมากกว่าตัวเศษ) นี่คือตัวอย่าง ในทั้งสองกรณีฮิสโตแกรมมีไว้สำหรับการถดถอย 10,000 ครั้ง:
β= 0( - 2 , 2 )
ช่วงเวลา 95% t (ซึ่งควรรวม 95% ของความลาดชันในตัวอย่างของเรา) เริ่มจาก -2.048 ถึง 2.048 สำหรับข้อมูลปกติมันรวม 95.15% ของความชันตัวอย่าง 10,000 ตัวอย่าง สำหรับข้อมูลที่เอียงนั้นรวมถึง 99.91%