ฉันจะพยายามอธิบายง่ายๆ
t-statistic * มีตัวเศษและส่วน ตัวอย่างเช่นสถิติในหนึ่งตัวอย่าง t-test คือ
x¯−μ0s/n−−√
* (มีหลายอย่าง แต่การสนทนานี้ควรหวังว่าจะเป็นเรื่องทั่วไปพอที่จะครอบคลุมสิ่งที่คุณถามถึง)
ภายใต้สมมติฐานตัวเศษมีการแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และค่าเบี่ยงเบนมาตรฐานที่ไม่รู้จัก
ภายใต้สมมติฐานชุดเดียวกันตัวส่วนคือการประมาณค่าเบี่ยงเบนมาตรฐานของการแจกแจงของตัวเศษ (ข้อผิดพลาดมาตรฐานของสถิติบนตัวเศษ) มันเป็นอิสระจากเศษ ตารางของมันคือไคสแควตัวแปรสุ่มแบ่งตามองศาของเสรีภาพ (ซึ่งเป็น DF ของเสื้อกระจาย) ครั้งเศษσnumerator
เมื่อองศาอิสระมีขนาดเล็กตัวหารมีแนวโน้มที่จะเอียงไปทางขวา มีโอกาสสูงที่จะน้อยกว่าค่าเฉลี่ยและมีโอกาสค่อนข้างดีที่จะค่อนข้างเล็ก ในขณะเดียวกันก็มีโอกาสที่จะมีขนาดใหญ่กว่าค่าเฉลี่ยมาก
ภายใต้สมมติฐานของภาวะปกติตัวเศษและส่วนจะเป็นอิสระ ดังนั้นถ้าเราสุ่มจากการกระจายตัวของสถิตินี้เราจะมีจำนวนสุ่มปกติหารด้วยค่าสุ่มที่สอง * ที่เลือกจากการแจกแจงแบบเบ้ด้านขวาโดยเฉลี่ยประมาณ 1
* โดยไม่คำนึงถึงคำปกติ
เพราะมันอยู่ในตัวส่วนค่าเล็ก ๆ ในการแจกแจงของตัวส่วนจึงให้ค่า t ที่มีขนาดใหญ่มาก ขวาเอียงในตัวส่วนทำให้ t- สถิติหนักหาง หางขวาของการกระจายเมื่อหารทำให้เสื้อกระจายขึ้นอย่างรวดเร็วแหลมกว่าปกติและมีค่าเบี่ยงเบนมาตรฐานเช่นเดียวกับเสื้อ
อย่างไรก็ตามเมื่อองศาอิสระมีขนาดใหญ่ขึ้นการแจกแจงจะดูธรรมดากว่าปกติมากขึ้นและแคบลงโดยรอบค่าเฉลี่ย
ด้วยเหตุนี้ผลกระทบของการหารโดยตัวหารที่มีต่อรูปร่างของการแจกแจงของตัวเศษจะลดลงเมื่อองศาอิสระเพิ่มขึ้น
ในที่สุด - ตามทฤษฎีบทของ Slutsky อาจแนะนำให้เราเกิดขึ้น - ผลกระทบของตัวส่วนกลายเป็นเหมือนการหารด้วยค่าคงที่และการกระจายตัวของ t-statistic นั้นใกล้เคียงกับปกติมาก
ถือว่าในแง่ของการตอบแทนของส่วนที่
whuber แนะนำในความคิดเห็นว่ามันอาจจะส่องสว่างมากขึ้นเพื่อดูที่ส่วนซึ่งกันและกันของตัวส่วน นั่นคือเราสามารถเขียนสถิติ t ของเราเป็นตัวเศษ (ปกติ) คูณด้วยส่วนกลับของส่วน (ขวาเอียง)
ตัวอย่างเช่นสถิติหนึ่งตัวอย่าง -t ของเราด้านบนจะกลายเป็น:
n−−√(x¯−μ0)⋅1/s
ตอนนี้พิจารณาค่าเบี่ยงเบนมาตรฐานของประชากรเดิม , σ x เราสามารถคูณและหารด้วย:Xiσx
n−−√(x¯−μ0)/σx⋅σx/s
เทอมแรกเป็นมาตรฐานปกติ เทอมที่สอง (สแควร์รูทของตัวแปรสุ่มแบบสุ่มผกผัน - ไค - สแควร์) ปรับขนาดมาตรฐานปกติด้วยค่าที่มีขนาดใหญ่กว่าหรือเล็กกว่า 1, "กระจายออกไป"
ภายใต้สมมติฐานของภาวะปกติทั้งสองคำในผลิตภัณฑ์มีความเป็นอิสระ ดังนั้นถ้าเราสุ่มจากการกระจายตัวของสถิตินี้เราจะมีหมายเลขสุ่มปกติ (เทอมแรกในผลิตภัณฑ์) คูณด้วยค่าที่เลือกแบบสุ่มที่สอง (โดยไม่คำนึงถึงเทอมปกติ) จากการแจกแจงแบบเบ้ขวานั่นคือ ' โดยทั่วไปแล้วประมาณ 1
เมื่อ df มีขนาดใหญ่ค่ามีแนวโน้มใกล้เคียงกับ 1 มาก แต่เมื่อ df มีขนาดเล็กมันจะค่อนข้างเบ้และการแพร่กระจายมีขนาดใหญ่ด้วยหางขวาขนาดใหญ่ของปัจจัยการปรับขนาดนี้ทำให้หางค่อนข้างอ้วน: