ทำไมการแจกแจงแบบ t จึงปกติมากกว่าเมื่อขนาดตัวอย่างเพิ่มขึ้น?


19

ตามวิกิพีเดียฉันเข้าใจว่าการแจกแจงแบบ t เป็นการกระจายตัวตัวอย่างของค่า t เมื่อตัวอย่างเป็นการสังเกตแบบ iid จากประชากรที่กระจายตัวตามปกติ อย่างไรก็ตามฉันไม่เข้าใจโดยสัญชาตญาณว่าทำไมทำให้รูปร่างของการแจกแจงแบบ t เปลี่ยนจากไขมันหางเป็นปกติเกือบสมบูรณ์

ฉันได้ว่าถ้าคุณสุ่มตัวอย่างจากการแจกแจงแบบปกติแล้วถ้าคุณลองสุ่มกลุ่มใหญ่มันจะคล้ายกับการกระจายตัวนั้น แต่ฉันไม่เข้าใจว่าทำไมมันเริ่มต้นด้วยรูปร่างอ้วนท้วน

คำตอบ:


23

ฉันจะพยายามอธิบายง่ายๆ

t-statistic * มีตัวเศษและส่วน ตัวอย่างเช่นสถิติในหนึ่งตัวอย่าง t-test คือ

x¯μ0s/n

* (มีหลายอย่าง แต่การสนทนานี้ควรหวังว่าจะเป็นเรื่องทั่วไปพอที่จะครอบคลุมสิ่งที่คุณถามถึง)

ภายใต้สมมติฐานตัวเศษมีการแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และค่าเบี่ยงเบนมาตรฐานที่ไม่รู้จัก

ภายใต้สมมติฐานชุดเดียวกันตัวส่วนคือการประมาณค่าเบี่ยงเบนมาตรฐานของการแจกแจงของตัวเศษ (ข้อผิดพลาดมาตรฐานของสถิติบนตัวเศษ) มันเป็นอิสระจากเศษ ตารางของมันคือไคสแควตัวแปรสุ่มแบ่งตามองศาของเสรีภาพ (ซึ่งเป็น DF ของเสื้อกระจาย) ครั้งเศษσnumerator

เมื่อองศาอิสระมีขนาดเล็กตัวหารมีแนวโน้มที่จะเอียงไปทางขวา มีโอกาสสูงที่จะน้อยกว่าค่าเฉลี่ยและมีโอกาสค่อนข้างดีที่จะค่อนข้างเล็ก ในขณะเดียวกันก็มีโอกาสที่จะมีขนาดใหญ่กว่าค่าเฉลี่ยมาก

ภายใต้สมมติฐานของภาวะปกติตัวเศษและส่วนจะเป็นอิสระ ดังนั้นถ้าเราสุ่มจากการกระจายตัวของสถิตินี้เราจะมีจำนวนสุ่มปกติหารด้วยค่าสุ่มที่สอง * ที่เลือกจากการแจกแจงแบบเบ้ด้านขวาโดยเฉลี่ยประมาณ 1

* โดยไม่คำนึงถึงคำปกติ

เพราะมันอยู่ในตัวส่วนค่าเล็ก ๆ ในการแจกแจงของตัวส่วนจึงให้ค่า t ที่มีขนาดใหญ่มาก ขวาเอียงในตัวส่วนทำให้ t- สถิติหนักหาง หางขวาของการกระจายเมื่อหารทำให้เสื้อกระจายขึ้นอย่างรวดเร็วแหลมกว่าปกติและมีค่าเบี่ยงเบนมาตรฐานเช่นเดียวกับเสื้อ

อย่างไรก็ตามเมื่อองศาอิสระมีขนาดใหญ่ขึ้นการแจกแจงจะดูธรรมดากว่าปกติมากขึ้นและแคบลงโดยรอบค่าเฉลี่ย

ป้อนคำอธิบายรูปภาพที่นี่

ด้วยเหตุนี้ผลกระทบของการหารโดยตัวหารที่มีต่อรูปร่างของการแจกแจงของตัวเศษจะลดลงเมื่อองศาอิสระเพิ่มขึ้น

ในที่สุด - ตามทฤษฎีบทของ Slutsky อาจแนะนำให้เราเกิดขึ้น - ผลกระทบของตัวส่วนกลายเป็นเหมือนการหารด้วยค่าคงที่และการกระจายตัวของ t-statistic นั้นใกล้เคียงกับปกติมาก


ถือว่าในแง่ของการตอบแทนของส่วนที่

whuber แนะนำในความคิดเห็นว่ามันอาจจะส่องสว่างมากขึ้นเพื่อดูที่ส่วนซึ่งกันและกันของตัวส่วน นั่นคือเราสามารถเขียนสถิติ t ของเราเป็นตัวเศษ (ปกติ) คูณด้วยส่วนกลับของส่วน (ขวาเอียง)

ตัวอย่างเช่นสถิติหนึ่งตัวอย่าง -t ของเราด้านบนจะกลายเป็น:

n(x¯μ0)1/s

ตอนนี้พิจารณาค่าเบี่ยงเบนมาตรฐานของประชากรเดิม , σ x เราสามารถคูณและหารด้วย:Xiσx

n(x¯μ0)/σxσx/s

เทอมแรกเป็นมาตรฐานปกติ เทอมที่สอง (สแควร์รูทของตัวแปรสุ่มแบบสุ่มผกผัน - ไค - สแควร์) ปรับขนาดมาตรฐานปกติด้วยค่าที่มีขนาดใหญ่กว่าหรือเล็กกว่า 1, "กระจายออกไป"

ภายใต้สมมติฐานของภาวะปกติทั้งสองคำในผลิตภัณฑ์มีความเป็นอิสระ ดังนั้นถ้าเราสุ่มจากการกระจายตัวของสถิตินี้เราจะมีหมายเลขสุ่มปกติ (เทอมแรกในผลิตภัณฑ์) คูณด้วยค่าที่เลือกแบบสุ่มที่สอง (โดยไม่คำนึงถึงเทอมปกติ) จากการแจกแจงแบบเบ้ขวานั่นคือ ' โดยทั่วไปแล้วประมาณ 1

เมื่อ df มีขนาดใหญ่ค่ามีแนวโน้มใกล้เคียงกับ 1 มาก แต่เมื่อ df มีขนาดเล็กมันจะค่อนข้างเบ้และการแพร่กระจายมีขนาดใหญ่ด้วยหางขวาขนาดใหญ่ของปัจจัยการปรับขนาดนี้ทำให้หางค่อนข้างอ้วน:

ป้อนคำอธิบายรูปภาพที่นี่


ขอบคุณ! สิ่งนี้มีความกระจ่างแจ้งมาก แต่ฉันก็ยังไม่แน่ใจเล็กน้อยเกี่ยวกับ "สแควร์มันคือตัวแปรสุ่มไคสแควร์หารด้วยองศาอิสระ (ซึ่งก็คือ df ของการแจกแจงแบบ t) คูณด้วย [ส่วนเบี่ยงเบนมาตรฐานของตัวเศษ] " คุณพูดถึงเพียงเพราะมันเป็นสิ่งที่มีประโยชน์ที่จะรู้หรือเป็นสิ่งที่เกี่ยวข้องโดยตรงกับคำตอบสำหรับคำถามของฉัน ฉันเข้าใจว่ามันคือการกระจายตัวของส่วนซึ่งตรงข้ามกับการกระจายตัวของสแควร์ของตัวส่วนที่ปรากฎในรูปของคุณ
user1205901 - Reinstate Monica

2
การกระจายตัวของสถิติจะหนักกว่าปกติแม้ว่ามันจะไม่ใช่สแควร์รูทของไคสแควร์โดยเฉพาะ ในแง่นั้นมันจะไม่เปลี่ยนคำตอบโดยตรงเพื่อให้มันออกไป แต่อย่างน้อยมันก็ทำหน้าที่เป็นคำอธิบายว่าการกระจายสเกลในแผนภาพมาจากไหน
Glen_b -Reinstate Monica

3
ฉันคิดว่ามันอาจจะเล็ก ๆ น้อย ๆ ที่ให้แสงสว่างในการดำเนินการวิเคราะห์นี้อยู่บนพื้นฐานของซึ่งกันและกันของส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง ควบคู่ไปกับการโต้แย้งว่า SD ตัวอย่างเป็นอิสระจากค่าเฉลี่ยตัวอย่าง (ความคิดหลักที่จะได้รับประโยชน์จากการเน้นและคำอธิบายที่น้อยกว่า IMHO) จะช่วยให้ผู้คนเห็นการแบ่งค่าเฉลี่ยตัวอย่างโดย SD แพร่กระจายสิ่งอื่นจะกระจายปกติ (แน่นอนว่านี่เป็นจุดรวมของการค้นพบของ Gossett)
whuber

1
@ เมื่อฉันได้เพิ่มส่วนที่พูดถึงมันในแง่ของการแลกเปลี่ยนซึ่งกันและกัน แต่ยังคงการสนทนาเดิม (ดูเหมือนว่าฉันจะตรงมากขึ้น แต่ฉันขอบคุณที่หลายคนอาจได้รับมากขึ้นจากมันในแง่ของการแลกเปลี่ยนซึ่งกันและกัน) . ฉันจะเพิ่มความเป็นอิสระด้วยเช่นกัน
Glen_b

1
s/nσ/ns/σσ/sσ

8

@Glen_b ให้สัญชาตญาณว่าทำไมสถิติ t ดูปกติมากขึ้นเมื่อขนาดตัวอย่างเพิ่มขึ้น ตอนนี้ฉันจะให้คำอธิบายทางเทคนิคเพิ่มเติมเล็กน้อยสำหรับกรณีที่คุณได้รับการกระจายของสถิติ

n1n

(1+x2n1)n/2n1B(n12,12).

เป็นไปได้ที่จะแสดงให้เห็นว่า

1n1B(n12,12)12π,

และ

(1+x2n1)n/2exp(x2/2),

n


2
1/n(1+(x/n)2)1tn

2
nn

2

ฉันต้องการแบ่งปันบางสิ่งที่ช่วยให้ปรีชาญาณของฉันเป็นผู้เริ่มต้น (แม้ว่าจะเข้มงวดน้อยกว่าคำตอบอื่น ๆ )

Z,Z1,...,Znเป็น RV มาตรฐานปกติแล้วตามด้วย RV ต่อไปนี้

ZZ12+...+Zn2n

nองศาอิสระ

n1Znโตขึ้น

E[Z2]=1nZi2nZi2 s' ซึ่งเป็นหนึ่งใน

nZ1=Z

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.