ทำไมสถิติแบบ T ต้องการข้อมูลเพื่อติดตามการแจกแจงแบบปกติ


11

ฉันกำลังดูสมุดบันทึกนี้และฉันรู้สึกสับสนกับคำสั่งนี้:

เมื่อเราพูดถึงเรื่องปกติวิสัยสิ่งที่เราหมายถึงคือข้อมูลควรดูเหมือนการแจกแจงแบบปกติ สิ่งนี้มีความสำคัญเนื่องจากการทดสอบสถิติหลายอย่างขึ้นอยู่กับเรื่องนี้ (เช่นสถิติ t)

ฉันไม่เข้าใจว่าทำไมสถิติแบบ T ต้องการข้อมูลเพื่อติดตามการแจกแจงแบบปกติ

แท้จริงแล้ว Wikipedia พูดในสิ่งเดียวกัน:

การแจกแจงแบบ t (หรือการแจกแจงแบบที) เป็นสมาชิกของตระกูลการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่เกิดขึ้นเมื่อประมาณค่าเฉลี่ยของประชากรที่กระจายตัวแบบปกติ

อย่างไรก็ตามฉันไม่เข้าใจว่าทำไมจึงจำเป็นต้องใช้สมมติฐานนี้

ไม่มีสิ่งใดในสูตรที่บ่งบอกว่าข้อมูลต้องเป็นไปตามการแจกแจงแบบปกติ:

ป้อนคำอธิบายรูปภาพที่นี่

ฉันดูคำจำกัดความของมันเล็กน้อยแต่ฉันไม่เข้าใจว่าทำไมถึงมีความจำเป็น

คำตอบ:


17

ข้อมูลที่คุณต้องการคือในส่วน "ลักษณะ" ของหน้าวิกิพีเดีย -distribution กับองศาอิสระνอาจจะกำหนดเป็นการกระจายของตัวแปรสุ่มTดังกล่าวที่ T = ZtνT ที่ Zคือการกระจายปกติตัวแปรสุ่มมาตรฐานและ Vเป็น χ 2ตัวแปรสุ่มที่มีองศาอิสระν นอกจากนี้ Zและ Vต้องเป็นอิสระ ดังนั้นใดก็ตาม Zและ V ที่เป็นไปตามนิยามข้างต้นแล้วคุณสามารถประสบความสำเร็จในตัวแปรสุ่มที่มีเสื้อ -distribution

T=ZV/ν,
ZVχ2νZVZVเสื้อ

ตอนนี้สมมติว่ามีการกระจายไปตามการกระจายF Let Fมีค่าเฉลี่ยμและแปรปรวนσ 2 ให้ˉ Xเป็นค่าเฉลี่ยตัวอย่างและS 2เป็นความแปรปรวนตัวอย่าง จากนั้นเราจะดูสูตร:X1,X2,...,XnFFμσ2X¯S2

X¯-μS/n=X¯-μσ/n(n-1)S2(n-1)σ2.

ถ้า, หมายถึงการแจกแจงแบบปกติ, ดังนั้นˉ XN ( μ , σ 2 / n ) , ดังนั้นˉ X - μFX¯~ยังไม่มีข้อความ(μ,σ2/n)) นอกจากนี้(n-1)S2X¯-μσ/n~ยังไม่มีข้อความ(0,1)โดยCochran ทฤษฎีบท ในที่สุดโดยการประยุกต์ใช้ของทฤษฎีบทของซึ, ˉ XและS2มีความเป็นอิสระ นี่ก็หมายความว่าสถิติที่เกิดขึ้นมีการแจกแจงแบบt-กับn-1องศาอิสระ(n-1)S2σ2~χn-12X¯S2เสื้อn-1

ถ้าการกระจายข้อมูลเดิมไม่ได้ตามปกติแล้วการกระจายแน่นอนของเศษและส่วนจะไม่เป็นมาตรฐานปกติและไค2ตามลำดับและทำให้สถิติที่เกิดจะไม่ได้มีเสื้อ -distributionFχ2เสื้อ


3
ฉันมักจะพบว่ามันน่าสนใจทีเดียวว่าเทคโนโลยีทางคณิตศาสตร์สามารถนำไปสู่ผลลัพธ์พื้นฐานเหล่านี้ในสถิติทางคณิตศาสตร์ได้อย่างไร
Matthew Drury

3
X¯Sχ2

2

ฉันคิดว่าอาจมีความสับสนระหว่างสถิติและสูตรเทียบกับการกระจายและสูตร คุณสามารถใช้สูตร t-statistic กับชุดข้อมูลใด ๆ และรับ "t-statistic" แต่สถิตินี้จะไม่ถูกกระจายตามการกระจายของนักเรียน -t เว้นแต่ว่าข้อมูลมาจากการแจกแจงแบบปกติ (หรืออย่างน้อยจะไม่เป็น รับประกันได้ว่าฉันเดาว่าการแจกแจงแบบไม่ปกติจะไม่ทำให้เกิดการกระจายตัวของนักเรียนเมื่อสูตร t-statistic ถูกนำไปใช้ แต่ฉันไม่แน่ใจเลย) เหตุผลนี้ก็คือการกระจายตัวของสถิติที่คำนวณจากการกระจายของข้อมูลที่สร้างขึ้นดังนั้นหากคุณมีการกระจายพื้นฐานที่แตกต่างกันแล้วคุณจะไม่รับประกันว่าจะมีการกระจายตัวเดียวกันสำหรับสถิติที่ได้รับ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.