คำถามเกี่ยวกับสมมติฐานทั่วไปของ t-test


9

สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่

หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม? ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่?

(ฉันหมายถึงที่นี่เพื่อทดสอบตัวอย่างหนึ่งตัวอย่างหรือเป็นอิสระ)


1
ค่าเฉลี่ยตัวอย่างเป็นตัวแปรสุ่มสามารถเป็นปกติได้หากชิ้นส่วนเดียวก็เป็นปกติเช่นกัน แต่คุณมีสิทธิ์: การทดสอบ t-asymptotically nonparametric (ไม่มีการแจกแจงแบบปกติ) แต่ยังคงความแปรปรวนภายในกลุ่ม (ในสถานการณ์สองตัวอย่าง) ควรมีความคล้ายคลึงและมีอยู่
Michael M

โดยผลต่างภายในกลุ่มมีความคล้ายคลึงกันคุณหมายถึงข้อสันนิษฐานของความแปรปรวนแบบเดียวกันหรือไม่? ถ้าเป็นเช่นนั้นการทดสอบ t-test ของ welch นั้นถูกต้องใช่ไหม?
Peter Nash

ใช่แล้ว ถ้าอิสระเสรีของเวลช์ที่ถูกแก้ไขไปถึงอนันต์กระบวนการของเขาก็จะถูกแจกจ่ายให้ฟรี
Michael M

คำตอบ:


9

สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่

t-statistic ประกอบด้วยอัตราส่วนของสองปริมาณซึ่งเป็นตัวแปรสุ่ม มันไม่เพียงประกอบด้วยตัวเศษ

เพื่อให้สถิติ t มีการแจกแจงแบบ t คุณไม่จำเป็นต้องแค่ว่าค่าเฉลี่ยตัวอย่างมีการแจกแจงแบบปกติ คุณต้อง:

  • ที่ s ในตัวส่วนเป็นเช่นนั้น s2/σ2χd2* * * *

  • ว่าตัวเศษและส่วนนั้นเป็นอิสระ

*(คุณค่าของ d ขึ้นอยู่กับการทดสอบ - ในตัวอย่างหนึ่ง t เรามี d=n1)

เพื่อให้สิ่งทั้งสามนี้เป็นจริงคุณจำเป็นต้องให้ข้อมูลดั้งเดิมกระจายอยู่ตามปกติ

หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม?

ลองใช้ iid ตามที่ให้ไว้สักครู่ เพื่อให้ CLT เก็บประชากรได้ต้องตรงกับเงื่อนไข ... - ประชากรจะต้องมีการกระจายที่ CLT ใช้ ดังนั้นไม่มีเนื่องจากมีการแจกแจงของประชากรที่ CLT ใช้ไม่ได้

ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่?

ไม่จริง ๆ แล้ว CLT ไม่ได้กล่าวคำเดียวเกี่ยวกับ "ขนาดตัวอย่างที่เหมาะสม"

จริงๆแล้วมันไม่ได้พูดอะไรเลยเกี่ยวกับสิ่งที่เกิดขึ้นที่ขนาดตัวอย่าง จำกัด ใด ๆ

ตอนนี้ฉันกำลังคิดถึงการกระจายสินค้าที่เฉพาะเจาะจง มันเป็นหนึ่งในที่ CLT แน่นอนไม่ใช้ แต่ที่n=1015การกระจายตัวของค่าเฉลี่ยตัวอย่างนั้นไม่ธรรมดา แต่ฉันสงสัยว่าตัวอย่างใด ๆ ในประวัติศาสตร์ของมนุษยชาติเคยมีคุณค่ามากมายในนั้น ดังนั้น - นอกเหนือจากการพูดซ้ำซาก - อะไรที่ 'สมเหตุสมผลnหมายถึงอะไร


ดังนั้นคุณมีปัญหาคู่:

ตอบ. ผลกระทบที่ผู้คนมักใช้กับ CLT ซึ่งเป็นวิธีการที่ใกล้ขึ้นเรื่อย ๆ ของการกระจายตัวของค่าเฉลี่ยตัวอย่างที่ขนาดตัวอย่างเล็ก / ปานกลาง - ไม่ได้ระบุจริงใน CLT **

B. "สิ่งที่อยู่ไม่ปกติจากตัวเศษ" ไม่เพียงพอที่จะทำให้สถิติมีการแจกแจงแบบ t

** (บางอย่างเช่นทฤษฎีบท Berry-Esseen ทำให้คุณได้รับสิ่งที่ผู้คนเห็นมากขึ้นเมื่อพวกเขาดูผลของการเพิ่มขนาดตัวอย่างจากการกระจายตัวของค่าเฉลี่ยตัวอย่าง)


ทฤษฎีบท CLT และ Slutsky ร่วมกันทำให้คุณ (ตราบเท่าที่ทุกข้อสันนิษฐานของพวกเขาถือ) เป็นเช่นนั้น nการกระจายตัวของ t-statistic ใกล้ถึงมาตรฐานปกติ ไม่ได้บอกว่ามี จำกัดn อาจจะเพียงพอสำหรับวัตถุประสงค์บางอย่าง


1
สำหรับสามสิ่งเหล่านี้ (ค่าปกติของค่าเฉลี่ยตัวอย่าง, ความแปรปรวนตัวอย่างและความเป็นอิสระของทั้งสอง] เป็นจริงจริง ๆ คุณต้องการให้มีการกระจายข้อมูลดั้งเดิมตามปกติ คุณกำลังบอกว่ามีเพียงคนธรรมดาเท่านั้นที่มีคุณสมบัติทั้งสามนี้? ฉันไม่ได้โต้แย้งคำแถลงนั้นผิดเพียงแค่สงสัยว่านั่นคือสิ่งที่คุณพูด
Andrew M

2
@AndrewM แน่นอนมีเพียงสามคนเท่านั้นที่มีร่วมกัน นอกจากนี้ในครั้งแรกหรือครั้งที่สามเพียงอย่างเดียวจะเพียงพอที่จะบ่งบอกปกติ - มีลักษณะที่สามปกติ ( Lukacs 1942 ) และหมายเลข จำกัด ของตัวแปรสุ่มอิสระเท่านั้นที่ปกติมีครั้งแรก ( ทฤษฎีบทการสลายตัวของ Cramer ) เป็นไปได้ว่ามีวิธีอื่นในการรับวินาที แต่ฉันไม่ทราบ
Glen_b

@AndrewM ในส่วนที่สองผลงานของ Ahsanullah (1987,1989) อาจเกี่ยวข้องกัน
Glen_b -Reinstate Monica

1
ขอบคุณสำหรับการอ้างอิงเหล่านั้น @Glen_b! ฉันไม่ทราบถึงผลลัพธ์ของ Lukacs และทฤษฎีการสลายตัวของ Cramer ตามที่ระบุไว้ค่อนข้างแข็งแกร่งกว่ารุ่นที่ฉันมีอยู่ด้านบนของหัวของฉัน (X iff ปกติ AX ปกติสำหรับเมทริกซ์ทั้งหมด A)
Andrew M

@AndrewM ความแตกต่างคือผลลัพธ์ที่คุณพูดถึงนั่นไม่ได้ขึ้นอยู่กับความเป็นอิสระในขณะที่ผลของ Cramer ทำ พวกเขาทั้งสองมีประโยชน์ในสถานที่ของพวกเขา
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.