คำถามเกี่ยวกับสมมติฐานทั่วไปของ t-test

สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่

หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม? ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่?

(ฉันหมายถึงที่นี่เพื่อทดสอบตัวอย่างหนึ่งตัวอย่างหรือเป็นอิสระ)

— ปีเตอร์แนช
แหล่งที่มา

ค่าเฉลี่ยตัวอย่างเป็นตัวแปรสุ่มสามารถเป็นปกติได้หากชิ้นส่วนเดียวก็เป็นปกติเช่นกัน แต่คุณมีสิทธิ์: การทดสอบ t-asymptotically nonparametric (ไม่มีการแจกแจงแบบปกติ) แต่ยังคงความแปรปรวนภายในกลุ่ม (ในสถานการณ์สองตัวอย่าง) ควรมีความคล้ายคลึงและมีอยู่

— Michael M

โดยผลต่างภายในกลุ่มมีความคล้ายคลึงกันคุณหมายถึงข้อสันนิษฐานของความแปรปรวนแบบเดียวกันหรือไม่? ถ้าเป็นเช่นนั้นการทดสอบ t-test ของ welch นั้นถูกต้องใช่ไหม?

— Peter Nash

ใช่แล้ว ถ้าอิสระเสรีของเวลช์ที่ถูกแก้ไขไปถึงอนันต์กระบวนการของเขาก็จะถูกแจกจ่ายให้ฟรี

— Michael M

สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่

t-statistic ประกอบด้วยอัตราส่วนของสองปริมาณซึ่งเป็นตัวแปรสุ่ม มันไม่เพียงประกอบด้วยตัวเศษ

เพื่อให้สถิติ t มีการแจกแจงแบบ t คุณไม่จำเป็นต้องแค่ว่าค่าเฉลี่ยตัวอย่างมีการแจกแจงแบบปกติ คุณต้อง:

ที่ $s$ ในตัวส่วนเป็นเช่นนั้น $s^2/\sigma^2 \sim \chi^2_d$ * * * *
ว่าตัวเศษและส่วนนั้นเป็นอิสระ

*(คุณค่าของ $d$ ขึ้นอยู่กับการทดสอบ - ในตัวอย่างหนึ่ง $t$ เรามี $d=n-1$ )

เพื่อให้สิ่งทั้งสามนี้เป็นจริงคุณจำเป็นต้องให้ข้อมูลดั้งเดิมกระจายอยู่ตามปกติ

หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม?

ลองใช้ iid ตามที่ให้ไว้สักครู่ เพื่อให้ CLT เก็บประชากรได้ต้องตรงกับเงื่อนไข ... - ประชากรจะต้องมีการกระจายที่ CLT ใช้ ดังนั้นไม่มีเนื่องจากมีการแจกแจงของประชากรที่ CLT ใช้ไม่ได้

ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่?

ไม่จริง ๆ แล้ว CLT ไม่ได้กล่าวคำเดียวเกี่ยวกับ "ขนาดตัวอย่างที่เหมาะสม"

จริงๆแล้วมันไม่ได้พูดอะไรเลยเกี่ยวกับสิ่งที่เกิดขึ้นที่ขนาดตัวอย่าง จำกัด ใด ๆ

ตอนนี้ฉันกำลังคิดถึงการกระจายสินค้าที่เฉพาะเจาะจง มันเป็นหนึ่งในที่ CLT แน่นอนไม่ใช้ แต่ที่ $n=10^{15}$ การกระจายตัวของค่าเฉลี่ยตัวอย่างนั้นไม่ธรรมดา แต่ฉันสงสัยว่าตัวอย่างใด ๆ ในประวัติศาสตร์ของมนุษยชาติเคยมีคุณค่ามากมายในนั้น ดังนั้น - นอกเหนือจากการพูดซ้ำซาก - อะไรที่ 'สมเหตุสมผล $n$ หมายถึงอะไร

ดังนั้นคุณมีปัญหาคู่:

ตอบ. ผลกระทบที่ผู้คนมักใช้กับ CLT ซึ่งเป็นวิธีการที่ใกล้ขึ้นเรื่อย ๆ ของการกระจายตัวของค่าเฉลี่ยตัวอย่างที่ขนาดตัวอย่างเล็ก / ปานกลาง - ไม่ได้ระบุจริงใน CLT **

B. "สิ่งที่อยู่ไม่ปกติจากตัวเศษ" ไม่เพียงพอที่จะทำให้สถิติมีการแจกแจงแบบ t

** (บางอย่างเช่นทฤษฎีบท Berry-Esseen ทำให้คุณได้รับสิ่งที่ผู้คนเห็นมากขึ้นเมื่อพวกเขาดูผลของการเพิ่มขนาดตัวอย่างจากการกระจายตัวของค่าเฉลี่ยตัวอย่าง)

ทฤษฎีบท CLT และ Slutsky ร่วมกันทำให้คุณ (ตราบเท่าที่ทุกข้อสันนิษฐานของพวกเขาถือ) เป็นเช่นนั้น $n\to\infty$ การกระจายตัวของ t-statistic ใกล้ถึงมาตรฐานปกติ ไม่ได้บอกว่ามี จำกัด $n$ อาจจะเพียงพอสำหรับวัตถุประสงค์บางอย่าง

— Glen_b -Reinstate Monica
แหล่งที่มา

สำหรับสามสิ่งเหล่านี้ (ค่าปกติของค่าเฉลี่ยตัวอย่าง, ความแปรปรวนตัวอย่างและความเป็นอิสระของทั้งสอง] เป็นจริงจริง ๆ คุณต้องการให้มีการกระจายข้อมูลดั้งเดิมตามปกติ คุณกำลังบอกว่ามีเพียงคนธรรมดาเท่านั้นที่มีคุณสมบัติทั้งสามนี้? ฉันไม่ได้โต้แย้งคำแถลงนั้นผิดเพียงแค่สงสัยว่านั่นคือสิ่งที่คุณพูด

— Andrew M

@AndrewM แน่นอนมีเพียงสามคนเท่านั้นที่มีร่วมกัน นอกจากนี้ในครั้งแรกหรือครั้งที่สามเพียงอย่างเดียวจะเพียงพอที่จะบ่งบอกปกติ - มีลักษณะที่สามปกติ ( Lukacs 1942 ) และหมายเลข จำกัด ของตัวแปรสุ่มอิสระเท่านั้นที่ปกติมีครั้งแรก ( ทฤษฎีบทการสลายตัวของ Cramer ) เป็นไปได้ว่ามีวิธีอื่นในการรับวินาที แต่ฉันไม่ทราบ

— Glen_b

@AndrewM ในส่วนที่สองผลงานของ Ahsanullah (1987,1989) อาจเกี่ยวข้องกัน

— Glen_b -Reinstate Monica

ขอบคุณสำหรับการอ้างอิงเหล่านั้น @Glen_b! ฉันไม่ทราบถึงผลลัพธ์ของ Lukacs และทฤษฎีการสลายตัวของ Cramer ตามที่ระบุไว้ค่อนข้างแข็งแกร่งกว่ารุ่นที่ฉันมีอยู่ด้านบนของหัวของฉัน (

X \sim

$X \sim$ iff ปกติ

A X \sim

$AX \sim$ ปกติสำหรับเมทริกซ์ทั้งหมด

A

$A$ )

— Andrew M

@AndrewM ความแตกต่างคือผลลัพธ์ที่คุณพูดถึงนั่นไม่ได้ขึ้นอยู่กับความเป็นอิสระในขณะที่ผลของ Cramer ทำ พวกเขาทั้งสองมีประโยชน์ในสถานที่ของพวกเขา

— Glen_b -Reinstate Monica