สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่
t-statistic ประกอบด้วยอัตราส่วนของสองปริมาณซึ่งเป็นตัวแปรสุ่ม มันไม่เพียงประกอบด้วยตัวเศษ
เพื่อให้สถิติ t มีการแจกแจงแบบ t คุณไม่จำเป็นต้องแค่ว่าค่าเฉลี่ยตัวอย่างมีการแจกแจงแบบปกติ คุณต้อง:
*(คุณค่าของ d ขึ้นอยู่กับการทดสอบ - ในตัวอย่างหนึ่ง t เรามี d=n−1)
เพื่อให้สิ่งทั้งสามนี้เป็นจริงคุณจำเป็นต้องให้ข้อมูลดั้งเดิมกระจายอยู่ตามปกติ
หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม?
ลองใช้ iid ตามที่ให้ไว้สักครู่ เพื่อให้ CLT เก็บประชากรได้ต้องตรงกับเงื่อนไข ... - ประชากรจะต้องมีการกระจายที่ CLT ใช้ ดังนั้นไม่มีเนื่องจากมีการแจกแจงของประชากรที่ CLT ใช้ไม่ได้
ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่?
ไม่จริง ๆ แล้ว CLT ไม่ได้กล่าวคำเดียวเกี่ยวกับ "ขนาดตัวอย่างที่เหมาะสม"
จริงๆแล้วมันไม่ได้พูดอะไรเลยเกี่ยวกับสิ่งที่เกิดขึ้นที่ขนาดตัวอย่าง จำกัด ใด ๆ
ตอนนี้ฉันกำลังคิดถึงการกระจายสินค้าที่เฉพาะเจาะจง มันเป็นหนึ่งในที่ CLT แน่นอนไม่ใช้ แต่ที่n=1015การกระจายตัวของค่าเฉลี่ยตัวอย่างนั้นไม่ธรรมดา แต่ฉันสงสัยว่าตัวอย่างใด ๆ ในประวัติศาสตร์ของมนุษยชาติเคยมีคุณค่ามากมายในนั้น ดังนั้น - นอกเหนือจากการพูดซ้ำซาก - อะไรที่ 'สมเหตุสมผลnหมายถึงอะไร
ดังนั้นคุณมีปัญหาคู่:
ตอบ. ผลกระทบที่ผู้คนมักใช้กับ CLT ซึ่งเป็นวิธีการที่ใกล้ขึ้นเรื่อย ๆ ของการกระจายตัวของค่าเฉลี่ยตัวอย่างที่ขนาดตัวอย่างเล็ก / ปานกลาง - ไม่ได้ระบุจริงใน CLT **
B. "สิ่งที่อยู่ไม่ปกติจากตัวเศษ" ไม่เพียงพอที่จะทำให้สถิติมีการแจกแจงแบบ t
** (บางอย่างเช่นทฤษฎีบท Berry-Esseen ทำให้คุณได้รับสิ่งที่ผู้คนเห็นมากขึ้นเมื่อพวกเขาดูผลของการเพิ่มขนาดตัวอย่างจากการกระจายตัวของค่าเฉลี่ยตัวอย่าง)
ทฤษฎีบท CLT และ Slutsky ร่วมกันทำให้คุณ (ตราบเท่าที่ทุกข้อสันนิษฐานของพวกเขาถือ) เป็นเช่นนั้น n→∞การกระจายตัวของ t-statistic ใกล้ถึงมาตรฐานปกติ ไม่ได้บอกว่ามี จำกัดn อาจจะเพียงพอสำหรับวัตถุประสงค์บางอย่าง