การความเหมาะสมของจะใช้สถิติต่อไปนี้: ในการทดสอบโดยอนุญาตให้ ตรงตามเงื่อนไขหนึ่งใช้ - การกระจายเพื่อคำนวณ p-value ที่กำหนดเป็นจริงหนึ่งจะสังเกตเห็นค่าดังกล่าวในตัวอย่างตัวแทนที่มีขนาดเดียวกัน
อย่างไรก็ตามเพื่อให้สถิติทำตามกระจาย (ที่มีองศาอิสระ ) จะต้องเป็นจริงที่: สำหรับอิสระมาตรฐานปกติ( Wikipedia ) เงื่อนไขสำหรับการทดสอบมีดังนี้ (อีกครั้งจากWikipedia ):
- ตัวแทนตัวอย่างประชากร
- ตัวอย่างขนาดใหญ่
- จำนวนเซลล์ที่คาดไว้มีขนาดใหญ่เพียงพอ
- ความเป็นอิสระระหว่างแต่ละประเภท
จากเงื่อนไข (1,2) เป็นที่ชัดเจนว่าเราตอบสนองเงื่อนไขสำหรับการอนุมานจากตัวอย่างไปยังประชากร (3) ดูเหมือนจะเป็นข้อสันนิษฐานที่ต้องการเนื่องจากแยกกันซึ่งอยู่ในตัวส่วนนั้นไม่ส่งผลให้มีการแจกแจงแบบใกล้ชิดต่อเนื่องสำหรับแต่ละและถ้ามันไม่ใหญ่พอมีข้อผิดพลาดที่สามารถแก้ไขได้ด้วยเยต 'การแก้ไข - นี่ดูเหมือนจะมาจากความจริงที่ว่าการกระจายแบบไม่ต่อเนื่องนั้นเป็นแบบ "ปูพื้น" อย่างต่อเนื่องดังนั้นการเปลี่ยนแปลงทีละสำหรับแต่ละอันจะแก้ไขสิ่งนี้
ความจำเป็นของ (4) ดูเหมือนว่าจะมีประโยชน์ในภายหลัง แต่ฉันไม่สามารถดูได้ว่า
ตอนแรกฉันคิดว่าจำเป็นสำหรับสถิติเพื่อให้ตรงกับการแจกแจง สิ่งนี้นำฉันไปสู่ข้อสันนิษฐานที่น่าสงสัยว่าซึ่งผิดอย่างแน่นอน ในความเป็นจริงเป็นที่ชัดเจนจากการลดขนาดของทั้งสองด้านของความเสมอภาคจากเป็นซึ่งไม่สามารถเกิดขึ้นได้
มันได้กลายเป็นที่ชัดเจนขอบคุณคำอธิบายของ whuberไม่จำเป็นต้องเท่ากับแต่ละคำเพราะ (หมายเหตุการลดจำนวนของตัวแปรสรุปเงิน) สำหรับมาตรฐานตัวแปรสุ่มปกติซึ่งเป็นหน้าที่ที่เป็นอิสระ
ดังนั้นคำถามของฉันคือติดตามการอย่างไร สิ่งที่ชนิดของการรวมกันของแต่ละแง่ผลในภาวะปกติมาตรฐาน Squared ? สิ่งนี้ต้องการการใช้ CLT อย่างเห็นได้ชัด (และนั่นสมเหตุสมผล) แต่อย่างไร กล่าวอีกนัยหนึ่งแต่ละอันมีค่าเท่ากับอะไร (หรือประมาณเท่ากับ)