ฉันได้รับการสอนเสมอว่า CLT ทำงานได้เมื่อคุณสุ่มตัวอย่างซ้ำโดยแต่ละตัวอย่างมีขนาดใหญ่พอ ตัวอย่างเช่นสมมติว่าฉันมีประเทศที่มีประชากร 1,000,000 คน ความเข้าใจของฉันเกี่ยวกับ CLT คือแม้ว่าการแจกแจงความสูงของพวกเขาไม่ปกติถ้าฉันเอาตัวอย่าง 1,000 คนจาก 50 คน (เช่นทำการสำรวจ 1,000 คนจาก 50 คนต่อคน) จากนั้นคำนวณความสูงเฉลี่ยของพวกเขาสำหรับตัวอย่างแต่ละตัวอย่าง หมายถึงจะเป็นเรื่องปกติ
อย่างไรก็ตามฉันไม่เคยเห็นกรณีโลกแห่งความจริงที่นักวิจัยได้ทำการสุ่มตัวอย่างซ้ำ แต่พวกเขาใช้ตัวอย่างใหญ่หนึ่งตัวอย่าง (เช่นสำรวจประชากร 50,000 คนเกี่ยวกับความสูงของพวกเขา) และทำงานจากนั้น
เพราะเหตุใดหนังสือสถิติสอนการสุ่มตัวอย่างซ้ำ ๆ และในนักวิจัยในโลกแห่งความเป็นจริงจึงทำการสุ่มตัวอย่างเพียงครั้งเดียว
แก้ไข: กรณีโลกแห่งความจริงที่ฉันกำลังคิดจะทำสถิติในชุดข้อมูลของผู้ใช้ twitter 50,000 คน ชุดข้อมูลนั้นไม่ได้เป็นตัวอย่างซ้ำ ๆ แต่เป็นเพียงตัวอย่างใหญ่หนึ่ง 50,000