เวย์นได้กล่าวถึงประเด็น "30" เป็นอย่างดีพอ (กฎง่ายๆของฉัน: การกล่าวถึงหมายเลข 30 ที่เกี่ยวกับสถิติน่าจะผิด)
เหตุใดจึงใช้ตัวเลขในบริเวณใกล้เคียง 1,000 ตัว
จำนวนประมาณ 1,000-2,000 มักใช้ในการสำรวจแม้ในกรณีที่มีสัดส่วนอย่างง่าย (" คุณชอบอะไร><> ?")
สิ่งนี้ทำเพื่อให้ได้การประมาณสัดส่วนที่แม่นยำอย่างสมเหตุสมผล
หากสันนิษฐานว่าสุ่มตัวอย่างทวินามความผิดพลาดมาตรฐาน * ของสัดส่วนตัวอย่างจะใหญ่ที่สุดเมื่อสัดส่วนคือ - แต่ขีด จำกัด สูงสุดนั้นยังคงเป็นค่าประมาณที่ดีสำหรับอัตราส่วนระหว่างประมาณ 25% ถึง 75%12
* "standard error" = "ค่าเบี่ยงเบนมาตรฐานของการแจกแจง"
เป้าหมายร่วมกันคือการประมาณเปอร์เซ็นต์ภายในประมาณของเปอร์เซ็นต์ที่แท้จริงประมาณของเวลา นั่นคือเรียกว่า ' ระยะขอบของข้อผิดพลาด '95 % 3 %±3%95%3%
ในข้อผิดพลาดมาตรฐาน 'กรณีที่เลวร้ายที่สุด' ภายใต้การสุ่มตัวอย่างแบบทวินามสิ่งนี้นำไปสู่:
1.96×12⋅(1−12)/n−−−−−−−−−−−√≤0.03
0.98×1/n−−−√≤0.03
n−−√≥0.98/0.03
n≥1067.11
... หรือ 'มากกว่า 1,000 บิต'
ดังนั้นถ้าคุณสำรวจคน 1,000 คนโดยการสุ่มจากประชากรที่คุณต้องการอ้างถึงและ 58% ของกลุ่มตัวอย่างสนับสนุนข้อเสนอคุณสามารถมั่นใจได้ว่าสัดส่วนประชากรอยู่ระหว่าง 55% ถึง 61%
(บางครั้งอาจใช้ค่าอื่น ๆ สำหรับระยะขอบของข้อผิดพลาดเช่น 2.5% หากคุณลดระยะขอบของข้อผิดพลาดลงครึ่งหนึ่งขนาดของกลุ่มตัวอย่างจะเพิ่มขึ้นเป็นทวีคูณของ 4)
ในการสำรวจที่ซับซ้อนซึ่งต้องการการประมาณสัดส่วนที่ถูกต้องในประชากรย่อยบางคน (เช่นสัดส่วนของบัณฑิตวิทยาลัยผิวดำจากเท็กซัสที่เห็นด้วยกับข้อเสนอ) ตัวเลขอาจมีขนาดใหญ่พอที่กลุ่มย่อยนั้นมีขนาดหลายร้อยบางที รวมถึงการตอบสนองนับหมื่นโดยรวม
เนื่องจากอาจกลายเป็นสิ่งที่ไม่สามารถทำได้อย่างรวดเร็วจึงเป็นเรื่องปกติที่จะแบ่งประชากรออกเป็นประชากรย่อย (strata) และสุ่มแต่ละตัวอย่างแยกกัน ถึงแม้ว่าคุณจะสามารถจบการสำรวจที่มีขนาดใหญ่มาก
ดูเหมือนว่าขนาดตัวอย่างที่มากกว่า 30 นั้นไม่มีจุดหมายเนื่องจากผลตอบแทนลดลง
มันขึ้นอยู่กับขนาดของเอฟเฟกต์และความแปรปรวนแบบสัมพันธ์ เอฟเฟกต์ต่อความแปรปรวนหมายความว่าคุณอาจต้องการตัวอย่างที่ค่อนข้างใหญ่ในบางสถานการณ์n−−√
ฉันตอบคำถามที่นี่ (ฉันคิดว่ามันมาจากวิศวกร) ที่จัดการกับกลุ่มตัวอย่างที่มีขนาดใหญ่มาก (ในบริเวณใกล้เคียงกับหนึ่งล้านถ้าฉันจำได้ถูกต้อง) แต่เขากำลังมองหาเอฟเฟกต์เล็ก ๆ น้อย ๆ
มาดูกันว่ากลุ่มตัวอย่างที่มีขนาดตัวอย่าง 30 เท่าให้อะไรกับเราเมื่อประมาณสัดส่วนตัวอย่าง
ลองนึกภาพเราถามคน 30 คนว่าพวกเขาได้รับการอนุมัติจากที่อยู่สหภาพหรือไม่ (เห็นด้วยอย่างยิ่งเห็นด้วยไม่เห็นด้วยไม่เห็นด้วยอย่างยิ่ง) ลองจินตนาการอีกว่าดอกเบี้ยอยู่ในสัดส่วนที่เห็นด้วยหรือเห็นด้วยอย่างยิ่ง
พูด 11 ข้อจากที่สัมภาษณ์เห็นด้วยและ 5 ข้อตกลงอย่างยิ่งรวมเป็น 16
16/30 ประมาณ 53% ขอบเขตของเราสำหรับสัดส่วนในประชากรคืออะไร (ด้วยช่วงเวลา 95%)
เราสามารถระบุสัดส่วนประชากรลงไปที่ระหว่าง 35% ถึง 71% (ประมาณ) หากสมมติฐานของเรามี
ไม่ใช่ทุกอย่างที่มีประโยชน์