เวทมนตร์หมายเลข 20 คืออะไร?


12

ฉันมีการอ้างอิงที่แนะนำให้พิจารณาขนาดตัวอย่างขั้นต่ำ 20 สำหรับการกระจายข้อมูลที่เหมาะสม

มีความรู้สึกในเรื่องนี้หรือไม่?

ขอบคุณ


3
โดยทั่วไปไม่ได้ในสถานการณ์ที่เฉพาะเจาะจงอาจจะ คุณมีการอ้างอิงและเป้าหมายของคุณคืออะไร?
image_doctor

1
ฉันเห็นด้วยกับ @image_doctor - ไม่มีเหตุผลทั่วไปว่าทำไมการสังเกต 20 ครั้งจึงถือเป็นขั้นต่ำ มันอาจเป็นกรณีในสถานการณ์ที่เฉพาะเจาะจงมาก
Glen_b -Reinstate Monica

3
เดียวคุ้มค่าจะทำงานในกรณีที่การปฏิบัติบางอย่างเช่นเมื่อกระจายเป็นที่รู้จักกัน (ด้วยความมั่นใจ) จะเป็น Poisson และสังเกตคือการนับขนาดใหญ่ ไม่เพียง แต่จะช่วยให้การกระจายมีความเหมาะสมเท่านั้น แต่ยังอนุญาตให้เกิดข้อผิดพลาดที่น่าจะเกิดขึ้นในการประเมินค่าพารามิเตอร์
whuber

1
ฉันเชื่อว่าฉันอ่านแล้วว่าสำหรับการแจกแจงแบบปกติ 30 เป็นกฎของหัวแม่มือ ดูเหมือนกับฉันมันเป็นสิ่งที่เกี่ยวข้องกับความใกล้ชิดของนักเรียนที่มีอิสระ 30 องศาเป็นเรื่องปกติ แต่มันก็เป็นกฎง่ายๆ มันไม่ได้เป็นความมหัศจรรย์ในความรู้สึกเดียวกันว่าค่าของเป็น e
Wayne

1
ใช่ 20 คือหมายเลขเวทย์มนตร์: en.wikipedia.org/wiki/Magic_number_%28physics%29
Bitwise

คำตอบ:


13

สิ่งนี้ขึ้นอยู่กับการกระจายที่คาดหวังและคำถามการวิจัยของคุณคืออะไร ตามกฎของหัวแม่มือคุณควรระวังกฎของหัวแม่มือ หากคุณรู้ว่าการแจกแจงที่คาดหวังให้เรียกใช้การจำลองบางขนาดที่แตกต่างกันและกำหนดความถี่ที่การจำลองตัวอย่างสะท้อนการกระจายตัวจริง สิ่งนี้ควรให้คำแนะนำกับคุณเป็นขนาดตัวอย่างที่ต้องการขั้นสุดท้าย


+1 สำหรับการบังคับทิศทางให้ชัดเจนและเข้มงวด
whuber

1
+1 ส่วนหนึ่งเนื่องจาก "ตามกฎทั่วไปคุณควรระวังกฎทั่วไป"
Wolfgang

7

z0.9750.50.5/1000=1.960.158=0.031

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.

n=20

h=1.06σ^n1/5=0.58σ^

ms(s/m)(3+(s/m)2)202
whuber

1
หน้าที่เชื่อมโยงไปยัง "Power-of-Ten Syndrome" ในบริบทของการใช้ 1,000 เป็นขนาดตัวอย่าง (ในบริบทของสถิติที่เกี่ยวข้องกับการเขียนโปรแกรม แต่ใช้กับที่อื่น): zedshaw.com/essays/programmer_stats.html
Gary S. Weaver

1
@ โฮเบอร์คุณฉลาดเกินไปไม่มีความผิด คนส่วนใหญ่จะคำนวณความเบ้เป็นช่วงเวลาของข้อมูลไม่ใช่ผ่านการตั้งสมมติฐานแบบที่คุณเพิ่งทำ ทีนี้ถ้าฉันพูดว่า "สมมติว่าคุณเหมาะสมกับการกระจายตัวของเพียร์สันด้วยวิธีช่วงเวลา" - การโต้แย้งนี้จะเกี่ยวข้องกันไหม?
StasK

ใช่มันจะเกี่ยวข้องในหลายกรณี ฉันทำตามคำแนะนำของคุณเพื่อให้พอดีกับการแจกแจงแบบปกติโดยใช้วิธีการของช่วงเวลาและได้รับความเบ้มาก - ไม่แปลกใจเลย นี่เป็นเพราะฉันจับคู่ช่วงเวลาสองช่วงแรกเท่านั้นทำให้คนที่สามเป็นคนที่เหมาะสม หากฉันต้องทำตามขั้นตอนเดียวกันกับตระกูลการกระจายของพารามิเตอร์สองตัวหรือน้อยกว่าที่อนุญาตช่วงเวลาที่สามที่มีขนาดใหญ่ตามอำเภอใจฉันคิดว่าฉันจะเห็นปรากฏการณ์เดียวกัน ด้วยครอบครัวเพียร์สันซึ่งมีพารามิเตอร์มากกว่าสองตัวเราน่าจะลองจับคู่ความเบ้เชิงประจักษ์ซึ่ง จำกัด มูลค่าของมัน
whuber

2

Nope ไม่ไกล

ลองคิดแบบนี้: ถ้าคุณมีพื้นที่หนึ่งพันล้านมิติ (มนุษยชาติ) และคุณดึงตัวอย่าง 20 อันโดยใช้วิธีใดก็ได้ (20 คน) คุณสามารถใช้ข้อมูลที่ได้รับมาเพื่อให้พวกเขาเข้าใจคนทุกคนบนโลกได้ดีพอสมควรหรือไม่? ไม่ไกล มีกาแลคซีทางช้างเผือก โดยการเลือก (แบบสุ่ม) 20 คนจากนั้นคุณสามารถเข้าใจดาราศาสตร์กาแลคซีทั้งหมดได้หรือไม่ ไม่มีทาง.

ในพื้นที่ 1-d มีฮิวริสติกบางส่วนซึ่งเป็นกฎของหัวแม่มือที่สามารถใช้ได้ซึ่งอธิบายถึงจำนวนการวัดที่คุณต้องการใช้ พวกเขารวมถึงระดับของยูทิลิตี้ที่แตกต่างกันและการให้เหตุผล แต่ในความรู้สึกบางอย่างได้รับการปกป้องได้ดีกว่า "20" ซึ่งรวมถึง "5 การวัดต่อตัวแปรในสมการความพอดีของคุณ", "อย่างน้อย 35 ตัวอย่างของฟังก์ชันความหนาแน่นแบบเกาส์เซียน" และ "อย่างน้อย 300 ตัวอย่างของฟังก์ชันทวินาม" นักสถิติที่แท้จริงและไม่ใช่เครื่องบินทิ้งระเบิดอย่างฉันจะสามารถเชื่อมโยงช่วงความเชื่อมั่นและความไม่แน่นอนโดยเฉพาะจากหลักการแรกและไม่มีเครื่องคิดเลข

a3r3+a2r2+a1r+a0a1r+a0dr

โปรดจำไว้ว่า "ดีที่สุด" เป็นความคิดที่ไร้ความหมายโดยไม่ต้องมี "การวัดความดี" เส้นทางที่ดีที่สุดคืออะไร หากคุณกำลังจะลงโทษคุณอาจจะยาวและน่ารื่นรมย์ หากคุณกำลังจะไปพิธีบรมราชาภิเษกของคุณเองอาจจะสั้นและงดงาม หากคุณกำลังเดินผ่านทะเลทรายเป็นร่มรื่นเย็นสบาย จำนวนตัวอย่างที่ "ดีที่สุด" คืออะไร? มันขึ้นอยู่กับปัญหาของคุณอย่างน่าทึ่งจนไม่สามารถตอบได้ด้วยสิทธิอำนาจก่อนหน้านั้น พวกเขาทุกคน? มากเท่าที่คุณสามารถ? สิ่งเหล่านั้นมีเหตุผลเพียงเล็กน้อยเท่านั้น ใช่มันเป็นเหมือนการตายบางส่วนหรือตั้งครรภ์ การไร้สาระบางส่วนเป็นผลมาจากปัญหาที่กำหนดไว้ไม่มาก

หากคุณกำลังพยายามคาดการณ์การไหลของอากาศบนเครื่องบินอย่างแม่นยำ? คุณอาจต้องใช้การวัดหลายล้านครั้งเพื่อเข้าไปในสวนบอล หากคุณต้องการทราบว่าคุณสูงแค่ไหนหนึ่งหรือสองคนอาจทำงานได้

สิ่งนี้ไม่ได้นำมาซึ่งประเด็นสำคัญของ "การขยายพื้นที่" และ "การสุ่มตัวอย่างในสถานที่ที่ลดความแปรปรวนในการประมาณค่าพารามิเตอร์" แต่คำถามที่เสนอแนะคำตอบระดับน้องจะมีความเกี่ยวข้องมากขึ้น สิ่งเหล่านี้ต้องการทราบเพิ่มเติมเกี่ยวกับลักษณะของปัญหาก่อนที่จะสามารถนำไปใช้ได้

หมายเหตุ: แก้ไขเพื่อปรับปรุงตามคำแนะนำ


1
ดูเหมือนว่าคุณจะอ่าน "ขั้นต่ำ" ในคำถามว่า "สูงสุด" หรือ "เพียงพอ" ไม่มีสิ่งใดที่คุณเขียนดูเหมือนจะขัดแย้งกับกฎง่ายๆอย่างน้อย 20 ข้อ
whuber

2
@whuber ฉันทำงานกับคนที่คิดว่าการวัดพิเศษมีราคาแพงและถ้าฉันให้ตัวอย่าง "จำนวนขั้นต่ำ" พวกเขาไม่คิดว่ามันเป็นความไม่เสมอภาคที่จำนวนตัวอย่างที่มีศักยภาพสูงกว่านั้น พวกเขาคิดว่ามันเป็นขอบเขตสำหรับปัญหาการปรับให้เหมาะสมของการลดต้นทุนให้ต่ำที่สุดและพยายามดำเนินการด้วยมูลค่านั้นเท่านั้น มันเป็นผลิตภัณฑ์ของสภาพแวดล้อมของฉัน
EngrStudent

1

บางทีสำหรับบริบทที่คุณกำลังทำการทดสอบแบบ T หรือ ANOVAR ซึ่งเป็นบริบทที่พบได้บ่อยในแอปพลิเคชันทางสถิติขั้นพื้นฐานขนาดของกลุ่มตัวอย่างที่คุณต้องการสำหรับแต่ละกลุ่มเพื่อให้มีความมั่นใจมากในค่าเฉลี่ยของแต่ละกลุ่ม การแจกแจงแบบปกติ (ตามทฤษฎีบทขีด จำกัด กลาง) เมื่อการแจกแจงสามารถสันนิษฐานได้ว่ามากหรือน้อย unimodal & ไม่สูงมาก ยี่สิบไม่ใช่เก้าสิบเอ็ดเพราะมันเป็นจำนวนรอบ


0

ตรวจสอบหน้ากำลังและขนาดตัวอย่างของ Russ Lenth สำหรับบทความบางเรื่องในหัวข้อ (ในส่วนคำแนะนำตรงกลางหน้า)

จำนวนบุคคลขั้นต่ำในตัวอย่างของคุณแตกต่างกันไปตามขนาดประชากรจำนวนมิติ (ถ้าคุณแบ่งข้อมูลเป็นหมวดหมู่) และการวัด (ถ้าคุณใช้มาตรการต่อเนื่องเกี่ยวกับ indivifuals ตัวอย่าง) คุณกำลังขนาดของ จักรวาลของคุณเทคนิคการวิเคราะห์ที่คุณตั้งใจจะใช้ (นี่เป็นประเด็นที่สำคัญมาก - มีการกำหนดเทคนิคไว้ในระหว่างการวางแผนการศึกษาหรือระหว่างการออกแบบการทดลองไม่เคยเกิดขึ้นหลัง) และความซับซ้อนที่แสดงโดยการศึกษาก่อนหน้า

และ 20 ก็ไม่เพียงพอสำหรับการวิจัยอย่างจริงจังนอกวิชา "โรคที่หายาก" และ "จิตวิทยาเชิงทดลอง" (psych as Popper ที่กำหนดไว้ในงานของเขา)

ปรับคำตอบตามความคิดเห็นด้านล่าง:

และ 20 ไม่เพียงพอสำหรับการวิจัยอย่างจริงจังใด ๆ นอกเรื่องของ "โรคที่หายาก" และ "การทดลองทางจิตวิทยา" (วิญญาณเป็นตกใจที่กำหนดไว้ในการทำงานของเขา) ที่เกี่ยวข้องกับการกระชับการกระจายความน่าจะเป็น

และไม่คุณไม่ควรทำให้คนเป็นพิษเพื่อให้ได้กลุ่มตัวอย่างที่มีขนาดใหญ่ สามัญสำนึกและการทดสอบตามลำดับเพื่อให้คุณหยุด


3
ฉันคิดว่ามันมากเกินไปที่จะให้คำแถลงแบบครอบคลุมว่ากลุ่มตัวอย่าง 20 คนนั้น "ไม่เพียงพอสำหรับการวิจัยที่จริงจัง" สิ่งนี้ขัดแย้งกับข้อความก่อนหน้าของคุณว่าขนาดตัวอย่างที่เหมาะสมนั้นแตกต่างกันไปตามวัตถุประสงค์ประชากรและอื่น ๆ ในบางกรณีผลการปลอมแปลงหนึ่งก็เพียงพอที่จะฆ่าทั้งทฤษฎี
whuber

1
กรณีศึกษาและการวิจัยเชิงคุณภาพสามารถทำได้ดีกับผู้เข้าร่วม 1-5 คน
Behacad

ตกลงเพิ่ม "กรณีศึกษา" และ "กลุ่มโฟกัส" ลงในรายการ :) สิ่งเหล่านี้รวมอยู่ในสิ่งที่ฉันพูดว่า Popper เรียกว่า "จิตวิทยาการทดลอง"
Lucas Gallindo

4
ถ้าอย่างนั้นคุณควรเพิ่มดาราศาสตร์ยาชีววิทยาเคมี ... อีกนัยหนึ่งมันไม่ดีเลยที่จะยืนยันว่า 20 นั้น "ไม่พอ" เพราะเป็นการยืนยันว่ามันดีพอ จริงๆแล้วมันอาจจะแย่กว่านั้น ลองนึกภาพการทดลองด้านความปลอดภัยของอาหารซึ่งผู้ทดลองแปดคนแรกที่ได้รับอาหารเสริมเสียชีวิตจากผลข้างเคียงที่ไม่คาดคิด คุณจะสนับสนุนการทดสอบอย่างต่อเนื่องโดยใช้คำสั่ง "20 ไม่เพียงพอ" ของคุณหรือไม่
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.