เวทมนตร์หมายเลข 20 คืออะไร?

12

ฉันมีการอ้างอิงที่แนะนำให้พิจารณาขนาดตัวอย่างขั้นต่ำ 20 สำหรับการกระจายข้อมูลที่เหมาะสม

มีความรู้สึกในเรื่องนี้หรือไม่?

ขอบคุณ

sample-size

— fm3c2007
แหล่งที่มา

3

โดยทั่วไปไม่ได้ในสถานการณ์ที่เฉพาะเจาะจงอาจจะ คุณมีการอ้างอิงและเป้าหมายของคุณคืออะไร?

— image_doctor

1

ฉันเห็นด้วยกับ @image_doctor - ไม่มีเหตุผลทั่วไปว่าทำไมการสังเกต 20 ครั้งจึงถือเป็นขั้นต่ำ มันอาจเป็นกรณีในสถานการณ์ที่เฉพาะเจาะจงมาก

— Glen_b -Reinstate Monica

3

เดียวคุ้มค่าจะทำงานในกรณีที่การปฏิบัติบางอย่างเช่นเมื่อกระจายเป็นที่รู้จักกัน (ด้วยความมั่นใจ) จะเป็น Poisson และสังเกตคือการนับขนาดใหญ่ ไม่เพียง แต่จะช่วยให้การกระจายมีความเหมาะสมเท่านั้น แต่ยังอนุญาตให้เกิดข้อผิดพลาดที่น่าจะเกิดขึ้นในการประเมินค่าพารามิเตอร์

— whuber

1

ฉันเชื่อว่าฉันอ่านแล้วว่าสำหรับการแจกแจงแบบปกติ 30 เป็นกฎของหัวแม่มือ ดูเหมือนกับฉันมันเป็นสิ่งที่เกี่ยวข้องกับความใกล้ชิดของนักเรียนที่มีอิสระ 30 องศาเป็นเรื่องปกติ แต่มันก็เป็นกฎง่ายๆ มันไม่ได้เป็นความมหัศจรรย์ในความรู้สึกเดียวกันว่าค่าของเป็น

e

$e$

— Wayne

1

ใช่ 20 คือหมายเลขเวทย์มนตร์: en.wikipedia.org/wiki/Magic_number_%28physics%29

— Bitwise

13

สิ่งนี้ขึ้นอยู่กับการกระจายที่คาดหวังและคำถามการวิจัยของคุณคืออะไร ตามกฎของหัวแม่มือคุณควรระวังกฎของหัวแม่มือ หากคุณรู้ว่าการแจกแจงที่คาดหวังให้เรียกใช้การจำลองบางขนาดที่แตกต่างกันและกำหนดความถี่ที่การจำลองตัวอย่างสะท้อนการกระจายตัวจริง สิ่งนี้ควรให้คำแนะนำกับคุณเป็นขนาดตัวอย่างที่ต้องการขั้นสุดท้าย

— doug.numbers
แหล่งที่มา

+1 สำหรับการบังคับทิศทางให้ชัดเจนและเข้มงวด

— whuber

1

+1 ส่วนหนึ่งเนื่องจาก "ตามกฎทั่วไปคุณควรระวังกฎทั่วไป"

— Wolfgang

7

z_{0.975} \sqrt{0.5 \cdot 0.5 / 1000} = 1.96 \cdot 0.158 = 0.031

$z_{0.975}\sqrt{0.5\cdot0.5/1000} = 1.96 \cdot 0.158 = 0.031$

| skewness | \leq \frac{n - 2}{\sqrt{n - 1}} = 4.58, | kurtosis | \leq \frac{n^{2} - 3 n + 3}{n - 1} = 18.05.

$|\mbox{skewness}| \le \frac{n-2}{\sqrt{n-1}} = 4.58, |\mbox{kurtosis}| \le \frac{n^2 - 3n + 3}{n-1} = 18.05.$

$n=20$

h = 1.06 \hat{σ} n^{- 1 / 5} = 0.58 \hat{σ}

$h=1.06 \hat\sigma n^{-1/5}=0.58\hat\sigma$

— StasK
แหล่งที่มา

m

$m$

s

$s$

(s / m) (3 + (s / m)^{2})

$(s/m)(3 + (s/m)^2)$

20

$20$

2

$2$

— whuber

1

หน้าที่เชื่อมโยงไปยัง "Power-of-Ten Syndrome" ในบริบทของการใช้ 1,000 เป็นขนาดตัวอย่าง (ในบริบทของสถิติที่เกี่ยวข้องกับการเขียนโปรแกรม แต่ใช้กับที่อื่น): zedshaw.com/essays/programmer_stats.html

— Gary S. Weaver

1

@ โฮเบอร์คุณฉลาดเกินไปไม่มีความผิด คนส่วนใหญ่จะคำนวณความเบ้เป็นช่วงเวลาของข้อมูลไม่ใช่ผ่านการตั้งสมมติฐานแบบที่คุณเพิ่งทำ ทีนี้ถ้าฉันพูดว่า "สมมติว่าคุณเหมาะสมกับการกระจายตัวของเพียร์สันด้วยวิธีช่วงเวลา" - การโต้แย้งนี้จะเกี่ยวข้องกันไหม?

— StasK

ใช่มันจะเกี่ยวข้องในหลายกรณี ฉันทำตามคำแนะนำของคุณเพื่อให้พอดีกับการแจกแจงแบบปกติโดยใช้วิธีการของช่วงเวลาและได้รับความเบ้มาก - ไม่แปลกใจเลย นี่เป็นเพราะฉันจับคู่ช่วงเวลาสองช่วงแรกเท่านั้นทำให้คนที่สามเป็นคนที่เหมาะสม หากฉันต้องทำตามขั้นตอนเดียวกันกับตระกูลการกระจายของพารามิเตอร์สองตัวหรือน้อยกว่าที่อนุญาตช่วงเวลาที่สามที่มีขนาดใหญ่ตามอำเภอใจฉันคิดว่าฉันจะเห็นปรากฏการณ์เดียวกัน ด้วยครอบครัวเพียร์สันซึ่งมีพารามิเตอร์มากกว่าสองตัวเราน่าจะลองจับคู่ความเบ้เชิงประจักษ์ซึ่ง จำกัด มูลค่าของมัน

— whuber

2

Nope ไม่ไกล

ลองคิดแบบนี้: ถ้าคุณมีพื้นที่หนึ่งพันล้านมิติ (มนุษยชาติ) และคุณดึงตัวอย่าง 20 อันโดยใช้วิธีใดก็ได้ (20 คน) คุณสามารถใช้ข้อมูลที่ได้รับมาเพื่อให้พวกเขาเข้าใจคนทุกคนบนโลกได้ดีพอสมควรหรือไม่? ไม่ไกล มีกาแลคซีทางช้างเผือก โดยการเลือก (แบบสุ่ม) 20 คนจากนั้นคุณสามารถเข้าใจดาราศาสตร์กาแลคซีทั้งหมดได้หรือไม่ ไม่มีทาง.

ในพื้นที่ 1-d มีฮิวริสติกบางส่วนซึ่งเป็นกฎของหัวแม่มือที่สามารถใช้ได้ซึ่งอธิบายถึงจำนวนการวัดที่คุณต้องการใช้ พวกเขารวมถึงระดับของยูทิลิตี้ที่แตกต่างกันและการให้เหตุผล แต่ในความรู้สึกบางอย่างได้รับการปกป้องได้ดีกว่า "20" ซึ่งรวมถึง "5 การวัดต่อตัวแปรในสมการความพอดีของคุณ", "อย่างน้อย 35 ตัวอย่างของฟังก์ชันความหนาแน่นแบบเกาส์เซียน" และ "อย่างน้อย 300 ตัวอย่างของฟังก์ชันทวินาม" นักสถิติที่แท้จริงและไม่ใช่เครื่องบินทิ้งระเบิดอย่างฉันจะสามารถเชื่อมโยงช่วงความเชื่อมั่นและความไม่แน่นอนโดยเฉพาะจากหลักการแรกและไม่มีเครื่องคิดเลข

$\int {\int {\frac {a_3{r^3}+a_2{r^2}+a_1r+a_0}{a_1r+a_0}}} dr$

โปรดจำไว้ว่า "ดีที่สุด" เป็นความคิดที่ไร้ความหมายโดยไม่ต้องมี "การวัดความดี" เส้นทางที่ดีที่สุดคืออะไร หากคุณกำลังจะลงโทษคุณอาจจะยาวและน่ารื่นรมย์ หากคุณกำลังจะไปพิธีบรมราชาภิเษกของคุณเองอาจจะสั้นและงดงาม หากคุณกำลังเดินผ่านทะเลทรายเป็นร่มรื่นเย็นสบาย จำนวนตัวอย่างที่ "ดีที่สุด" คืออะไร? มันขึ้นอยู่กับปัญหาของคุณอย่างน่าทึ่งจนไม่สามารถตอบได้ด้วยสิทธิอำนาจก่อนหน้านั้น พวกเขาทุกคน? มากเท่าที่คุณสามารถ? สิ่งเหล่านั้นมีเหตุผลเพียงเล็กน้อยเท่านั้น ใช่มันเป็นเหมือนการตายบางส่วนหรือตั้งครรภ์ การไร้สาระบางส่วนเป็นผลมาจากปัญหาที่กำหนดไว้ไม่มาก

หากคุณกำลังพยายามคาดการณ์การไหลของอากาศบนเครื่องบินอย่างแม่นยำ? คุณอาจต้องใช้การวัดหลายล้านครั้งเพื่อเข้าไปในสวนบอล หากคุณต้องการทราบว่าคุณสูงแค่ไหนหนึ่งหรือสองคนอาจทำงานได้

สิ่งนี้ไม่ได้นำมาซึ่งประเด็นสำคัญของ "การขยายพื้นที่" และ "การสุ่มตัวอย่างในสถานที่ที่ลดความแปรปรวนในการประมาณค่าพารามิเตอร์" แต่คำถามที่เสนอแนะคำตอบระดับน้องจะมีความเกี่ยวข้องมากขึ้น สิ่งเหล่านี้ต้องการทราบเพิ่มเติมเกี่ยวกับลักษณะของปัญหาก่อนที่จะสามารถนำไปใช้ได้

หมายเหตุ: แก้ไขเพื่อปรับปรุงตามคำแนะนำ

— EngrStudent
แหล่งที่มา

1

ดูเหมือนว่าคุณจะอ่าน "ขั้นต่ำ" ในคำถามว่า "สูงสุด" หรือ "เพียงพอ" ไม่มีสิ่งใดที่คุณเขียนดูเหมือนจะขัดแย้งกับกฎง่ายๆอย่างน้อย 20 ข้อ

— whuber

2

@whuber ฉันทำงานกับคนที่คิดว่าการวัดพิเศษมีราคาแพงและถ้าฉันให้ตัวอย่าง "จำนวนขั้นต่ำ" พวกเขาไม่คิดว่ามันเป็นความไม่เสมอภาคที่จำนวนตัวอย่างที่มีศักยภาพสูงกว่านั้น พวกเขาคิดว่ามันเป็นขอบเขตสำหรับปัญหาการปรับให้เหมาะสมของการลดต้นทุนให้ต่ำที่สุดและพยายามดำเนินการด้วยมูลค่านั้นเท่านั้น มันเป็นผลิตภัณฑ์ของสภาพแวดล้อมของฉัน

— EngrStudent

1

บางทีสำหรับบริบทที่คุณกำลังทำการทดสอบแบบ T หรือ ANOVAR ซึ่งเป็นบริบทที่พบได้บ่อยในแอปพลิเคชันทางสถิติขั้นพื้นฐานขนาดของกลุ่มตัวอย่างที่คุณต้องการสำหรับแต่ละกลุ่มเพื่อให้มีความมั่นใจมากในค่าเฉลี่ยของแต่ละกลุ่ม การแจกแจงแบบปกติ (ตามทฤษฎีบทขีด จำกัด กลาง) เมื่อการแจกแจงสามารถสันนิษฐานได้ว่ามากหรือน้อย unimodal & ไม่สูงมาก ยี่สิบไม่ใช่เก้าสิบเอ็ดเพราะมันเป็นจำนวนรอบ

— Scortchi - Reinstate Monica
แหล่งที่มา

0

ตรวจสอบหน้ากำลังและขนาดตัวอย่างของ Russ Lenth สำหรับบทความบางเรื่องในหัวข้อ (ในส่วนคำแนะนำตรงกลางหน้า)

จำนวนบุคคลขั้นต่ำในตัวอย่างของคุณแตกต่างกันไปตามขนาดประชากรจำนวนมิติ (ถ้าคุณแบ่งข้อมูลเป็นหมวดหมู่) และการวัด (ถ้าคุณใช้มาตรการต่อเนื่องเกี่ยวกับ indivifuals ตัวอย่าง) คุณกำลังขนาดของ จักรวาลของคุณเทคนิคการวิเคราะห์ที่คุณตั้งใจจะใช้ (นี่เป็นประเด็นที่สำคัญมาก - มีการกำหนดเทคนิคไว้ในระหว่างการวางแผนการศึกษาหรือระหว่างการออกแบบการทดลองไม่เคยเกิดขึ้นหลัง) และความซับซ้อนที่แสดงโดยการศึกษาก่อนหน้า

และ 20 ก็ไม่เพียงพอสำหรับการวิจัยอย่างจริงจังนอกวิชา "โรคที่หายาก" และ "จิตวิทยาเชิงทดลอง" (psych as Popper ที่กำหนดไว้ในงานของเขา)

ปรับคำตอบตามความคิดเห็นด้านล่าง:

และ 20 ไม่เพียงพอสำหรับการวิจัยอย่างจริงจังใด ๆ นอกเรื่องของ "โรคที่หายาก" และ "การทดลองทางจิตวิทยา" (วิญญาณเป็นตกใจที่กำหนดไว้ในการทำงานของเขา) ที่เกี่ยวข้องกับการกระชับการกระจายความน่าจะเป็น

และไม่คุณไม่ควรทำให้คนเป็นพิษเพื่อให้ได้กลุ่มตัวอย่างที่มีขนาดใหญ่ สามัญสำนึกและการทดสอบตามลำดับเพื่อให้คุณหยุด

— Lucas Gallindo
แหล่งที่มา

3

ฉันคิดว่ามันมากเกินไปที่จะให้คำแถลงแบบครอบคลุมว่ากลุ่มตัวอย่าง 20 คนนั้น "ไม่เพียงพอสำหรับการวิจัยที่จริงจัง" สิ่งนี้ขัดแย้งกับข้อความก่อนหน้าของคุณว่าขนาดตัวอย่างที่เหมาะสมนั้นแตกต่างกันไปตามวัตถุประสงค์ประชากรและอื่น ๆ ในบางกรณีผลการปลอมแปลงหนึ่งก็เพียงพอที่จะฆ่าทั้งทฤษฎี

— whuber

1

กรณีศึกษาและการวิจัยเชิงคุณภาพสามารถทำได้ดีกับผู้เข้าร่วม 1-5 คน

— Behacad

ตกลงเพิ่ม "กรณีศึกษา" และ "กลุ่มโฟกัส" ลงในรายการ :) สิ่งเหล่านี้รวมอยู่ในสิ่งที่ฉันพูดว่า Popper เรียกว่า "จิตวิทยาการทดลอง"

— Lucas Gallindo

4

ถ้าอย่างนั้นคุณควรเพิ่มดาราศาสตร์ยาชีววิทยาเคมี ... อีกนัยหนึ่งมันไม่ดีเลยที่จะยืนยันว่า 20 นั้น "ไม่พอ" เพราะเป็นการยืนยันว่ามันดีพอ จริงๆแล้วมันอาจจะแย่กว่านั้น ลองนึกภาพการทดลองด้านความปลอดภัยของอาหารซึ่งผู้ทดลองแปดคนแรกที่ได้รับอาหารเสริมเสียชีวิตจากผลข้างเคียงที่ไม่คาดคิด คุณจะสนับสนุนการทดสอบอย่างต่อเนื่องโดยใช้คำสั่ง "20 ไม่เพียงพอ" ของคุณหรือไม่

— whuber