ฉันมีการอ้างอิงที่แนะนำให้พิจารณาขนาดตัวอย่างขั้นต่ำ 20 สำหรับการกระจายข้อมูลที่เหมาะสม
มีความรู้สึกในเรื่องนี้หรือไม่?
ขอบคุณ
ฉันมีการอ้างอิงที่แนะนำให้พิจารณาขนาดตัวอย่างขั้นต่ำ 20 สำหรับการกระจายข้อมูลที่เหมาะสม
มีความรู้สึกในเรื่องนี้หรือไม่?
ขอบคุณ
คำตอบ:
สิ่งนี้ขึ้นอยู่กับการกระจายที่คาดหวังและคำถามการวิจัยของคุณคืออะไร ตามกฎของหัวแม่มือคุณควรระวังกฎของหัวแม่มือ หากคุณรู้ว่าการแจกแจงที่คาดหวังให้เรียกใช้การจำลองบางขนาดที่แตกต่างกันและกำหนดความถี่ที่การจำลองตัวอย่างสะท้อนการกระจายตัวจริง สิ่งนี้ควรให้คำแนะนำกับคุณเป็นขนาดตัวอย่างที่ต้องการขั้นสุดท้าย
Nope ไม่ไกล
ลองคิดแบบนี้: ถ้าคุณมีพื้นที่หนึ่งพันล้านมิติ (มนุษยชาติ) และคุณดึงตัวอย่าง 20 อันโดยใช้วิธีใดก็ได้ (20 คน) คุณสามารถใช้ข้อมูลที่ได้รับมาเพื่อให้พวกเขาเข้าใจคนทุกคนบนโลกได้ดีพอสมควรหรือไม่? ไม่ไกล มีกาแลคซีทางช้างเผือก โดยการเลือก (แบบสุ่ม) 20 คนจากนั้นคุณสามารถเข้าใจดาราศาสตร์กาแลคซีทั้งหมดได้หรือไม่ ไม่มีทาง.
ในพื้นที่ 1-d มีฮิวริสติกบางส่วนซึ่งเป็นกฎของหัวแม่มือที่สามารถใช้ได้ซึ่งอธิบายถึงจำนวนการวัดที่คุณต้องการใช้ พวกเขารวมถึงระดับของยูทิลิตี้ที่แตกต่างกันและการให้เหตุผล แต่ในความรู้สึกบางอย่างได้รับการปกป้องได้ดีกว่า "20" ซึ่งรวมถึง "5 การวัดต่อตัวแปรในสมการความพอดีของคุณ", "อย่างน้อย 35 ตัวอย่างของฟังก์ชันความหนาแน่นแบบเกาส์เซียน" และ "อย่างน้อย 300 ตัวอย่างของฟังก์ชันทวินาม" นักสถิติที่แท้จริงและไม่ใช่เครื่องบินทิ้งระเบิดอย่างฉันจะสามารถเชื่อมโยงช่วงความเชื่อมั่นและความไม่แน่นอนโดยเฉพาะจากหลักการแรกและไม่มีเครื่องคิดเลข
โปรดจำไว้ว่า "ดีที่สุด" เป็นความคิดที่ไร้ความหมายโดยไม่ต้องมี "การวัดความดี" เส้นทางที่ดีที่สุดคืออะไร หากคุณกำลังจะลงโทษคุณอาจจะยาวและน่ารื่นรมย์ หากคุณกำลังจะไปพิธีบรมราชาภิเษกของคุณเองอาจจะสั้นและงดงาม หากคุณกำลังเดินผ่านทะเลทรายเป็นร่มรื่นเย็นสบาย จำนวนตัวอย่างที่ "ดีที่สุด" คืออะไร? มันขึ้นอยู่กับปัญหาของคุณอย่างน่าทึ่งจนไม่สามารถตอบได้ด้วยสิทธิอำนาจก่อนหน้านั้น พวกเขาทุกคน? มากเท่าที่คุณสามารถ? สิ่งเหล่านั้นมีเหตุผลเพียงเล็กน้อยเท่านั้น ใช่มันเป็นเหมือนการตายบางส่วนหรือตั้งครรภ์ การไร้สาระบางส่วนเป็นผลมาจากปัญหาที่กำหนดไว้ไม่มาก
หากคุณกำลังพยายามคาดการณ์การไหลของอากาศบนเครื่องบินอย่างแม่นยำ? คุณอาจต้องใช้การวัดหลายล้านครั้งเพื่อเข้าไปในสวนบอล หากคุณต้องการทราบว่าคุณสูงแค่ไหนหนึ่งหรือสองคนอาจทำงานได้
สิ่งนี้ไม่ได้นำมาซึ่งประเด็นสำคัญของ "การขยายพื้นที่" และ "การสุ่มตัวอย่างในสถานที่ที่ลดความแปรปรวนในการประมาณค่าพารามิเตอร์" แต่คำถามที่เสนอแนะคำตอบระดับน้องจะมีความเกี่ยวข้องมากขึ้น สิ่งเหล่านี้ต้องการทราบเพิ่มเติมเกี่ยวกับลักษณะของปัญหาก่อนที่จะสามารถนำไปใช้ได้
หมายเหตุ: แก้ไขเพื่อปรับปรุงตามคำแนะนำ
บางทีสำหรับบริบทที่คุณกำลังทำการทดสอบแบบ T หรือ ANOVAR ซึ่งเป็นบริบทที่พบได้บ่อยในแอปพลิเคชันทางสถิติขั้นพื้นฐานขนาดของกลุ่มตัวอย่างที่คุณต้องการสำหรับแต่ละกลุ่มเพื่อให้มีความมั่นใจมากในค่าเฉลี่ยของแต่ละกลุ่ม การแจกแจงแบบปกติ (ตามทฤษฎีบทขีด จำกัด กลาง) เมื่อการแจกแจงสามารถสันนิษฐานได้ว่ามากหรือน้อย unimodal & ไม่สูงมาก ยี่สิบไม่ใช่เก้าสิบเอ็ดเพราะมันเป็นจำนวนรอบ
ตรวจสอบหน้ากำลังและขนาดตัวอย่างของ Russ Lenth สำหรับบทความบางเรื่องในหัวข้อ (ในส่วนคำแนะนำตรงกลางหน้า)
จำนวนบุคคลขั้นต่ำในตัวอย่างของคุณแตกต่างกันไปตามขนาดประชากรจำนวนมิติ (ถ้าคุณแบ่งข้อมูลเป็นหมวดหมู่) และการวัด (ถ้าคุณใช้มาตรการต่อเนื่องเกี่ยวกับ indivifuals ตัวอย่าง) คุณกำลังขนาดของ จักรวาลของคุณเทคนิคการวิเคราะห์ที่คุณตั้งใจจะใช้ (นี่เป็นประเด็นที่สำคัญมาก - มีการกำหนดเทคนิคไว้ในระหว่างการวางแผนการศึกษาหรือระหว่างการออกแบบการทดลองไม่เคยเกิดขึ้นหลัง) และความซับซ้อนที่แสดงโดยการศึกษาก่อนหน้า
และ 20 ก็ไม่เพียงพอสำหรับการวิจัยอย่างจริงจังนอกวิชา "โรคที่หายาก" และ "จิตวิทยาเชิงทดลอง" (psych as Popper ที่กำหนดไว้ในงานของเขา)
และ 20 ไม่เพียงพอสำหรับการวิจัยอย่างจริงจังใด ๆ นอกเรื่องของ "โรคที่หายาก" และ "การทดลองทางจิตวิทยา" (วิญญาณเป็นตกใจที่กำหนดไว้ในการทำงานของเขา) ที่เกี่ยวข้องกับการกระชับการกระจายความน่าจะเป็น
และไม่คุณไม่ควรทำให้คนเป็นพิษเพื่อให้ได้กลุ่มตัวอย่างที่มีขนาดใหญ่ สามัญสำนึกและการทดสอบตามลำดับเพื่อให้คุณหยุด