ทำไม 600 จาก 1,000 จึงน่าเชื่อถือมากกว่า 6 จาก 10?


41

ดูข้อความที่ตัดตอนมาจาก "คู่มือทักษะการศึกษา", Palgrave, 2012, โดย Stella Cottrell, หน้า 155:

เปอร์เซ็นต์แจ้งให้ทราบเมื่อได้รับร้อยละ
สมมติว่าคำสั่งด้านบนอ่านแทน:

60% ของคนชอบส้ม 40% กล่าวว่าพวกเขาชอบแอปเปิ้ล

สิ่งนี้ดูน่าเชื่อถือ: มีการระบุปริมาณที่เป็นตัวเลข แต่ความแตกต่างระหว่าง 60% และ 40% อย่างมีนัยสำคัญคืออะไร? ที่นี่เราจะต้องรู้ว่ามีคนถามกี่คน หากมีคน 1,000 คนถูกถามถึงส้มที่ต้องการ 600 ตัวจำนวนนั้นจะน่าเชื่อถือ อย่างไรก็ตามหากมีผู้ถูกถามเพียง 10 คน 60% หมายถึงส้มที่ต้องการ 6 คน "60%" ฟังดูน่าเชื่อถือในแบบที่ "6 จาก 10" ไม่ ในฐานะผู้อ่านที่สำคัญคุณต้องระวังเปอร์เซ็นต์ที่ใช้ในการทำให้ข้อมูลไม่เพียงพอดูน่าประทับใจ

ลักษณะนี้เรียกว่าอะไรในสถิติ ฉันต้องการอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้


38
เรื่องขนาดตัวอย่าง
Aksakal

36
ฉันเลือกคนสองคนโดยการสุ่มพวกเขาเป็นทั้งชายและดังนั้นฉันจึงสรุปได้ว่า 100% ของคนอเมริกันเป็นผู้ชาย เชื่อ?
Casey

2
มันเป็นหลักการ "อย่าเปรียบเทียบแอปเปิ้ลกับส้ม" หลักการ
wolfies

2
ในการเข้าถึงคำถามนั้นจากมุมที่แตกต่างคุณอาจลองขุดวรรณกรรมของเอฟเฟกต์การทำเฟรม อย่างไรก็ตามมันเป็นตัวอย่างของความเอนเอียงทางปัญญาและเป็นหัวข้อทางจิตวิทยาไม่ใช่เชิงสถิติ
Larx

2
คุณสามารถจินตนาการถึงความแตกต่างของ 1 ว่ามันจะส่งผลกระทบต่อปริมาณโดยประมาณ 7/10 นั้นค่อนข้างไกลจาก 6/10 มากกว่า 601/1000 จาก 600/1000
คณิตศาสตร์ที่

คำตอบ:


54

ฉันต้องการแสดงตัวอย่างที่ใช้งานง่ายอีกตัวอย่างหนึ่ง

สมมติว่าฉันบอกคุณฉันสามารถทำนายผลของการพลิกเหรียญใด ๆ คุณไม่เชื่อและต้องการทดสอบความสามารถของฉัน

คุณทดสอบ 5 ครั้งแล้วฉันก็ทำให้ถูกต้องทั้งหมด คุณเชื่อว่าฉันมีความสามารถพิเศษหรือไม่? อาจจะไม่. เพราะฉันสามารถทำให้พวกเขาทั้งหมดถูกโอกาส (โดยเฉพาะสมมติว่าเหรียญเป็นเหรียญที่ยุติธรรมและการทดลองแต่ละครั้งนั้นเป็นอิสระจากนั้นฉันจะได้รับสิทธิ์ทั้งหมดด้วยโดยไม่มีพลังวิเศษใด ๆ ดูลิงก์ของ Shufflepants สำหรับเรื่องตลกเกี่ยวกับเรื่องนี้)0.550.03

ในทางกลับกันถ้าคุณทดสอบฉันเป็นจำนวนมากมันก็ไม่น่าเป็นไปได้ที่ฉันจะได้มันมาโดยบังเอิญ ตัวอย่างเช่นถ้าคุณผ่านการทดสอบครั้งน่าจะเป็นของฉันได้รับทั้งหมดของพวกเขาที่ถูกต้องคือ01000.51000


แนวคิดทางสถิติเรียกว่าพลังทางสถิติจาก Wikipeida

พลังของการทดสอบสมมติฐานแบบไบนารีคือความน่าจะเป็นที่การทดสอบจะปฏิเสธสมมติฐานว่าง (H0) ได้อย่างถูกต้องเมื่อสมมติฐานทางเลือก (H1) เป็นจริง

กลับไปที่พลังอันยิ่งใหญ่ของตัวอย่างการโยนเหรียญโดยพื้นฐานแล้วคุณต้องการทำการทดสอบสมมติฐาน

  • สมมติฐานว่างเปล่า (H0): ฉันไม่มีพลังวิเศษ
  • สมมติฐานทางเลือก (H1): ฉันมีพลังวิเศษ

ตอนนี้อย่างที่คุณเห็นในตัวอย่างตัวเลข (ทดสอบฉัน 5 ครั้งเทียบกับทดสอบ 100 ครั้ง) กำลังทางสถิติได้รับผลกระทบจากขนาดตัวอย่าง

เพิ่มเติมเพื่อที่จะอ่านที่นี่ (ทางเทคนิคมากขึ้นและขึ้นอยู่กับการทดสอบ t)

เครื่องมือโต้ตอบที่จะเข้าใจพลังทางสถิติที่สามารถพบได้ที่นี่ หมายเหตุพลังทางสถิติจะเปลี่ยนไปตามขนาดตัวอย่าง!

ป้อนคำอธิบายรูปภาพที่นี่


24
บังคับXKCD
Shufflepants

5
สิ่งนี้ไม่ได้ตอบคำถาม คำถามมีสองส่วน: "ทำไม [มัน] น่าเชื่อถือมากขึ้น ... " และ "ลักษณะนี้เรียกว่าอะไรในสถิติ" คุณให้ตัวอย่างที่ถามผู้อ่านว่าพวกเขามีความเชื่อมั่นมากขึ้นจากตัวอย่าง แต่คุณยังไม่ได้อธิบายปรากฏการณ์และไม่พยายามที่จะอธิบายว่าทำไมมันจึงน่าเชื่อถือมากขึ้น นอกจากนี้คุณยังไม่ได้สัมผัสกับคำถามที่สอง: หากคุณเชื่อว่าปรากฏการณ์นี้ไม่มีชื่อให้ระบุอย่างชัดเจน
Makyen

1
@Mayken นั่นเป็นคำตอบที่พยายามอย่างชัดเจน มันไม่ใช่คำตอบที่ยิ่งใหญ่และไม่ใช่คำตอบที่สมบูรณ์ แต่คำตอบบางส่วนหรือแบบโสคราตีสไม่ใช่เหตุผลที่อ้างว่ามันไม่ใช่คำตอบเลย คำถามควรถามคำถามหนึ่งข้อและหากพวกเขาถามคำถามหลายข้อฉันคิดว่ามันสมเหตุสมผลอย่างสมบูรณ์แบบ (ถ้าน้อยกว่าอุดมคติ) เพื่อตอบคำถามบางข้อเท่านั้น หากคุณรู้สึกว่ามันเป็นคำตอบที่ไม่ดีคุณจะสามารถแก้ไขปัญหาที่คุณเห็นว่าเป็นปัญหาได้อย่างแน่นอน [สำหรับเรื่องนั้นฉันไม่คิดว่าฉันจะตอบคำถามที่สองเช่นกัน; ฉันพูดถึงผลกระทบเท่านั้น ไม่ใช่ทุกปรากฏการณ์ที่จะมีชื่อที่ชัดเจน]
Glen_b

1
ฉันไม่สามารถช่วยได้ แต่รู้สึกว่า 100% เป็นกรณีพิเศษและคำตอบนี้ไม่สนับสนุนสัญชาตญาณของฉันจริง ๆ ว่า 600/1000 น่าเชื่อถือมากกว่า 6/10 แม้ว่าเราจะไม่ได้เป็นกรณีพิเศษนี่เป็นเพียงแค่การแก้ไขปัญหาด้วยเปอร์เซ็นต์ที่แตกต่างกัน
NotThatGuy

2
@ จูยะมันเป็นเครื่องมือบนเว็บที่สร้างขึ้นโดยใครบางคน คุณสามารถลองได้ที่นี่
Haitao Du

29

คิดในแง่ของสัดส่วน สมมติว่าการเลือกส้มเป็นความสำเร็จในขณะที่การเลือกแอปเปิ้ลนั้นเป็นความล้มเหลว ดังนั้นอัตราความสำเร็จเฉลี่ยของคุณคือหรือในกรณีนี้. 6μ=# of sucessesn

ข้อผิดพลาดมาตรฐานของปริมาณนี้คาดว่าจะ{n}} สำหรับขนาดของกลุ่มตัวอย่างขนาดเล็ก (เช่น 10) ข้อผิดพลาดมาตรฐานคือแต่สำหรับขนาดของกลุ่มตัวอย่าง 1000 ข้อผิดพลาดมาตรฐานคือ0.0155 ดังนั้นโดยพื้นฐานดังที่ได้กล่าวไว้ในความคิดเห็น "ขนาดตัวอย่างมีความสำคัญ"μ(1μ)n.155.0155


17

แนวคิดนี้เป็นผลมาจากกฎหมายจำนวนมาก จากวิกิพีเดีย ,

ตามกฎหมายแล้วค่าเฉลี่ยของผลลัพธ์ที่ได้จากการทดลองจำนวนมากควรจะใกล้เคียงกับค่าที่คาดหวังและจะมีแนวโน้มที่จะเข้าใกล้เมื่อทำการทดลองมากขึ้น

ผลลัพธ์จากกลุ่มตัวอย่างขนาดเล็กอาจไกลจากค่าที่คาดหวังมากกว่ากลุ่มตัวอย่างขนาดใหญ่ และอย่างที่ระบุไว้ในคำถามเราควรระมัดระวังผลลัพธ์ที่คำนวณจากกลุ่มตัวอย่างขนาดเล็ก ความคิดนี้ยังจะมีการอธิบายสวยดีในวิดีโอ YouTube นี้


5
มีทฤษฎีบทที่รู้จักกันดีหลายอย่างที่รู้จักกันในสถิติว่า "กฎของจำนวนมาก" แต่ก็ไม่มีทฤษฎีใดที่สร้างประโยคที่ดูเหมือนในคำถาม คุณสร้างการเชื่อมต่อได้อย่างไร
whuber

3
จาก wikipedia en.wikipedia.org/wiki/Law_of_large_numbers "ตามกฎหมายค่าเฉลี่ยของผลลัพธ์ที่ได้จากการทดลองจำนวนมากควรใกล้เคียงกับค่าที่คาดหวังและจะมีแนวโน้มที่จะเข้าใกล้เมื่อมีการทดลองเพิ่มขึ้น" . ผลลัพธ์จากกลุ่มตัวอย่างขนาดเล็กอาจไกลจากค่าที่คาดหวังมากกว่ากลุ่มตัวอย่างขนาดใหญ่ และอย่างที่ระบุไว้ในคำถามเราควรระมัดระวังผลลัพธ์ที่คำนวณจากกลุ่มตัวอย่างขนาดเล็ก
Evan Phibbs

6
นั่นเป็นคำอธิบายที่ดีขอบคุณ แม้ว่าคุณจะถูกต้องที่จะเขียนว่าควรระมัดระวังเกี่ยวกับจำนวน "การทดลองจำนวนมาก" ที่จำเป็นต้องมีเพื่อให้กฎหมายเชื่อถือได้ ฉันอยากจะแนะนำว่าคำอธิบายของคุณอยู่ในคำตอบของคุณซึ่งมันจะถูกอ่านและชื่นชมอย่างกว้างขวางมากกว่าที่จะฝังไว้ในความคิดเห็น คำตอบเฉพาะลิงก์ (เช่นลิงก์ไปยัง Youtube) โดยไม่มีคำอธิบายไม่ได้อยู่ที่นี่
whuber

6

เรากำลังอยู่ในสถานการณ์ของการประมาณจำนวนประชากรด้วยจำนวนตัวอย่างบางส่วน ในกรณีนี้เราใช้สัดส่วนตัวอย่างเพื่อประมาณสัดส่วนประชากร แต่หลักการทั่วไปกว้างกว่ามาก

หากคุณคิดถึงการสังเกตทั้งหมดในตัวอย่างของคุณโดยใช้ค่าเมื่อพวกเขามีลักษณะของความสนใจ ("ส้มที่ต้องการแอปเปิ้ล" ในตัวอย่าง) และเมื่อพวกเขาทำไม่ได้สัดส่วนของจะเท่ากัน เป็นค่าเฉลี่ยของชุดของค่าและ - คุณจึงสามารถเห็นได้ว่าสัดส่วนตัวอย่างนั้นเป็นค่าเฉลี่ยจริง ๆ10101

ในขณะที่เราทำการสุ่มตัวอย่างที่ใหญ่ขึ้น (โดยใช้การสุ่มตัวอย่าง) ค่าเฉลี่ยตัวอย่างจะมีแนวโน้มที่จะมาบรรจบกันกับค่าเฉลี่ยประชากร (นี่เป็นกฎหมายจำนวนมาก)

อย่างไรก็ตามสิ่งที่เราต้องการมีความคิดจริง ๆ ก็คือเราอาจจะอยู่ไกลแค่ไหน (เช่นอาจแสดงด้วยความกว้างของช่วงความมั่นใจสำหรับสัดส่วนหรือจากขอบของข้อผิดพลาดซึ่งโดยปกติจะเป็นครึ่งหนึ่งของความกว้าง) .

โดยทั่วไปยิ่งคุณมีข้อมูลมากขึ้นเท่าใดความไม่แน่นอนที่คุณจะได้รับเกี่ยวกับปริมาณเช่นค่าเฉลี่ยก็จะน้อยลงเนื่องจากค่าเบี่ยงเบนมาตรฐานของการกระจายตัวตัวอย่างจะลดลงเมื่อคุณใช้กลุ่มตัวอย่างขนาดใหญ่ [ลองจินตนาการถึงการใช้ขนาดตัวอย่างที่แตกต่างกันจำนวนมาก 4 การกระจายตัวของค่าเฉลี่ยนั้นน้อยกว่าการกระจายตัวของการสังเกตแบบดั้งเดิม - ค่าเบี่ยงเบนมาตรฐานควรมีแนวโน้มที่จะใหญ่ประมาณครึ่งหนึ่ง ตอนนี้ถ้าคุณใช้ขนาดตัวอย่างที่แตกต่างกันขนาด 400 ค่าเบี่ยงเบนมาตรฐานของมันควรจะเล็กกว่านี้อีกมาก (ประมาณ th ของค่าเบี่ยงเบนมาตรฐานของการสังเกตดั้งเดิม)120

ค่าเบี่ยงเบนมาตรฐานของการกระจายตัวของค่าเฉลี่ยตัวอย่างคือวิธีหนึ่งในการวัดระยะทางทั่วไปค่าเฉลี่ยตัวอย่างจากค่าเฉลี่ยประชากรซึ่งกำลังลดลง (มันลดลงเมื่อในขณะที่ ตัวอย่างข้างต้น)1n

ด้วยเหตุนี้เราจึงมีความมั่นใจมากขึ้นเกี่ยวกับความถูกต้องของการประมาณของเราเมื่อกลุ่มตัวอย่างมีขนาดใหญ่ - หากเราทำการทดสอบซ้ำอีกครั้งวิธีการอื่น ๆ ก็จะใกล้เคียงกับปัจจุบัน - พวกมันรวมกลุ่มกันแน่นขึ้น เพราะ (ในกรณีนี้) ค่าประมาณของเรานั้นไม่เอนเอียงพวกเขากำลังรวมกลุ่มกันตามค่าที่เรากำลังพยายามประเมิน ค่าเฉลี่ยตัวอย่างเดียวมีมากขึ้นและให้ข้อมูลมากขึ้นเกี่ยวกับตำแหน่งที่ค่าเฉลี่ยประชากรอาจอยู่


4

กฎง่ายๆสำหรับสถิติ "การนับ" เช่นการนับจำนวนคนที่ชอบส้มหรือการนับจำนวน "คลิก" ในตัวนับ Geiger เนื่องจากการสลายตัวของสารกัมมันตภาพรังสีคือขอบของข้อผิดพลาดสำหรับการนับเป็นสี่เหลี่ยม - รากของค่าการนับที่คาดไว้ สถิติการนับเป็นที่รู้จักกันเป็นสถิติปัวซอง

สแควร์รูทของ 6 คือ 2.4-ish ดังนั้นระยะขอบของข้อผิดพลาดประมาณ 40% (2.4 / 6) สแควร์รูทของ 600 คือ 24-ish ดังนั้นระยะขอบของข้อผิดพลาดประมาณ 4% (24/600) นั่นคือเหตุผลที่การนับ 600 มีความสำคัญมากกว่าการนับ 6 ข้อผิดพลาดสัมพัทธ์คือหนึ่งในสิบ

ฉันเป็นคนเลอะเทอะเล็กน้อยเกี่ยวกับคำจำกัดความของข้อผิดพลาด มันเป็นค่า 1-sigma และไม่ใช่การตัดออกยาก แต่เป็นช่วงที่คุณคาดหวังการวัดมากที่สุด (68%) ดังนั้นหากคุณคาดหวังคนทานส้ม 6 คนคุณจะคาดหวังว่าการสำรวจความคิดเห็นจะให้ตัวเลขส่วนใหญ่ในช่วง 4 ถึง 8 เช่น 6,6,5,6,7,2,4,6,3,5,6 6,7,6,10,8,6,5,6,6,9,3,7,8


3

ฉันไม่มีชื่อที่คุณกำลังมองหา แต่ปัญหาไม่ใช่สถิติ ในทางจิตวิทยาวิธีที่มนุษย์ใช้ในการประมวลผลตัวเลขในสมองของเราให้น้ำหนักมากขึ้น (ผู้มีอำนาจ) ไปยังจำนวนที่มากขึ้นกว่าที่จะเป็นจำนวนที่น้อยกว่าเพราะขนาด (ขนาดร่างกาย) มีความสำคัญทางสายตาเท่ากับค่าตัวแทน ดังนั้น 600/1000 จึงน่าเชื่อถือมากกว่า 6/10 นี่คือเหตุผลที่ผู้ซื้อต้องการเห็น "ลด 10%!" สำหรับค่าน้อยกว่า 100 และ "บันทึก $ 10!" สำหรับค่าที่มากกว่า 100 (เรียกว่า "Rule of 100") มันเกี่ยวกับการที่สมองของเราตอบสนองต่อการรับรู้

ดูน่าพิศวงในปรากฏการณ์ที่คล้ายกันนี้โดย Nick Kolenda ในบทความออนไลน์ของเขา " คู่มืออันยิ่งใหญ่สำหรับจิตวิทยาการกำหนดราคา "


2
แม้ว่าคำตอบอื่น ๆ จะไม่ถูกต้อง แต่ฉันไม่เห็นพวกเขาอย่างแท้จริงที่อยู่ข้อความที่ยกมาเช่นนี้ ข้อความกำลังพูดถึงผลกระทบของการนำเสนอตัวเลขและความถูกต้องที่รับรู้ไม่ใช่ว่าตัวเลขนั้นมีความแม่นยำมากกว่า นั่นคือคุณสามารถทำให้คนรับรู้ว่าข้อมูลของคุณมีความสำคัญมากขึ้นโดยบอกว่า 600 จาก 1,000 หรือ 60% หรือคุณอาจทำให้ดูเหมือนว่าจะมีความสำคัญน้อยลงโดยพูด 6 จาก 10 แม้ว่าแต่ละคนจะมีความหมายเดียวกัน ขนาดโดยไม่ต้องถ้ามีการระบุจริงหรืออาจเป็นจริง
dlb

1
ตัวอย่างนี้ดูเหมือนว่าพื้นฐานของฉันมีข้อบกพร่อง ตัวอย่างเช่นการซื้อ 100 ได้รับส่วนลด 10% รวมเป็น 90 ขณะที่การซื้อ 100.01 ได้รับส่วนลด 25 รวม 75.01 ซึ่งผลลัพธ์เป็นราคาที่แตกต่างกันอย่างมากมาย ในความเป็นจริงมีความแตกต่างในค่าจนกว่าคุณจะได้รับมากถึง 250.05 (หรือ 250.10 ขึ้นอยู่กับการปัดเศษหรือการตัดทอน) คำถามกำลังพูดถึงขนาดตัวอย่างและข้อผิดพลาดมาตรฐานในขณะที่ตัวอย่างของคุณเกี่ยวกับความแตกต่างที่แท้จริงเนื่องจากการรับรู้ของเรา
Joe W

@ Joe W ในขณะที่ฉันไม่สามารถพูดถึงเฉพาะของ "กฎ 100" (ไม่ใช่นักจิตวิทยา) จุดที่คำตอบของฉันคือการทำคือนักจิตวิทยาได้พิจารณาแล้วว่าผู้คนเชื่อใจมากขึ้นไม่ใช่เพราะขนาดใหญ่ ขนาดตัวอย่างมันแสดง แต่เนื่องจากการรับรู้ของความสำคัญมากขึ้นให้กับจำนวนที่มากขึ้น ในฐานะวิศวกรฉันไม่ชอบวิธีนี้ --- แต่เป็นวิธีที่จิตใจของมนุษย์ทำงาน หากคุณต้องการท้าทายสิ่งนี้ฉันขอแนะนำให้อ่านรายละเอียดพื้นฐานของงานนำเสนอของ Mr. Kolenda
JBH

คุณหายไปจากจุดของฉันมีความแตกต่างที่ใหญ่กว่าใน 10% ถึง 100 และ 25 ไม่ใช่แค่เรื่องของการรับรู้ ข้อเท็จจริงง่าย ๆ คือถ้าคุณเอาค่าทั้งสองที่ 100 มีความแตกต่าง 15% ซึ่งเป็นค่าที่ง่ายกว่ามากในการวัดค่าความคลาดเคลื่อนมาตรฐานเมื่อพูดถึงสองตัวอย่างที่แตกต่างกันหนึ่งใน 10 และหนึ่งใน 1,000
Joe W

ฉันเปลี่ยนคำถามของฉันเพื่อใช้ 10% และ $ 10 เพื่อช่วยคุณ จุดของ "กฎของ 100" คือคนรับรู้จำนวนมากขึ้นว่ามีความเกี่ยวข้องมากขึ้นและรับรู้ค่าเงินเป็นสำคัญยิ่งกว่าร้อยละเพียง มันเป็นปัญหาที่ค่อนข้างจะอยู่นอกขอบเขตของการอภิปรายเพื่อวัตถุประสงค์ของ OP
JBH

3

ในขณะที่ความผิดพลาดจริงนั้นสำคัญ แต่เหตุผลที่ฟังดูน่าเชื่อมากขึ้นก็เพราะผู้คนมีประสบการณ์ในการแก้ปัญหามากขึ้น ข้อผิดพลาดจริงยืนยันว่าฮิวริสติกนี้มีข้อดี

หากตัวอย่างคือ 6 สำหรับและ 4 ต่ออาจเป็น 50/50 ถ้าคนคนเดียวเปลี่ยนการลงคะแนนหรือบันทึกคนเดียวด้วยความผิดพลาด มีเพียงสองคนที่อยู่ด้าน 6 ทุกคนรู้สองสะเก็ดทุกคนรู้ว่าตัวอย่างสามารถหยิบได้จากเชอร์รี่: คุณถามแค่พนักงานเสิร์ฟและไม่มีใครอื่น หรือคุณสำรวจอาจารย์วิทยาลัยเพียง 10 คนในห้องโถงของมหาวิทยาลัย หรือคุณถามคนร่ำรวย 10 คนนอก Saks Fifth Avenue

แม้แต่ข้อผิดพลาดทางคณิตศาสตร์ของข้อผิดพลาดก็ยังคงมีการสุ่มตัวอย่างที่แท้จริงและไม่ได้คำนึงถึงอคติในการเลือกหรือการมีอคติในการเลือกตนเองหรืออะไรก็ตามที่ผู้คนสามารถเข้าใจได้

ในทางตรงกันข้ามผลลัพธ์ 600 กับ 400 มีมากกว่า 200 คนในอีกด้านหนึ่งและอีก 100 คนจะต้องเปลี่ยนใจ ตัวเลขเหล่านั้นยากมากที่จะเกิดขึ้น (แต่ไม่ใช่เป็นไปไม่ได้) จากอุบัติเหตุที่คุณโพลว่าคุณให้คนเห็นด้วยอย่างไรคนที่เข้าใจหรือตีความคำถาม ฯลฯ

มันไม่น่าเชื่อถือเพราะหลักฐานทางคณิตศาสตร์ที่ควรเป็น แต่เพราะเรารู้จากประสบการณ์ว่าฝูงชน 1,000 คนมีแนวโน้มที่จะมีความหลากหลายในความคิดเห็นของพวกเขา (ในทุกสิ่ง) มากกว่ากลุ่ม 10 (เว้นแต่คุณจะทำอย่างลับๆ) การเลือกตั้งของคุณในการประชุมพรรคการเมืองหรือการชุมนุม KKK หรือสิ่งอื่นที่น่าดึงดูดฝูงชนด้านเดียว)

คณิตศาสตร์คำนวณปริมาณสิ่งที่เรารู้โดยสัญชาตญาณอย่างแม่นยำเท่านั้น มันง่ายกว่าที่จะสุ่มพบหนึ่งหรือสองคะแนนจากการเร่ร่อนจาก 10 มากกว่าการสุ่มพบการโหวต 100 หรือ 200 เรย์จาก 1,000


3

สิ่งที่ไม่ได้กล่าวถึงคือการมองปัญหาจากมุมมองแบบเบย์

ในการตั้งค่าแบบเบย์วิธีที่เป็นธรรมชาติสำหรับปัญหานี้คือการใช้การกระจายแบบเบต้า - ทวินาม คุณสามารถสันนิษฐานได้ว่าความน่าจะเป็นของคนที่ชอบส้มมากกว่าแอปเปิลคือซึ่งเบต้ากระจายและการสังเกตมีการกระจายแบบทวินามด้วยพารามิเตอร์ : pp

pBeta(α,β)no|pBin(n,p).

สมมติว่าคุณไม่มีเหตุผลเบื้องต้นที่จะเชื่อว่ามีคนชอบส้มมากกว่าแอปเปิ้ลหรือในทางกลับกัน ( ) แต่คุณไม่มีความเห็นที่ชัดเจนเกี่ยวกับเรื่องนี้ (อ่อนแอมาก่อน: ) การกระจายก่อนดังนั้นจึงเป็นเครื่องแบบ(0,1)β=αβ=α=1pU(0,1)

หลังจากรวบรวมคำตอบจากแบบสอบถามเกี่ยวกับความชอบของคนอื่นคุณทราบว่าผู้ตอบแบบสอบถามชอบส้มและของพวกเขาชอบแอปเปิ้ลnnona=nno

การกระจายของหลังคือ: p | n o , n ~ B อีที ( n o + 1 , n + 1 )p

p|no,naBeta(no+1,na+1).

ในขณะที่โหมดหลังของ (เช่น a-posteriori สูงสุด) คือโดยไม่คำนึงถึงจำนวนผู้ตอบแบบสอบถามการกระจายตัวของมันแตกต่างกันมาก: มันยอดแหลมมากกว่าขนาดเล็ก คนn o / ( n o + n a ) npno/(no+na)n

เพื่อให้ความคิดแก่คุณนี่คือคนหลังที่มีและ :n a = 4no=6na=4

ด้านหลังด้วย n_o = 6 และ n_a = 4

ขณะนี้เป็นหลังด้วยและ : n a = 400no=600na=400ป้อนคำอธิบายรูปภาพที่นี่

คุณจะอ่านแปลงเหล่านี้ได้อย่างไร? คุณสามารถให้เหตุผลดังนี้: "ฉันสังเกตว่า 6 ใน 10 คน (สุ่มเลือกจากประชากร) ชอบส้มมากกว่าแอปเปิ้ล แต่ความน่าจะเป็นพื้นฐานที่แท้จริง (สำหรับประชากรทั้งหมด) เป็น 0.4 หรือ 0.8 แทนได้หรือไม่ เรื่องนี้ค่อนข้างเป็นไปได้ " หากคุณทำเช่นเดียวกันสำหรับพล็อตที่สอง (เช่นกับผู้ตอบ 1,000 คน) คุณจะได้รับหรือนั้นไม่น่าเป็นไปได้มาก (อีกครั้งฉันสมมติว่ามี 1,000 ตัวอย่าง IID จากประชากร)p = 0.8p=0.4p=0.8

โปรดทราบว่าถึงแม้จะแปลงเหล่านี้มีลักษณะคล้ายกับ david25272 ของพวกเขาเป็นตัวแทนบางสิ่งบางอย่างที่แตกต่างกันมาก

แผนการของเขาถามคำถาม: "สมมติว่ามีค่าทราบแล้วความน่าจะเป็นในการสังเกตผู้คนตอบว่าพวกเขาชอบส้มมากกว่าแอปเปิล?"n opno

แผนการของฉันตอบคำถาม: "สมมติว่าฉันสังเกตคนตอบว่าพวกเขาชอบส้มมากกว่าแอปเปิ้ลความน่าจะเป็นกระจายของคืออะไรความน่าจะเป็นที่คนเลือกส้มมากกว่าแอปเปิล" pnop


2

คำตอบสั้น ๆ :

โดยทั่วไปจะมากขึ้นน่าเชื่อว่าจะมี 600 ออกจาก 1000 กว่าหกจาก 10 เพราะได้รับการตั้งค่าเท่ากันก็ห่างไกลมีโอกาสมากขึ้นสำหรับ 6 จาก 10 ที่จะเกิดขึ้นโดยบังเอิญแบบสุ่ม

มาสมมุติกันว่าสัดส่วนที่ต้องการส้มและแอปเปิ้ลมีค่าเท่ากัน (ดังนั้นละ 50%) เรียกสิ่งนี้ว่าสมมุติฐานว่าง เมื่อพิจารณาถึงความน่าจะเป็นที่เท่าเทียมกันเหล่านี้โอกาสที่ผลลัพธ์ทั้งสองคือ:

  • จากตัวอย่าง 10 คนมีโอกาส 38% ที่จะสุ่มตัวอย่างจากคน 6 คนขึ้นไปที่ชอบส้ม (ซึ่งไม่น่าจะเป็นไปได้ทั้งหมด)
  • ด้วยกลุ่มตัวอย่าง 1,000 คนมีโอกาสน้อยกว่า 1 ในพันล้านที่มี 600 คนหรือมากกว่า 1,000 คนชอบส้ม

(สำหรับความเรียบง่ายฉันสมมติว่าประชากรไม่ จำกัด ที่จะดึงตัวอย่างได้ไม่ จำกัด จำนวน)


มาแบบง่าย ๆ

วิธีหนึ่งที่จะได้ผลลัพธ์นี้คือการระบุวิธีที่เป็นไปได้ที่ผู้คนสามารถรวมกันในตัวอย่างของเรา:

สำหรับสิบคนมันง่าย:

ลองวาดตัวอย่างจาก 10 คนโดยการสุ่มจากประชากรที่ไม่มีที่สิ้นสุดของคนที่มีความชอบเท่ากันสำหรับแอปเปิ้ลหรือส้ม ด้วยการตั้งค่าที่เท่ากันคุณสามารถแสดงรายการชุดค่าผสมที่เป็นไปได้ทั้งหมดของ 10 คนได้อย่างง่ายดาย:

นี่คือรายการเต็ม

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r คือจำนวนผลลัพธ์ (คนที่ชอบส้ม), C คือจำนวนวิธีที่เป็นไปได้ของคนจำนวนมากที่เลือกส้มและ p คือความน่าจะเป็นแบบแยกกันของคนหลายคนที่ชอบส้มในตัวอย่างของเรา

(p เป็นเพียง C หารด้วยจำนวนชุดค่าผสมทั้งหมดโปรดทราบว่ามี 1024 วิธีในการจัดเรียงการตั้งค่าทั้งสองนี้โดยรวม (เช่น 2 ต่อกำลัง 10)

  • ตัวอย่างเช่นมีทางเดียวเท่านั้น (หนึ่งตัวอย่าง) สำหรับ 10 คน (r = 10) สำหรับส้มที่ชอบทั้งหมด เช่นเดียวกันสำหรับทุกคนที่ต้องการแอปเปิ้ล (r = 0)
  • มีชุดค่าผสมที่แตกต่างกัน 10 แบบทำให้มีเก้าชุดที่เลือกใช้ส้ม (บุคคลที่ต่างกันคนหนึ่งชอบแอปเปิ้ลในแต่ละตัวอย่าง)
  • มีตัวอย่าง 45 ตัวอย่าง (ชุดค่าผสม) ที่ 2 คนชอบแอปเปิ้ล ฯลฯ

(ในที่เราพูดคุยทั่วไปเกี่ยวกับn C Rการรวมกันของผลrจากตัวอย่างของnคน. มีเครื่องคิดเลขออนไลน์ที่คุณสามารถใช้เพื่อตรวจสอบตัวเลขเหล่านี้.)

รายการนี้ช่วยให้เราสามารถให้ความน่าจะเป็นข้างต้นโดยใช้การหารเพียงอย่างเดียว มีโอกาส 21% ที่จะได้ 6 คนจากตัวอย่างที่ชอบส้ม (210 จาก 1024 ของชุดค่าผสม) โอกาสในการรับคนหกคนขึ้นไปในตัวอย่างของเราคือ 38% (ผลรวมของกลุ่มตัวอย่างทั้งหมดที่มีคนหกคนขึ้นไปหรือ 386 จาก 1024 ชุดค่าผสม)

ความน่าจะเป็นแบบกราฟิก:

ขนาดตัวอย่างทวินาม 10

ด้วยจำนวนที่มากขึ้นจำนวนชุดค่าผสมที่เป็นไปได้จะเพิ่มขึ้นอย่างรวดเร็ว

สำหรับกลุ่มตัวอย่างเพียง 20 คนมีตัวอย่างที่เป็นไปได้ 1,048,576 ทั้งหมดมีโอกาสเท่ากัน (หมายเหตุ: ฉันได้แสดงชุดค่าผสมทุกวินาทีด้านล่างเท่านั้น)

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

ยังมีเพียงตัวอย่างเดียวที่คน 20 คนชอบส้ม ชุดค่าผสมที่มีผลลัพธ์แบบผสมมีแนวโน้มมากขึ้นเพียงเพราะมีหลายวิธีที่ผู้คนในกลุ่มตัวอย่างสามารถนำมารวมกันได้

ตัวอย่างที่มีความเอนเอียงไม่น่าเป็นไปได้มากเพียงเพราะมีคนจำนวนน้อยที่อาจส่งผลให้เกิดกลุ่มตัวอย่าง:

มีเพียง 20 คนในแต่ละตัวอย่างความน่าจะเป็นสะสมที่มี 60% หรือมากกว่า (12 คนขึ้นไป) ในกลุ่มตัวอย่างที่เราเลือกส้มลดลงเหลือเพียง 25%

การกระจายความน่าจะเป็นสามารถดูผอมลงและสูงขึ้นได้:

ขนาดตัวอย่างทวินาม 20

ด้วย 1,000 คนตัวเลขเหล่านั้นใหญ่มาก

เราสามารถขยายตัวอย่างข้างต้นไปเป็นตัวอย่างขนาดใหญ่ (แต่ตัวเลขเติบโตเร็วเกินไปสำหรับเป็นไปได้ที่จะแสดงรายการชุดค่าผสมทั้งหมด) แต่ฉันคำนวณความน่าจะเป็นใน R:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

ความน่าจะเป็นสะสมที่มี 600 คนหรือมากกว่า 1,000 คนชอบส้มมากกว่า 1.364232e-10

การกระจายความน่าจะเป็นตอนนี้มีความเข้มข้นมากขึ้นรอบ ๆ ศูนย์:

[ขนาดตัวอย่างทวินาม 1000 [3]

(ตัวอย่างเช่นในการคำนวณความน่าจะเป็นที่แน่นอนจาก 600 คนจาก 1,000 คนที่ชอบส้มในการใช้ R dbinom(600, 1000, prob=0.5)ซึ่งเท่ากับ 4.633908e-11 และความน่าจะเป็นที่ 600 หรือมากกว่านั้นคือคน1-pbinom(599, 1000, prob=0.5)ซึ่งเท่ากับ 1.364232e-10 (น้อยกว่า 1 ในพันล้าน)


1

นี่เป็นเพราะจำนวนที่สูงขึ้นช่วยให้มั่นใจว่ามีความแม่นยำมากขึ้น ตัวอย่างเช่นหากคุณจะรับ 1,000 คนจากที่ใดก็ได้บนโลกและ 599 คนเป็นผู้ชายต่อ 10 คนที่มีชาย 6 คนในอดีตจะมีความแม่นยำมากกว่า ในทำนองเดียวกันถ้าคุณสมมติว่ามีประชากร 7 พันล้านคนและคำนวณจำนวนเพศชายคุณจะได้ตัวเลขที่แม่นยำยิ่งขึ้นซึ่งแน่นอนว่าน่าจะน่าเชื่อกว่าเมื่อมีเพียง 1,000 คน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.