มีกฎหมายหรือไม่ที่บอกว่าถ้าคุณทดลองมากพอจะเกิดเรื่องหายาก?


16

ฉันกำลังพยายามสร้างวิดีโอเกี่ยวกับลูกเต๋าที่บรรจุอยู่และในจุดหนึ่งในวิดีโอที่เราหมุนประมาณ 200 ลูกเต๋าใช้เวลาทั้งหมดหกแต้มหมุนมันอีกครั้ง เรามีคนตายหนึ่งคนที่เกิดขึ้น 6 ครั้งติดต่อกันซึ่งเห็นได้ชัดว่าไม่ผิดปกติเพราะน่าจะเกิดขึ้น 1/216 ครั้งและเรามีลูกเต๋าประมาณ 200 ตัว ดังนั้นฉันจะอธิบายได้อย่างไรว่ามันไม่แปลก ดูเหมือนจะไม่เหมือนกฎของคนจำนวนมาก ฉันต้องการพูดบางอย่างเช่น "ถ้าคุณทำแบบทดสอบมากพอแม้กระทั่งสิ่งที่ไม่น่าจะเกิดขึ้น" แต่คู่หูของฉันบอกว่าผู้คนอาจมีปัญหากับคำศัพท์ "ผูกพันกับ"

มีวิธีมาตรฐานในการระบุแนวคิดนี้หรือไม่?



ความน่าจะเป็น p = 1 / n นั้นหมายความว่าคุณมี 1 ความสำเร็จต่อ tirals นี่คือความหมายและนี่คือวิธีการตรวจสอบ หากคุณไม่เห็น 1 ความสำเร็จต่อการทดสอบ n ครั้งคุณจะรายงานความน่าจะเป็นที่ผิดให้เราทราบ ตอนนี้คุณพูดว่า n มีขนาดใหญ่ แต่อะไรคือความแตกต่างเมื่อคุณบอกว่าคุณสามารถทำการทดลองอื่น ๆ อีกมากมายที่ n? ฉันหมายความว่าคุณไม่จำเป็นต้องมีกฎหมายใด ๆ นอกเหนือจากนิยามของความน่าจะเป็น ฉันสนใจมากขึ้นที่จะรู้ว่าทำไมความน่าจะเป็นที่จะประสบความสำเร็จในการทดลอง n ไม่ใช่ 1
วาล

3
@Val ความคิดเห็นของคุณจะต้องอ่านในลักษณะที่แปลกประหลาดเพื่อไม่ให้เข้าใจผิด! เมื่อความน่าจะเป็นของเหตุการณ์คืออาจ1/nเป็นไปได้ว่าเหตุการณ์จะไม่ถูกสังเกตในการทดลองอิสระn(ความน่าจะเป็นที่ไม่ได้สังเกตมันอยู่ใกล้กับ1/e0.37สำหรับขนาดใหญ่n) ดังนั้นคุณดูเหมือนจะผิดเกี่ยวกับการยืนยันของคุณเกี่ยวกับการตรวจสอบความน่าจะเป็นที่หายาก ฉันคิดว่าคุณผิดไปจากการทำให้ความน่าจะเป็นกับความถี่: พวกมันต่างกันทั้งในเชิงแนวคิดและในทางปฏิบัติ
whuber

ความสำเร็จของฉัน = การสังเกตของคุณ ฉันไม่เข้าใจว่าทำไมคุณเริ่มตีความคำแถลงที่ชัดเจนนี้ใหม่และกำหนดทุกอย่างใหม่ ประการที่สองแม้ว่าฉันมักจะเชื่อว่าความน่าจะเป็นสิ่งเชิงทฤษฎี (คำนวณเชิง combinatorically ในทฤษฎีความน่าจะเป็น) ในขณะที่ความถี่คือการยืนยันทางสถิติ (เช่นการทดลอง) กฎของตัวเลขขนาดใหญ่บอกว่าความถี่เป็นความน่าจะเป็น เหตุผลในการเน้นความแตกต่างอย่างน้อยในกรณีนี้
วาล

1
ฉันไม่เข้าใจความคิดเห็นสองข้อสุดท้ายของคุณ ฉันตีความคำที่คุณใช้ในสิ่งที่ฉันเชื่อว่าเป็นวิธีมาตรฐาน โดยเฉพาะอย่างยิ่งฉันกำลังเน้นความจริงที่ว่าความน่าจะเป็นไม่เหมือนกับความถี่ที่สังเกตซึ่งเป็นสิ่งที่ประโยคแรกของคุณดูเหมือนจะพูด เมื่อความน่าจะเป็นโดยวิธีการแล้วnคือไม่ได้เป็น "จำนวนมากของการทดลอง" โดยวิธีการใด ๆ : จะมีการเบี่ยงเบนขนาดใหญ่ระหว่างความถี่ที่สังเกตและความน่าจะเป็นพื้นฐาน สิ่งนี้ไม่เกี่ยวข้องกับการพิจารณาค่าที่ซ้ำกัน 1/nn
whuber

คำตอบ:


17

กฎจำนวนมากอย่างแท้จริง:

http://en.wikipedia.org/wiki/Law_of_truly_large_numbers

"ด้วยขนาดของกลุ่มตัวอย่างที่ใหญ่พอสิ่งใด ๆ ที่ชั่วร้ายน่าจะเกิดขึ้น"


ฉันคิดว่ามันค่อนข้างชัดเจนว่านี่เป็นคำตอบที่ดีที่สุดที่นี่ฮ่า ๆ
Phillip Schmidt

2
นี้เป็นรุ่นที่ขมับของหลักการเผด็จการ
Ray Koopman

12

คุณสามารถอธิบายได้ว่าแม้เหตุการณ์จะระบุค่าเริ่มต้นความน่าจะเป็นที่จะเกิดขึ้นนั้นไม่ต่ำ อันที่จริงมันไม่ยากนักที่จะคำนวณความน่าจะเป็นที่มี 3 ลูกหรือมากกว่านั้นแตกเป็นหกม้วนติดต่อกันอย่างน้อย 1 อันจาก 200

[อนึ่งมีการคำนวณโดยประมาณที่ดีที่คุณสามารถใช้ได้ - หากคุณมีการทดลองนั่นมีความน่าจะเป็น1 / n ของ 'ความสำเร็จ' (สำหรับnไม่เล็กเกินไป) โอกาสอย่างน้อยหนึ่งความสำเร็จคือประมาณ1 - 1 / E โดยทั่วไปสำหรับk nทดลองน่าจะเป็นเรื่องเกี่ยวกับ1 - อี- k ในกรณีของคุณคุณกำลังดูการทดลองm = k nสำหรับความน่าจะเป็น1 / nโดยที่n = 216และ=n1/nn11/ekn1ekm=kn1/nn=216ดังนั้น k = 200 / 216ให้ความน่าจะเป็นประมาณ 60% ที่คุณจะเห็น 3 แต้มในแถวอย่างน้อยหนึ่งครั้งจาก 200 ชุด 3 ม้วนm=200k=200/216

ฉันไม่รู้ว่าการคำนวณเฉพาะนี้มีชื่อเฉพาะ แต่พื้นที่ทั่วไปของเหตุการณ์ที่หายากที่มีการทดลองจำนวนมากเกี่ยวข้องกับการแจกแจงปัวซอง อันที่จริงการกระจายตัวของปัวซองนั้นบางครั้งเรียกว่า ' กฎของเหตุการณ์ที่หายาก ' และแม้แต่บางครั้ง ' กฎของจำนวนน้อย ' (ด้วย 'กฎ' ในกรณีเหล่านี้หมายถึง 'การกระจายความน่าจะเป็น')]

-

อย่างไรก็ตามหากคุณไม่ได้ระบุเหตุการณ์นั้นก่อนที่จะกลิ้งและพูดในภายหลังว่า ' เฮ้ว้าวโอกาสในการนั้นคืออะไร? 'จากนั้นการคำนวณความน่าจะเป็นของคุณนั้นผิดเพราะมันไม่สนใจเหตุการณ์อื่น ๆทั้งหมดที่คุณจะพูดว่า' เฮ้ว้าวโอกาสเช่นนั้นคืออะไร?'

คุณระบุเหตุการณ์หลังจากที่คุณสังเกตเห็นแล้วซึ่ง 1/216 ไม่สามารถใช้งานได้แม้จะตายเพียงครั้งเดียว

ลองนึกภาพฉันมีรถสาลี่เต็มไปด้วยลูกเต๋าเล็ก ๆ แต่แยกแยะได้ (บางทีพวกเขาอาจมีหมายเลขซีเรียลน้อย) - บอกว่าฉันมีหมื่นคน ฉันให้ทิปล้อโป่งที่เต็มไปด้วยลูกเต๋า:

die #    result
00001      4
00002      1
00003      5
 .         .
 .         .
 .         .
09999      6
10000      6

... และฉันไป "เฮ้! ว้าวโอกาสที่ฉันจะได้ '4' เมื่อตาย # 1 และ '1' บน die # 2 และ ... และ '6' บน die # 999 และ '6' บน die # 10000? "

ความน่าจะเป็นนั้นคือหรือประมาณ3.07×10-7782 นั่นเป็นเหตุการณ์ที่หายากอย่างน่าอัศจรรย์! สิ่งที่น่าทึ่งต้องเกิดขึ้น ให้ฉันลองอีกครั้ง. ฉันตักพวกมันกลับเข้าที่และสาลี่ปลายอีกครั้ง ฉันพูดอีกครั้งว่า "เฮ้ว้าวโอกาสมีอะไรบ้าง?" และอีกครั้งที่ปรากฎว่าฉันมีเหตุการณ์ที่น่าประหลาดใจเช่นนี้มันน่าจะเกิดขึ้นเพียงครั้งเดียวในชีวิตของจักรวาลหรืออะไรบางอย่าง ว่าไง?16100003.07×107782

เพียงแค่ฉันกำลังทำอะไร แต่พยายามที่จะคำนวณความน่าจะเป็นของเหตุการณ์ที่ระบุไว้ตามความเป็นจริงราวกับว่ามันได้รับการระบุเบื้องต้น ถ้าคุณทำอย่างนั้นคุณจะได้คำตอบที่บ้า


15
คุณรู้ไหมว่าสิ่งที่น่าอัศจรรย์ที่สุดเกิดขึ้นกับฉันในคืนนี้ ฉันมาที่นี่ระหว่างทางไปบรรยายและฉันเข้ามาในลานจอดรถ และคุณจะไม่เชื่อสิ่งที่เกิดขึ้น ฉันเห็นรถยนต์ที่มีป้ายทะเบียน ARW 357 คุณจินตนาการได้ไหม ในบรรดาแผ่นป้ายทะเบียนหลายล้านใบในรัฐอะไรคือโอกาสที่ฉันจะเห็นสิ่งนั้นในคืนนี้? ! ที่น่าตื่นตาตื่นใจ - ริชาร์ดไฟน์แมน
gerrit

This is not what the OP is asking. This is more like the "Antrophic principle" (is there a more generic term for that?) while the term the OP is asking is more like the "law of truly large numbers"?
Lie Ryan

3
@LieRyan If the OP's question contains an implied reasoning error, to which an ordinary probability calculation should not be applied, it would be wrong not to point that out clearly. Indeed, even if there's just a good possibility that issue exists, it should be clearly pointed out. Since there was no hint that the event was in fact specified before the observation, it needs to be pointed out. The required detail to convey exactly why it's a problem takes more than a couple of sentences. I do speak to the direct question in my first paragraph, but then explain why there's a problem.
Glen_b -Reinstate Monica

1
Just for clarification, it was a priori.
Cassandra Gelvin

3

I think that your statement "If you do enough tests, even unlikely things are bound to happen", would be better expressed as "If you do enough tests, even unlikely things are likely to happen". "bound to happen" is a bit too definite for a probability issue and I think the association of unlikely with likely in this context makes the point you are trying to put over.


I disagree, "bound to happen" is correct. Unless the dice is rigged to avoid the unlikely event, then it will happen. If it doesn't happen, then you just haven't done enough trials, either thator that it is not "unlikely things" but "impossible things".
Lie Ryan

Technically speaking, an event is only "bound to happen" if you try an infinite number of times; it's an asymptote. Probability has no memory; in theory I could flip a fair coin every second from now until the heat-death of the universe and only get heads. Taken as a whole, that's a very unlikely event, but each flip is still a 50/50 chance, so at no point does it become certain that I'll get tails. Likewise, even with a huge number of trials, that unlikely event is still just as unlikely for any given single trial - it might never happen.
anaximander

1
Of course, that assumes that you know the probabilities of your events. In the real world, after a certain number of trials you have to point out that your calculations give you a 99.999% chance of seeing the unlikely event at least once by now, and you still haven't seen it, so perhaps it's less likely than you thought (or maybe even impossible).
anaximander

@Anaximander A subtler interpretation of "bound to happen" that makes it a correct assertion about unlikely events is this: for all 0q<1 there exists an n for which the probability of the event occurring in n or more independent observations is at least q. This definition does not need to drag in some undefined or vague sense of "infinite number." In this sense any event of strictly positive probability ε is bound to happen eventually: for the proof, just take n>log(1q)/log(1ε) and do the (elementary) calculation.
whuber

1

I think what you need is a zero-one law. The most famous of these is the Kolmogorov Zero-One Law, which states that any event in the event space we're interested in will either eventually occur with probability 1 or never occur with probability 1. That is to say, there is no grey area of events that may happen.


1
I believe Kolmogorov's law applies only to tail events, not to "any event ... we're interested in." You might be able to apply this law to general events to shed light on the question, but some explanation of how to do that would be helpful here.
whuber

This is a good comment: I think the precise definition of tail event is exactly what we're looking for to solve this. I'll do some research on it.
owensmartin
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.