กลิ้งตายจนกว่ามันจะตกลงสู่หมายเลขอื่นที่ไม่ใช่ 4 ความน่าจะเป็นที่ผลลัพธ์จะเป็นเท่าใด> 4?


20

ผู้เล่นได้รับการตายอย่างยุติธรรมหกด้าน ในการชนะเธอจะต้องหมุนหมายเลขมากกว่า 4 (เช่น 5 หรือ 6) ถ้าเธอกลิ้ง 4 เธอต้องหมุนอีกครั้ง อัตราต่อรองของเธอในการชนะคืออะไร?

ฉันคิดว่าความน่าจะเป็นในการชนะP(W)สามารถแสดงซ้ำได้ดังนี้:

P(W)=P(r=5r=6)+P(r=4)P(W)

ฉันได้ประมาณP(W)เป็น0.3999โดยใช้การทดลอง 1 ล้านครั้งใน Java เช่นนี้

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

และฉันเห็นว่าสามารถขยายP(W)ดังนี้:

P(W)=13+16(13+16(13+16))...

แต่ฉันไม่รู้วิธีแก้ปัญหาความสัมพันธ์ที่เกิดซ้ำประเภทนี้โดยไม่หันไปใช้วิธีประมาณนี้ เป็นไปได้ไหม?


6
นั่นเป็นความพยายามอย่างมากในการตั้งค่าความสัมพันธ์ที่เกิดซ้ำ คุณมีเหตุผลที่ดีที่จะเชื่อว่าคำตอบคือ 0.4 นั่นเป็นคำใบ้ที่แข็งแกร่งว่ามีวิธีคิดอีกวิธีหนึ่งที่ทำให้คุณได้คำตอบโดยตรง มองหามัน. คำตอบของ Geomatt จะช่วยให้คุณไปถึงที่นั่นซึ่งจะช่วยให้คุณเข้าใจว่าเกิดอะไรขึ้นที่นี่และยังช่วยให้คุณลดความซับซ้อนของปัญหาอื่น ๆ ที่คุณพบได้เร็วขึ้นโดยไม่ต้องใช้ความพยายามเช่นนี้ หากปัญหาที่ซับซ้อนดูเหมือนว่าจะมีคำตอบง่ายๆคุณควรลงทุนเวลาเพื่อพยายามหาสาเหตุ จ่ายเงินปันผลมหาศาลในภายหลัง
โจเอล

8
เมื่อคุณทราบว่าเนื่องจากความน่าจะเป็นที่เท่ากันของผลลัพธ์ทั้งหกและความเป็นอิสระของม้วนกระดาษนั้นไม่มีอะไรพิเศษเกี่ยวกับผลลัพธ์ใด ๆ ของการทดลองนี้เป็นที่ชัดเจนว่าผลลัพธ์ทั้งห้าที่เป็นไปได้นั้นมีความเป็นไปได้เท่าเทียมกัน
whuber

6
ฉันผิดหวังเล็กน้อยที่ไม่มีใครแก้ปัญหาMarkov Chain ที่น่าสนใจสำหรับเรื่องนี้ :-) Math Stack Exchange มีประเพณีอันสูงส่งของ "overkill solution" ที่ไม่ค่อยน่าจะซึมผ่าน Cross Validated ...
Silverfish

2
มันคือ 2/5 ในการเลือกจาก{ 1 , 2 , 3 , 5 , 6 }ดังนั้นการจำลองของคุณอาจถูกต้อง {5,6}{1,2,3,5,6}
คณิตศาสตร์ที่

2
โพสต์นี้เทียบกับคำตอบคือสิ่งที่ฉันจินตนาการว่านักวิทยาศาสตร์ด้านข้อมูลเป็นเหมือนนักสถิติ
bdeonovic

คำตอบ:


47

เพียงแก้มันโดยใช้พีชคณิต:

P(W)=26+16P(W)56P(W)=26P(W)=25.

2
โปรดทราบว่าการคำนวณนี้ใช้ได้เฉพาะเพราะคุณสมบัติ Markov ที่แข็งแกร่งเก็บรักษาไว้สำหรับเชน Markov ที่ไม่ต่อเนื่อง
Chill2Macht

ฉันไม่จำลูกโซ่มาร์คอฟที่แยกออกจากกัน แต่ฉันคิดว่าเป็นเรื่องง่ายสำหรับคณิตศาสตร์คุณหมายความว่าความสัมพันธ์ที่เกิดซ้ำนั้นใช้ได้เฉพาะเพราะคุณสมบัติมาร์คอฟที่แข็งแกร่ง หลังจากสร้างความสัมพันธ์เราก็แค่หาค่า x
josinalvo

ถูกต้องหรือไม่
josinalvo

1
@ josinalvo: เทคนิคคำถามคือว่า P (W) ทั้งสองด้านของสมการมีความหมายเหมือนกันหรือไม่ Strong Markov Property หมายถึงพวกเขาทำ ในกรณีที่ไม่มีคุณสมบัตินั้น P (W) ทางด้านซ้ายหมายถึง "โอกาสที่จะชนะด้วยการหมุนนี้" และ 1/6 * P (W) ทางด้านขวาหมายถึง "โอกาสที่จะชนะหลังจากกลิ้ง 4"
MSalters

81

หมายเหตุ: นี่คือคำตอบสำหรับคำถามเริ่มต้นแทนที่จะเกิดขึ้นอีก

ถ้าเธอหมุน 4 ก็ไม่นับเพราะการหมุนครั้งถัดไปเป็นอิสระ กล่าวอีกนัยหนึ่งหลังจากหมุน 4 สถานการณ์จะเหมือนกับเมื่อเธอเริ่ม ดังนั้นคุณสามารถละเว้น 4 จากนั้นผลลัพธ์ที่อาจสำคัญคือ 1-3 และ 5-6 มี 5 ผลลัพธ์ที่แตกต่าง 2 ซึ่งจะชนะ ดังนั้นคำตอบคือ 2/5 = 0.4 = 40%


8
คุณสามารถทำสิ่งนี้ได้โดยตรงมากขึ้น: "พิจารณาม้วนแรกที่ไม่ใช่ 4 จากนั้นผลลัพธ์ ... "
โจเอล

2
สายตาของคนส่วนใหญ่เกลือกกลิ้งเมื่อพวกเขาเห็นคณิตศาสตร์จำนวนมากดังนั้นฉันชอบอันนี้ดีกว่า โดยทั่วไปคุณจะลบ 4 จากผลลัพธ์ดังนั้นมันคือ 1, 2, 3, 5, 6 มันจะเห็นได้ชัดว่าคุณมีโอกาส 40% ณ จุดนั้น
เนลสัน

ฉันคิดว่าสิ่งนี้มาจากชื่อเรื่องดังนั้นส่วนใหญ่เพิ่งจะอ่านคำถามเต็มหลังจากที่ฉันคลิก ไม่เช่นนั้นฉันอาจจะสับสนและเดาได้เอง!
GeoMatt22

1
@Nelson ผมเคยเห็นคนอื่น ๆ ที่มีตาเกลือกกลิ้งเมื่อพวกเขาเห็นชนิดของเหตุผลนี้ในปัญหาที่เกิดขึ้นน่าจะเป็นมากกว่าคนที่มีดวงตาเกลือกกลิ้งเมื่อพวกเขาเห็นพี p=a+bp
JiK

ใช่. คุณธรรมของเรื่องราวคืออย่าพยายามทำให้ปัญหาหนักกว่าที่ควรจะเป็น
Jay

14

คำตอบโดย dsaxton ( /stats//a/232107/90759 ) และ GeoMatt22 ( /stats//a/232107/90759 ) ให้แนวทางที่ดีที่สุดในการแก้ปัญหา อีกประการหนึ่งคือการตระหนักว่าการแสดงออกของคุณ

P(W)=13+16(13+16())

เป็นความก้าวหน้าทางเรขาคณิตจริง ๆ:

13+1613+16213+

โดยทั่วไปเรามี

Σn=0a0Qn=a01-Q

ดังนั้นที่นี่เรามี

P(W)=131-16=13:56=615=25.

แน่นอนวิธีการพิสูจน์สูตรทั่วไปสำหรับผลรวมของความก้าวหน้าทางเรขาคณิตคือการใช้วิธีแก้ปัญหาพีชคณิตคล้ายกับ dsaxton


@ วิลเลียมฉันไม่คิดว่าความคิดเห็นของคุณเหมาะสมด้วยเหตุผลหลายประการ 1. ฉันไม่เคยพูดว่าคุณต้องการชุดเรขาคณิตสำหรับเรื่องนี้ 2. แนวคิดที่คุณใช้ในคำตอบของคุณคือเครื่องจักรที่หนักกว่ามากมันเป็นเรื่องน่าขันที่จะพูดว่า "คุณไม่จำเป็นต้องมีชุดรูปแบบเรขาคณิต! คุณเพียงแค่ต้องการคุณสมบัติมาร์คอฟที่แข็งแกร่งและซับซ้อนมากขึ้น" 3. โซลูชันที่เรียบง่ายและเข้มงวดได้รับการจัดหาโดย dsaxton แล้ว วิธีการของคุณเป็นวงเวียนและ overkill มากขึ้นสำหรับปัญหานี้ 4. OP มีการแสดงออกเทียบเท่าซีรีย์เรขาคณิตบางคนต้องพูดว่าอาจเป็นฉันก็ได้
Meni Rosenfeld

1
@William: ท้ายที่สุดแล้วคำตอบของคุณเองก็ใช้ได้ดีลึกซึ้งและมีประโยชน์ในการรวบรวมคำตอบของคำถาม ไม่ได้หมายความว่าคุณควรไปตอบทุกคำตอบและบอกว่าคุณดีกว่ามาก พวกเขาทั้งหมดก็ดีเหมือนกัน ไม่ใช่ทุกสิ่งที่จะต้องเข้าหาด้วยวิธีนามธรรมและโดยทั่วไปมากที่สุดเท่าที่จะทำได้
Meni Rosenfeld

เป็นเวลานานแล้วที่ฉันเป็นวิชาคณิตศาสตร์ดังนั้นฉันจึงขออภัยถ้าคำตอบของฉันขาดความเข้มงวด (เพียงแค่โปรดอย่าบอกฉันว่ามันขึ้นอยู่กับสัจพจน์ของตัวเลือกเพราะมันน่าขายหน้า!) :)
GeoMatt22

3

คำตอบทั้งหมดข้างต้นนั้นถูกต้อง แต่พวกเขาไม่ได้อธิบายว่าทำไมพวกเขาถึงถูกต้องและทำไมคุณสามารถเพิกเฉยต่อรายละเอียดมากมายและหลีกเลี่ยงการแก้ไขความสัมพันธ์ที่เกิดซ้ำที่ซับซ้อน

เหตุผลที่ว่าทำไมคำตอบอื่น ๆ ที่ถูกต้องเป็นที่แข็งแกร่งมาร์คอฟทรัพย์สินซึ่งเป็น Markov Chain เนื่องเทียบเท่ากับมาร์คอฟปกติคุณสมบัติ https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

โดยพื้นฐานแล้วความคิดก็คือตัวแปรสุ่ม

τ=(จำนวนครั้งจนกว่าผู้ตายจะไม่ลงจอดในวันที่ 4 เป็นครั้งแรก)

เป็นเวลาหยุด https://en.wikipedia.org/wiki/Stopping_timeเวลาหยุดเป็นตัวแปรสุ่มที่ไม่ได้ขึ้นอยู่กับข้อมูลอื่น ๆ ในอนาคต

เพื่อที่จะบอกว่า nม้วนแรกของตายเป็นคนแรกที่ไม่ได้ลงจอดบน 4 (เช่นเพื่อที่จะตัดสินใจว่า τ=n) คุณเพียงแค่ต้องรู้มูลค่าของม้วนปัจจุบันและของม้วนก่อนหน้านี้ทั้งหมด แต่ไม่ใช่ม้วนในอนาคต - ดังนั้นτ เป็นเวลาหยุดและคุณสมบัติ Strong Markov จะถูกนำไปใช้

สถานที่ให้บริการที่แข็งแกร่งมาร์คอฟพูดอะไร? มันบอกว่าจำนวนที่ตายลงบนที่τth ม้วนเป็นตัวแปรสุ่ม Xτ, เป็นอิสระจากค่านิยมของม้วนก่อนหน้านี้ทั้งหมดที่

ดังนั้นหากผู้ตายกลิ้ง 4 ครั้งสองครั้ง ... 50 ล้านครั้ง ... τ-1 ครั้งก่อนที่จะเชื่อมโยงไปถึงค่าอื่นสำหรับ τth ม้วนมันจะไม่ส่งผลกระทบต่อความน่าจะเป็นของเหตุการณ์ที่Xτ>4.

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=...

ดังนั้นเราจึงสามารถสันนิษฐานได้ว่า τ=1. This is just the probability that the die lands a value greater than 4 given that it does not land on 4, which we can calculate very easily:

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25
which of course is the correct answer.

You can read more about stopping times and the Strong Markov property in Section 8.3 of (the 4th edition of) Durrett's Probability Theory and Examples, p. 365.


As far as I can tell from the wiki entry, the existence of a stopping time is necessary but not sufficient to say that a series of events exhibits the SMP. Sorry if I'm missing an in-joke or profound insight, but why not just assume that rolls are independent and get on with it?
Jacob Raihle

@JacobRaihle "คุณสมบัติ Markov ที่แข็งแกร่งซึ่งสำหรับ Markov Chain โดยสิ้นเชิงนั้นเทียบเท่ากับคุณสมบัติ Markov ปกติ" ภาพจำลองนี้ถือเป็นห่วงโซ่มาร์คอฟโดยสิ้นเชิง ม้วนเป็นอิสระนั่นคือเหตุผลว่าทำไมมันจึงเป็นโซ่มาร์คอฟแบบแยก ปัญหาคือว่าเหตุการณ์ "ม้วนแรกที่ไม่ได้ลงที่ 4" ไม่เป็นอิสระจากม้วนก่อนหน้านี้ด้วยเหตุผลที่ชัดเจนหวังว่า
Chill2Macht

เห็นได้ชัดว่ามีความเป็นอิสระเท่ากัน SMP ให้ประโยชน์อะไรเพิ่มเติม
Jacob Raihle

@JacobRaihle แม้ว่าค่าของโรลส์จะเป็นอิสระ แต่ค่าของดายในครั้งแรกที่มันตกลงบนค่าที่ไม่เท่ากับ 4 จะไม่ขึ้นอยู่กับค่าของดายที่ลงบนโรลก่อนหน้า
Chill2Macht

มันควรจะเป็นตั้งแต่การกลิ้งหยุดทันทีที่เกิดขึ้น อาจไม่มีม้วนที่ไม่ใช่ 4 ซึ่งไม่ใช่ม้วนแรก และแม้ว่าจะไม่ใช่กรณีนี้ฉันก็ไม่แน่ใจว่าความสัมพันธ์แบบไหนที่คุณกำลังแนะนำ
Jacob Raihle

1

อีกวิธีในการดูปัญหา

ให้เรียก 'ผลลัพธ์จริง' a 1,2,3,5 หรือ 6

ความน่าจะเป็นที่จะชนะในรอบแรกคืออะไรถ้าคุณได้ผลลัพธ์ที่แท้จริง 2/5

ความน่าจะเป็นที่จะชนะในการหมุนรอบที่สองคือถ้าการหมุนรอบที่สองเป็นครั้งแรกที่คุณได้รับ 'ผลจริง' 2/5

เหมือนกันสำหรับสามสี่

ดังนั้นคุณสามารถแบ่งตัวอย่างของคุณเป็นตัวอย่างขนาดเล็ก (infinte) และตัวอย่างเหล่านั้นให้ความน่าจะเป็นแบบเดียวกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.