นักโทษที่ผิดธรรมดา


11

ฉันได้รับการออกกำลังกายและฉันก็ไม่สามารถเข้าใจได้

นักโทษที่ผิดธรรมดา

นักโทษสามคนที่ถูกกักตัวเดี่ยว A, B และ C ถูกตัดสินประหารชีวิตในวันเดียวกัน แต่เนื่องจากมีวันหยุดประจำชาติผู้ว่าราชการจังหวัดจึงตัดสินว่าจะได้รับการให้อภัย นักโทษจะได้รับแจ้งเรื่องนี้ แต่บอกว่าพวกเขาจะไม่ทราบว่าจะให้คนใดคนหนึ่งรอดชีวิตจนกว่าจะถึงวันที่กำหนดไว้สำหรับการประหารชีวิต

ผู้ต้องหาคนหนึ่งพูดกับผู้คุม "ฉันรู้แล้วว่าอย่างน้อยหนึ่งนักโทษอีกสองคนจะถูกประหารดังนั้นหากคุณบอกชื่อผู้ถูกประหารชีวิตฉันจะไม่ให้ข้อมูลเกี่ยวกับการประหารชีวิตของฉัน" .

ผู้คุมยอมรับสิ่งนี้และบอกเขาว่า C จะต้องตายอย่างแน่นอน

เหตุผลก่อนหน้านี้“ ก่อนที่ฉันจะรู้ตัว C จะต้องถูกประหารชีวิตฉันมีโอกาส 1 ใน 3 ที่จะได้รับการให้อภัย ตอนนี้ฉันรู้ว่า B หรือตัวฉันเองจะได้รับการอภัยอัตราต่อรองที่ได้รับการปรับปรุงเป็น 1 ใน 2 "

แต่ผู้คุมชี้ว่า“ คุณอาจได้ข้อสรุปที่คล้ายกันถ้าฉันบอกว่า B จะตายและฉันก็ต้องตอบทั้ง B หรือ C ดังนั้นทำไมคุณต้องถาม?”

โอกาสในการได้รับการอภัยโทษคืออะไรและเพราะอะไร สร้างคำอธิบายที่จะทำให้คนอื่นเชื่อว่าคุณพูดถูก

คุณสามารถแก้ไขปัญหานี้โดยทฤษฎีบทของเบย์โดยการวาดเครือข่ายความเชื่อหรือโดยสามัญสำนึก วิธีใดก็ตามที่คุณเลือกควรทำให้คุณเข้าใจแนวคิดเรื่องความน่าจะเป็นแบบมีเงื่อนไขอย่างหลอกลวงมากยิ่งขึ้น

นี่คือการวิเคราะห์ของฉัน:

ดูเหมือนว่าปัญหา Monty Hallแต่จะไม่มาก ถ้า A บอกว่าI change my place with Bหลังจากเขาบอกว่า C จะตายเขามีโอกาส 2/3 ที่จะได้รับการช่วยเหลือ ถ้าเขาทำไม่ได้ฉันจะบอกว่าโอกาสของเขาคือ 1/3 ที่จะมีชีวิตเช่นเมื่อคุณไม่เปลี่ยนตัวเลือกของคุณในปัญหา Monty Hall แต่ในเวลาเดียวกันเขาอยู่ในกลุ่มของผู้ชาย 2 คนและคนหนึ่งควรตายดังนั้นจึงเป็นการล่อลวงที่จะบอกว่าโอกาสของเขาคือ 1/2

ดังนั้นความขัดแย้งยังคงอยู่ที่นี่คุณจะเข้าใกล้เรื่องนี้อย่างไร นอกจากนี้ฉันไม่รู้ว่าฉันจะสร้างเครือข่ายความเชื่อเกี่ยวกับเรื่องนี้ได้อย่างไรฉันจึงสนใจที่จะเห็นสิ่งนั้น


2
"เขาอยู่ในกลุ่ม 2 คน" ไม่ได้แปลว่า "โอกาสของเขาคือ 1/2"
Henry

คำตอบ:


8

เริ่มแรกมีความเป็นไปได้สามประการด้วยความน่าจะเป็นที่เท่ากัน:

  • A จะได้รับการปลดปล่อย (prob )1/3
  • B จะถูกปล่อยให้เป็นอิสระ (prob )1/3
  • C จะถูกปล่อยให้เป็นอิสระ (prob )1/3

ด้วยสัญญาของข้อความมีสี่ความเป็นไปได้ที่มีความน่าจะเป็นที่แตกต่างกัน:

  • A จะถูกปล่อยให้เป็นอิสระและ A ถูกบอกว่า B จะถูกประหารชีวิต (prob )1/6
  • A จะถูกปล่อยให้เป็นอิสระและ A ถูกบอกว่า C จะถูกดำเนินการ (prob )1/6
  • B จะถูกปลดปล่อยและ A ถูกบอกว่า C จะถูกดำเนินการ (prob )1/3
  • C จะถูกปล่อยให้เป็นอิสระและ A ถูกบอกว่า B จะถูกประหารชีวิต (prob )1/3

เงื่อนไขใน "A บอกจะถูกดำเนินการ C" นี้จะกลายเป็น

  • จะถูกปล่อยให้เป็นอิสระและบอกว่าจะดำเนินการ C (prob )1/3
  • B จะถูกปลดปล่อยและ A ถูกบอกว่า C จะถูกดำเนินการ (prob )2/3

ดังนั้นหลังจากที่ข้อความ A ต้องการสลับกับ B (ปัญหา Monty Hall) แต่ไม่สามารถทำได้และยังคงความน่าจะเป็นดั้งเดิมของการถูกดำเนินการ2/3


1
ต้องการแลกเปลี่ยนกับ Bเป็นกุญแจสำคัญ ในการอธิบายคำอธิบายทั่วไปของ Monty Hall: ลองนึกภาพว่ามีนักโทษ 1,000 คน: ถามผู้คุมที่ให้ชื่อเขาถึง 998 คน เห็นได้ชัดว่าเราเพิ่งได้เรียนรู้มากเกี่ยวกับผู้ชายคนหนึ่งที่เป็นไม่และผู้ที่ไม่ได้ตั้งชื่อ แต่เราไม่ได้เรียนรู้อะไรเกี่ยวกับ
เบ็คแจ็คสัน

ฉันคิดว่าในฐานะของ A นั้นเป็นกลยุทธ์ที่ดีมากสำหรับเขาที่จะถามเรื่องนี้ หลังจากนั้นพูดคุยกับ B และถามว่าเขาต้องการเปลี่ยนหรือไม่ ถ้าเขาเห็นด้วยพวกคุณสามารถขอให้ผู้ประหารชีวิตถ้าหากพวกเขาทั้งสองเป็นอิสระแล้วก็ปล่อยอีกคนหนึ่ง จากมุมมองของ B อัตราต่อรองของเขาจะไม่เปลี่ยนแปลงดังนั้นจึงไม่มีเหตุผลที่เขาจะปฏิเสธไม่ได้ (หรือจะบอกว่าใช่ดังนั้นมันจึงเป็นเรื่องของแรงกดดัน ณ จุดนั้น)
Cruncher

8

ฉันคิดว่าคุณกำลังคิดมากปัญหา - มันเป็นปัญหา Monty Hall และใช้ตรรกะเดียวกัน


คุณพัฒนาได้ไหม ฉันสนใจเหตุผลไม่ใช่คำตอบ
Benjamin Crouzier

1
@pinouchon: Jailer คือ Monty Hall และ Prisoner A เป็นผู้เล่น การตายนั้นคล้ายคลึงกับการได้แพะ การอภัยโทษนั้นคล้ายคลึงกับการรับรางวัล ตอนนี้คุณสามารถแปลคำอธิบายของปัญหา Monty Hall ที่คุณชอบได้โดยตรงซึ่งครอบคลุมเหตุผลมากมาย +1 ไปที่ babelproofreader เพื่อชี้เรื่องนี้
whuber

คุณจะโต้แย้งคำแถลงนี้อย่างไร: But at the same time, he is in a group of 2 guys, and one should die, so it is tempting to say that his chances are 1/2.. และเครือข่ายความเชื่อล่ะ
Benjamin Crouzier

1
@Pinouchon มันจะเป็นการสร้างสรรค์ในการแก้ไขคำถามของคุณเพื่อมุ่งเน้นไปที่เครือข่ายความเชื่อ ปัญหาของมอนตี้ฮอลล์ได้ถูกพูดถึงเรื่องความตายในหลาย ๆ ที่หลายแห่งดังนั้นฉันจึงไม่เห็นจุดใด ๆ ในการฟื้นฟูวัสดุที่นี่
whuber

ฉันยอมรับว่าปัญหาของมอนตี้ฮอลล์ได้ถูกกล่าวถึงเรื่องความตาย แต่ถึงแม้จะเป็นคำพูดที่ดูน่าเชื่อถือ หากผู้ต้องขังมีซองผนึกสามอันซองหนึ่งบรรจุอภัยโทษและอีกสองประโยคที่มีโทษประหารชีวิตซองหนึ่งซองเลือกและผู้คุมเปิดอีกซองหนึ่ง (กฎเดียวกับที่ฉันให้ไว้ในคำตอบแยกต่างหาก) และแสดงว่ามีประโยคประหารชีวิตและ จากนั้นถามว่า "คุณต้องการเก็บซองจดหมายที่คุณเลือกไว้หรือคุณต้องการเปลี่ยนหรือไม่" ฉันเห็นความคล้ายคลึง
Dilip Sarwate

3

ฉันไม่แน่ใจว่าฉันเห็นด้วยกับ @babelproofreader หรือไม่ว่านี่เป็นปัญหาของ Monty Hall และใช้ตรรกะแบบเดียวกัน ในปัญหา Monty Hall คุณลงไปและเลือกหนึ่งประตู กฎคือ Monty รู้ว่ารางวัลอยู่ที่ไหนจะไม่เปิดประตูที่ซ่อนรางวัลและจะเปิดประตูที่ไม่ถูกเลือกเสมอ (เช่นถ้าคุณเลือกประตูที่ไม่มีรางวัลเขาจะไม่เปิดประตูที่คุณมี เลือกแล้วพูดว่า "ขอโทษคุณแพ้!" และส่งคุณกลับไปที่ที่นั่งของคุณ) และเขาจะเสนอทางเลือกให้สลับไปที่ประตูอื่น (ยกเลิกการเปิด) ที่ไม่มีคนเปิด ประตูที่มีรางวัล.) ในสถานการณ์เหล่านี้ถ้าหมายถึงกรณีที่เลือกครั้งแรกของคุณเป็นประตูที่มีรางวัลแล้ว{3} ถ้าAP(A)=13Bคือเหตุการณ์ที่การเลือกสุดท้ายของคุณคือประตูที่มีรางวัลจากนั้น

  • หากกลยุทธ์ของคุณคือการวางไว้เสมอแล้ว (เนื่องจากคุณเลือกถูกต้องในการเริ่มต้นและติดกับมัน) และ (เพราะคุณ ทำให้เลือกผิดในการเริ่มต้นและติดกับมัน) ดังนั้นโดยกฎความน่าจะเป็นทั้งหมด P(BA)=1P(BAc)=0
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=1×13+0×23=13
  • ถ้ากลยุทธ์ของคุณคือการสลับเสมอแล้ว (ตั้งแต่คุณได้ทำทางเลือกที่เหมาะสมในการเริ่มต้นแล้วเปลี่ยน) และ (เพราะคุณทำผิด ตัวเลือกในการเริ่มต้นและเพื่อให้แน่ใจว่าประตูที่เหลืออยู่ (ไม่ได้เปิดออก) จะได้รับรางวัล) ดังนั้นโดยกฎความน่าจะเป็นทั้งหมด P(BA)=0P(BAc)=1
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=0×13+1×23=23

ที่นี่สถานการณ์แตกต่างกัน นอกจากนี้ไม่มีสถานที่การเปลี่ยนแปลงกับในขณะที่ "ถ้าบอกว่าฉันจะเปลี่ยนสถานที่ของฉันกับ B หลังจากที่เขาบอกว่าซีจะตายเขามี 2/3 โอกาสที่จะถูกบันทึกไว้." B

เพิ่มความคิดเห็น: ความแตกต่างอีกประการหนึ่งคือ A ไม่มีข้อมูลว่าผู้คุมรู้ว่าใครจะได้รับการให้อภัยหรือผู้คุมกำลังพูดความจริงเมื่อเขาบอกว่า C จะถูกประหารชีวิต ในทางกลับกันผู้คุมถูกต้องสมบูรณ์เมื่อเขาพูดว่าการบอกว่า C จะถูกประหารชีวิตนั้นไม่มีข้อมูลที่เป็นประโยชน์กับ A. การเปรียบเทียบที่ใกล้เคียงที่สุดกับปัญหา Monty Hall คือหลังจากที่ A ได้เลือกประตูแล้ว Monty จะเปิด ยกเลิกการเลือกประตูเพื่อเปิดเผยแพะและบอกกับ A "เปิดประตูแล้วมาดูสิ่งที่คุณได้รับ" นั่นคือไม่มีข้อเสนอของสวิตช์ โอกาสของ A ในการชนะรางวัล (Monty Hall) หรือถูกอภัยโทษ (ปัญหานักโทษ) เหมือนกัน:จาก13 ไม่ว่ามอนตี้จะเปิดประตูที่ไม่ได้เลือกเพื่อเปิดเผยแพะหรือไม่หรือผู้คุมบอกว่า A จะดำเนินการ C หรือไม่เหมือนกับที่เฮนรี่คำนวณในรายละเอียด


ฉันคิดว่าเราสามารถสันนิษฐานได้ว่าผู้ต้องขังมีข้อมูลนั้นมิฉะนั้นปัญหานั้นไม่คุ้มกับการให้เหตุผล (ถ้าผู้คุมมีความเป็นไปได้ที่ไม่ทราบสาเหตุของการโกหกพวกเขาอาจไม่พูดอะไรเลย สำหรับประเด็นแรกของคุณ: แน่นอนว่าผลลัพธ์จะแตกต่างจากในปัญหา Monty Hall เพราะไม่มีตัวเลือกให้เปลี่ยน แต่ตรรกะนั้นเหมือนกัน: โดยการเปิดเผยตัวเลือกหนึ่งที่ไม่ใช่ผู้ชนะข้อมูลจะถูกจัดเตรียมเกี่ยวกับตัวเลือกอื่นที่ผู้คุม / Monty สามารถเลือกได้
Ruben van Bergen

2

คำตอบนั้นขึ้นอยู่กับวิธีที่ผู้ต้องขังเลือกว่านักโทษคนใดจะตั้งชื่อเมื่อเขารู้ว่าจะต้องให้อภัย พิจารณากฎสองข้อ:

1) ผู้คุมเลือกระหว่าง B และ C โดยการสุ่มและเพิ่งจะพูดว่า C ในกรณีนี้ โอกาสที่จะได้รับการอภัยคือ 1/3

2) ผู้คุมพูดเสมอ C. จากนั้นโอกาสที่จะได้รับการอภัยคือ 1/2

ทั้งหมดที่เราได้รับการบอกกล่าวคือผู้คุมพูดว่า C ดังนั้นเราจึงไม่ทราบว่ากฎเหล่านี้เขาปฏิบัติตามกฎใด ในความเป็นจริงอาจมีกฎอื่น ๆ - บางทีผู้ต้องขังจะต้องตายและบอกว่า C เท่านั้นถ้าเขากลิ้งที่ 6



0

ลองนึกภาพว่าผู้คุมบอกว่า C จะต้องตายอย่างแน่นอน จากนั้นเขาก็บอก B ว่า C จะต้องตายอย่างแน่นอน เป็นที่ชัดเจนในกรณีนี้ว่า A และ B มี 50% ต่อการให้อภัย แต่ความแตกต่างระหว่างสองรุ่นคืออะไร?


0

สามปัญหานักโทษเป็นความแตกต่างจากมอนตี้ฮอลล์ ความเป็นไปได้ที่จะได้รับการอภัยนั้นจริง ๆ แล้วคือสำหรับอลิซไม่ใช่แต่เฉพาะในกรณีที่ผู้คุมติดตามกลยุทธ์1/22/3

เหตุการณ์: - อลิซถูกอภัยโทษ เหมือนกันสำหรับและC - ผู้คุมบอกอลิซชื่อ "บ็อบ" (เป็นคำตอบของ "ใครจะถูกประหารชีวิต") - เขาบอกชื่อ "คาร์ล" เขาไม่สามารถตั้งชื่ออลิซด้วยตนเองได้เนื่องจากกฎเกณฑ์ABCJJc

เรากำลังสนใจใน(J) ขณะนี้มีสองสถานการณ์:P(A|J)=P(J|A)P(A)/P(J)

  1. ผู้คุมโยนเหรียญก่อนที่จะบอก B หรือ C:{2}P(J|A)=12

P(A|J)=12×13/12=13
  1. ผู้คุมบอกชื่อบ๊อบเมื่อใดก็ตามที่เป็นไปได้:ยัง และ0P(J|A)=1P(J|C)=1P(J|B)=0

P(J)=P(J|B)P(B)+P(J|Bc)P(Bc)=0×13+1×23=23

P(A|J)=1×13/23=12

1
จะไม่ "ชื่อคาร์ลเสมอเมื่อเป็นไปได้" จะเป็นไปได้อย่างน่าเชื่อถือว่า "ชื่อบ๊อบเสมอเมื่อเป็นไปได้"?
Juho Kokkala

ใช่กลยุทธ์ S '= "ชื่อคาร์ลถ้าเป็นไปได้เสมอ" จะต้องเทียบเท่ากันโดยสมบูรณ์ถ้าเรากำหนด J อีกครั้ง หากเราปล่อยให้ J เป็นและบังคับให้ผู้คุมติดตาม S 'มันจะทำให้ทุกอย่างที่กำหนดไว้ล่วงหน้า: เมื่อใดก็ตามที่ J (ผู้คุมบอก Bob) เรารู้ว่ามันเป็นไปไม่ได้ที่จะพูดว่า "Carl" ดังนั้น Carl จึงถูกให้อภัย .
Mikhail Volkhov

-1

หลังจากได้รับข้อมูลว่านักโทษ C จะตายโอกาสของเขาเปลี่ยนเป็น 1/2 แต่เพียงเพราะโอกาสที่เขาได้รับข้อมูลนั้นมีอยู่แล้ว 2/3 (ความเป็นไปได้ที่นักโทษนักโทษ C จะได้รับการอภัยจะถูกกำจัด )

และ 2/3 * 1/2 คือความน่าจะเป็นแบบดั้งเดิมสำหรับการปลดปล่อย

สิ่งที่น่าเชื่อถือมากขึ้นคือแนวทางตรงข้าม:

สมมติว่าเขาถูกบอกว่านักโทษ C จะได้รับการอภัยโทษ
โอกาสใดที่เขาจะไม่ถูกสังหาร?
ทุกคนจะยอมรับว่าโอกาสของเขาเป็นศูนย์โดยสมมติว่าผู้คุมไม่ได้โกหกและมีการให้อภัยเพียงคนเดียว

คราวนี้เขามีโอกาส 1/1 เพราะโอกาสของข้อมูลนั้นอยู่ที่ 1/3 แล้ว


สิ่งนี้ไม่ถูกต้อง ดูการคำนวณในคำตอบของเฮนรี่ซึ่งแสดงให้เห็นว่าหลังจากได้ยินข้อมูลของผู้ต้องขังนักโทษ A มีโอกาสตาย 2/3 (ไม่ใช่ 1/2) นี่เป็นความน่าจะเป็นแบบเดียวกันกับที่เขาเคยมีมาก่อนดังนั้นผู้คุมที่ถูกต้อง: สิ่งที่เขาบอกว่า A ไม่ได้เปลี่ยนแปลงอะไรเลยสำหรับอัตราการใช้ชีวิตของ A ถ้า B กำลังฟังอยู่ตอนนี้เขาจะรู้ว่าโอกาสในการตายของเขาลดลงเหลือ 1/3
Ruben van Bergen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.