ปัญหาซองจดหมายสองฉบับกลับมาอีกครั้ง


16

ฉันกำลังคิดถึงปัญหานี้อยู่

http://en.wikipedia.org/wiki/Two_envelopes_problem

ฉันเชื่อวิธีแก้ปัญหาและฉันคิดว่าฉันเข้าใจ แต่ถ้าฉันใช้แนวทางต่อไปนี้ฉันสับสนอย่างสมบูรณ์

ปัญหาที่ 1:

ฉันจะเสนอเกมต่อไปนี้ให้คุณ คุณจ่ายให้ฉัน$ 10 และฉันจะพลิกเหรียญที่ยุติธรรม หัวฉันให้คุณ$ 5 และก้อยฉันให้คุณ$ 20

ความคาดหวังคือ$ 12.5 ดังนั้นคุณจะเล่นเกมเสมอ

ปัญหาที่ 2:

ฉันจะให้ซองจดหมายกับคุณ$ 10 ซองจดหมายนั้นเปิดอยู่และคุณสามารถตรวจสอบได้ จากนั้นผมก็แสดงให้คุณเห็นซองจดหมายอีกปิดเวลานี้และบอกคุณ: ซองจดหมายนี้อย่างใดอย่างหนึ่งมี$ 5 หรือ $ 20 ในนั้นมีโอกาสที่เท่าเทียมกัน คุณต้องการสลับหรือไม่

ฉันรู้สึกว่านี่เป็นปัญหาเดียวกับปัญหา 1 คุณเสียเงิน $ 10 สำหรับ$ 5 หรือ$ 20 ดังนั้นคุณจะเปลี่ยนอีกครั้ง

ปัญหาที่ 3:

ฉันทำเช่นเดียวกับข้างบน แต่ปิดซองจดหมาย ดังนั้นคุณไม่ทราบว่ามี $ 10 แต่มีจำนวน X ฉันบอกคุณอีกซองหนึ่งมีสองหรือครึ่ง ตอนนี้ถ้าคุณทำตามตรรกะเดียวกับที่คุณต้องการเปลี่ยน นี่คือความขัดแย้งของซองจดหมาย

เกิดอะไรขึ้นเมื่อฉันปิดซองจดหมาย

แก้ไข:

บางคนแย้งว่าปัญหาที่ 3 ไม่ใช่ปัญหาของซองจดหมายและฉันจะลองทำตามด้านล่างทำไมฉันถึงคิดว่ามันคือการวิเคราะห์ว่าแต่ละครั้งที่ดูเกมอย่างไร นอกจากนี้ยังให้การตั้งค่าที่ดีขึ้นสำหรับเกม

ให้คำอธิบายสำหรับปัญหาที่ 3:

จากมุมมองของผู้จัดเกม:

ฉันถือ 2 ซอง ในหนึ่งฉันใส่$ 10 ปิดและมอบให้ผู้เล่น จากนั้นฉันก็บอกเขาว่าฉันมีซองจดหมายอีกหนึ่งซองที่มีจำนวนซองจดหมายสองเท่าหรือครึ่งหนึ่งที่ฉันเพิ่งให้คุณ คุณต้องการสลับหรือไม่ จากนั้นฉันจะพลิกเหรียญที่ยุติธรรมและหัวฉันใส่$ 5 และก้อยฉันใส่$ 20 แล้วส่งซองให้เขา ฉันถามเขาแล้ว ซองจดหมายที่คุณเพิ่งให้ฉันมีจำนวนซองจดหมายที่คุณถืออยู่สองหรือครึ่ง คุณต้องการสลับหรือไม่

จากมุมมองของผู้เล่น:

ฉันได้รับซองจดหมายและบอกว่ามีอีกซองหนึ่งที่มีสองหรือครึ่งหนึ่งของจำนวนเงินที่มีโอกาสเท่ากัน ฉันต้องการเปลี่ยน ฉันคิดว่าฉันมีดังนั้น1Xดังนั้นฉันต้องการเปลี่ยน ฉันได้รับซองจดหมายและในทันใดฉันก็เผชิญสถานการณ์เดียวกัน ฉันต้องการสลับอีกครั้งเนื่องจากซองจดหมายอื่นมีจำนวนสองเท่าหรือครึ่งหนึ่ง12(12X+2X)>X


2
อย่างน้อยสำหรับฉันความเข้าใจที่สำคัญคือฉันไม่สามารถพูดว่า "ฉันมี X ดังนั้น (1/2 * X + 2X) / 2> X" - โอกาสเฉลี่ยโดยรวมคือ 50/50 แต่สำหรับ X ใด ๆ โอกาสที่คาดหวังจะไม่ 50/50 อีกต่อไป; และ X ที่ใหญ่กว่าโอกาสที่ต่ำกว่าที่จะมี 2 * X ในซองจดหมายอื่น (สำหรับการแจกแจงบวกที่แน่นอน); ดังนั้นการบูรณาการมากกว่า X'es ที่เป็นไปได้ sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = Xโดยที่ f (X) เป็นโอกาสของซองจดหมายแรกที่มีขนาดใหญ่ขึ้นให้ X ใด ๆ โดยเฉพาะ
Peteris

1
ในคำแถลงเรื่องความขัดแย้งไม่มีอะไรที่บอกว่าจำนวนผู้ได้รับการคัดเลือกจากการทดลองและจากนั้นผู้ทดลองเลือกที่จะสุ่มใส่หรือX / 2ในซองอื่น ความจริงที่ว่าคุณเก็บมหันต์สถานการณ์ที่คุณสร้างขึ้นด้วยสองซองขัดแย้งหมายความว่าคุณไม่เข้าใจว่าทำไมมันไม่ถูกต้องสำหรับผู้เล่นที่จะเชื่อว่ามีโอกาสที่ 50/50 ซองอื่น ๆ ที่เป็นทั้งX / 2หรือ2 X ในปัญหาซองจดหมายสองอันที่เกิดขึ้นจริงความน่าจะเป็นที่2 Xอยู่ในซองจดหมายอีกอันคือ 0 หรือ 1XX/2X/22X2X
jsk

คุณพูดถูก ฉันไม่ได้ undestand :( ดังนั้นคำถามฉันพยายามเข้าใจความแตกต่างระหว่างปัญหา 3 ที่ฉันได้ระบุและซองจดหมายที่ขัดแย้งกันฉันเข้าใจว่าใน Paradox มีสองซองจดหมายดังนั้น X และ 2X และทำ แต่ฉันไม่ ' ดูว่ามันแตกต่างจากการให้ใครบางคนซองแล้วพลิกเหรียญเพื่อตัดสินใจที่จะใส่จำนวนอื่น ๆ
evan54

1
เคล็ดลับสำหรับสิ่งนี้คือข้อสันนิษฐานที่มีข้อบกพร่องซึ่งผลลัพธ์หรือ2 Xนั้นมีแนวโน้มที่เท่าเทียมกัน ถ้า2 Xอยู่ในซองจดหมายอื่น ๆ แล้วกำไรที่คาดหวังจากการเปลี่ยนเป็น2 X - X = X ถ้าX / 2อยู่ในซองจดหมายอื่น ๆ แล้วกำไรที่คาดหวังจากการเปลี่ยนเป็นX / 2 - X = - X / 2 ผู้เล่นไม่รู้ว่าเขาอยู่ในสถานการณ์แบบใด แต่นั่นไม่ได้หมายความว่าเขาควรจะเชื่อว่ามีโอกาส 50/50 X/22X2X2XX=XX/2X/2X=X/2
jsk

1
สมมติว่าซองจดหมายประกอบด้วยและ2 X หากคุณลงท้ายด้วยXดังนั้นความน่าจะเป็นที่2 Xอยู่ในซองอื่น ๆ คือ 1 และความน่าจะเป็นที่X / 2อยู่ในซองอื่นคือ 0 ถ้าคุณลงท้ายด้วย2 Xดังนั้นความน่าจะเป็นที่2 ( 2 X ) = 4 Xอยู่ในซองจดหมายอื่นคือ 0 และความน่าจะเป็นที่2 X / 2 = Xอยู่ในซองอื่น ๆ คือ 1X2XX2XX/22X2(2X)=4X2X/2=X
jsk

คำตอบ:


23

1. ความเป็นไปได้ที่ไม่จำเป็น

อีกสองส่วนถัดไปของบันทึกนี้วิเคราะห์ปัญหา "เดาซึ่งใหญ่กว่า" และ "สองซองจดหมาย" โดยใช้เครื่องมือมาตรฐานของทฤษฎีการตัดสินใจ (2) วิธีนี้แม้จะตรงไปตรงมา แต่ดูเหมือนจะใหม่ โดยเฉพาะอย่างยิ่งมันระบุชุดของขั้นตอนการตัดสินใจสำหรับปัญหาซองจดหมายสองอันที่เหนือกว่ากระบวนการ“ เปลี่ยนเสมอ” หรือ“ ไม่เคยเปลี่ยน”

ส่วนที่ 2 แนะนำคำศัพท์แนวคิดและสัญลักษณ์ (มาตรฐาน) มันวิเคราะห์ขั้นตอนการตัดสินใจที่เป็นไปได้ทั้งหมดสำหรับ "คาดเดาซึ่งเป็นปัญหาที่ใหญ่กว่า" ผู้อ่านที่คุ้นเคยกับเนื้อหานี้อาจต้องการข้ามหัวข้อนี้ ส่วนที่ 3 ใช้การวิเคราะห์ที่คล้ายกันกับปัญหาสองซอง ส่วนที่ 4 ข้อสรุปสรุปประเด็นสำคัญ

การวิเคราะห์ที่เผยแพร่ทั้งหมดของปริศนาเหล่านี้สมมติว่ามีการกระจายความน่าจะเป็นที่ควบคุมสภาวะของธรรมชาติที่เป็นไปได้ อย่างไรก็ตามข้อสันนิษฐานนี้ไม่ได้เป็นส่วนหนึ่งของข้อความไขปริศนา แนวคิดหลักในการวิเคราะห์เหล่านี้คือการทิ้งข้อสันนิษฐานที่ไม่เป็นธรรมนี้นำไปสู่การแก้ปัญหาความขัดแย้งที่ชัดเจนในปริศนาเหล่านี้

2. ปัญหา“ คาดเดาซึ่งมีขนาดใหญ่กว่า”

มีการบอกผู้ทดลองว่าตัวเลขจริงที่แตกต่างกันและx 2เขียนบนกระดาษสองใบ เธอดูหมายเลขบนสลิปที่เลือกแบบสุ่ม จากการสังเกตครั้งนี้เพียงอย่างเดียวเธอต้องตัดสินใจว่ามันจะเล็กกว่าหรือใหญ่กว่าของตัวเลขทั้งสองx1x2

ปัญหาที่เรียบง่าย แต่ปลายเปิดเช่นนี้เกี่ยวกับความน่าจะเป็นนั้นเกิดจากความสับสนและต่อต้านได้ง่าย โดยเฉพาะอย่างยิ่งมีวิธีที่แตกต่างอย่างน้อยสามวิธีที่ความน่าจะเป็นเข้ามาในรูปภาพ ในการชี้แจงเรื่องนี้เราจะใช้มุมมองการทดลองอย่างเป็นทางการ (2)

เริ่มต้นด้วยการระบุฟังก์ชั่นการสูญเสีย เป้าหมายของเราคือการลดความคาดหวังในแง่ที่จะกำหนดไว้ด้านล่าง ทางเลือกที่ดีคือการสูญเสียเท่ากับเมื่อผู้ทดสอบคาดเดาถูกต้องและ0 เป็นอย่างอื่น ความคาดหวังของฟังก์ชันการสูญเสียนี้คือความน่าจะเป็นในการคาดเดาที่ไม่ถูกต้อง โดยทั่วไปด้วยการกำหนดบทลงโทษต่าง ๆ ให้กับการเดาผิดฟังก์ชั่นการสูญเสียจะรวบรวมวัตถุประสงค์ของการเดาได้อย่างถูกต้อง เพื่อให้แน่ใจว่าการใช้ฟังก์ชั่นการสูญเสียเป็นไปตามอำเภอใจเช่นสมมติว่ามีการแจกแจงความน่าจะเป็นก่อนหน้านี้ใน x 1 และ x 210x1x2แต่มันเป็นธรรมชาติและพื้นฐานมากกว่า เมื่อเราเผชิญกับการตัดสินใจเราจะพิจารณาผลที่ตามมาของการถูกหรือผิด หากไม่มีผลกระทบอย่างใดอย่างหนึ่งแล้วทำไมต้องใส่ใจ? เราทำการพิจารณาถึงความสูญเสียที่อาจเกิดขึ้นโดยปริยายเมื่อใดก็ตามที่เราทำการตัดสินใจ (ด้วยเหตุผล) ดังนั้นเราจึงได้รับประโยชน์จากการพิจารณาความสูญเสียอย่างชัดเจนในขณะที่การใช้ความน่าจะเป็นเพื่ออธิบายค่าที่เป็นไปได้บนแผ่นกระดาษ เราจะเห็นว่า - สามารถป้องกันเราจากการได้รับการแก้ปัญหาที่มีประโยชน์

ทฤษฎีการตัดสินใจเป็นตัวอย่างผลการสังเกตและการวิเคราะห์ของเรา มันใช้วัตถุทางคณิตศาสตร์เพิ่มเติมสามชิ้น: พื้นที่ตัวอย่างชุดของ "สถานะของธรรมชาติ" และขั้นตอนการตัดสินใจ

  • พื้นที่ตัวอย่าง ประกอบด้วยการสังเกตที่เป็นไปได้ทั้งหมด ที่นี่สามารถระบุได้ด้วย R (ชุดของจำนวนจริง) SR

  • สภาวะของธรรมชาติ คือการแจกแจงความน่าจะเป็นไปได้ที่ควบคุมผลการทดลอง (นี่เป็นความรู้สึกแรกที่เราอาจพูดถึง "ความน่าจะเป็น" ของเหตุการณ์) ในปัญหา "เดาว่าใหญ่กว่า" นี่คือการแจกแจงแบบแยกซึ่งรับค่าที่ตัวเลขจริงที่ชัดเจน x 1 และ x 2 ที่ มีความน่าจะเท่ากัน ของ1Ωx1x2ที่แต่ละค่า Ω สามารถแปรโดย{ω=(x1,x2)R×R| x1>x2}12Ω{ω=(x1,x2)R×R | x1>x2}.

  • พื้นที่การตัดสินใจที่เป็นชุดไบนารี ของการตัดสินใจที่เป็นไปได้Δ={smaller,larger}

ในแง่เหล่านี้ฟังก์ชั่นการสูญเสียเป็นมูลค่าจริงฟังก์ชั่นกำหนดไว้ใน Δ มันบอกเราว่าการตัดสินใจ“ ไม่ดี” นั้นเป็นอย่างไร (อาร์กิวเมนต์ที่สอง) เมื่อเทียบกับความเป็นจริง (อาร์กิวเมนต์แรก)Ω×Δ

ที่สุดขั้นตอนการตัดสินใจโดยทั่วไป พร้อมที่จะทดลองเป็นแบบสุ่มที่หนึ่ง: ความคุ้มค่าคุ้มผลการทดลองใด ๆ ที่เป็นความน่าจะเป็นในการกระจาย Δ นั่นคือการตัดสินใจที่จะทำให้เมื่อสังเกตผล x ไม่จำเป็นต้องเป็นแน่นอน แต่จะได้รับการสุ่มเลือกตามการกระจาย δ ( x ) (นี่เป็นวิธีที่สองที่น่าจะเกี่ยวข้อง)δΔxδ(x)

เมื่อ มีเพียงสององค์ประกอบขั้นตอนการสุ่มใด ๆ สามารถระบุได้โดยความน่าจะเป็นที่จะกำหนดให้กับการตัดสินใจที่กำหนดไว้ล่วงหน้าซึ่งเป็นรูปธรรมที่เราใช้เพื่อให้ "ใหญ่ขึ้น" Δ

ตัวหมุน

ทางกายภาพการดำเนินการปั่นเช่นขั้นตอนการสุ่มไบนารี: ตัวชี้ได้อย่างอิสระหมุนจะมาหยุดในพื้นที่ตอนบนที่สอดคล้องกับการตัดสินใจหนึ่งในด้วยโอกาสที่จะδและอื่น ๆ จะหยุดในพื้นที่ด้านล่างซ้ายที่มีความน่าจะเป็น1 - δ ( x ) ปั่นอย่างสมบูรณ์จะถูกกำหนดโดยการระบุค่าของδ ( x ) [ 0 , 1 ]Δδ1δ(x)δ(x)[0,1]

ดังนั้นขั้นตอนการตัดสินใจจึงถือได้ว่าเป็นฟังก์ชั่น

δ:S[0,1],

ที่ไหน

Prδ(x)(larger)=δ(x)  and  Prδ(x)(smaller)=1δ(x).

ในทางกลับกันฟังก์ชัน จะกำหนดขั้นตอนการตัดสินใจแบบสุ่ม การตัดสินใจแบบสุ่มรวมถึงการตัดสินใจกำหนดในกรณีพิเศษที่หลากหลายของ โกหกใน\}δ { 0 , 1 }δδ{0,1}

ให้เราบอกว่าค่าใช้จ่ายของกระบวนการตัดสินใจสำหรับผล คือการสูญเสียที่คาดหวังของ(x) ความคาดหวังเกี่ยวกับการกระจายความน่าจะ ในพื้นที่ตัดสินใจ \สภาพของธรรมชาติแต่ละ (ซึ่งเรียกเป็นกระจายทวินามในพื้นที่ตัวอย่าง ) กำหนดค่าใช้จ่ายที่คาดว่าขั้นตอนใด ๆ ; นี่คือความเสี่ยงของ สำหรับ ,x δ ( x ) δ ( x ) Δ ω S δ δ ω เสี่ยงδ ( ω ) ωδxδ(x)δ(x)ΔωSδδωRiskδ(ω). นี่คือความคาดหวังจะได้รับด้วยความเคารพต่อรัฐของธรรมชาติ \ω

ขั้นตอนการตัดสินใจถูกนำมาเปรียบเทียบในแง่ของฟังก์ชั่นความเสี่ยง เมื่อสภาพของธรรมชาติเป็นที่รู้จักอย่างแท้จริงและเป็นสองขั้นตอนและสำหรับทุก , ดังนั้นจึงไม่มีความรู้สึกในการใช้โพรซีเดอร์ เนื่องจากโพรซีเดอร์ จะไม่เลวร้ายไปกว่านี้ (และอาจดีกว่าในบางกรณี) ขั้นตอนดังกล่าว คือไม่ยอมรับ ; มิฉะนั้นจะยอมรับได้ บ่อยครั้งที่กระบวนการที่ยอมรับได้มีอยู่มากมาย เราจะพิจารณาอย่างใดอย่างหนึ่งของพวกเขา“ ดี” เพราะไม่มีใครสามารถทำได้อย่างต่อเนื่องโดยขั้นตอนอื่น ๆδ ความเสี่ยงε ( ω ) เสี่ยงδ ( ω ) ω ε δ εεδRiskε(ω)Riskδ(ω)ωεδε

โปรดทราบว่าไม่มีการเผยแพร่ก่อนหน้านี้ใน (a“ กลยุทธ์แบบผสมสำหรับ ” ในคำศัพท์ของ (1)) นี่เป็นวิธีที่สามซึ่งความน่าจะเป็นอาจเป็นส่วนหนึ่งของการตั้งค่าปัญหา การใช้มันทำให้การวิเคราะห์ในปัจจุบันนั้นกว้างกว่าของ (1) และการอ้างอิงในขณะที่ยังง่ายกว่าCΩC

ตารางที่ 1ประเมินความเสี่ยงเมื่อได้รับสถานะของธรรมชาติที่แท้จริงโดย จำได้ว่า x 1 > x 2ω=(x1,x2).x1>x2.

ตารางที่ 1.

Decision:LargerLargerSmallerSmallerOutcomeProbabilityProbabilityLossProbabilityLossCostx11/2δ(x1)01δ(x1)11δ(x1)x21/2δ(x2)11δ(x2)01δ(x2)

Risk(x1,x2): (1δ(x1)+δ(x2))/2.

ในแง่เหล่านี้ปัญหา“ คาดเดาที่มีขนาดใหญ่กว่า” จะกลายเป็น

ให้คุณรู้ว่าไม่มีอะไรเกี่ยวกับ และ ยกเว้นว่าจะแตกต่างกันคุณสามารถค้นหาขั้นตอนการตัดสินใจ ซึ่งมีความเสี่ยง น้อยกว่าหรือไม่x 2 δ [ 1 - δ ( สูงสุด( x 1 , x 2 ) ) + δ ( ขั้นต่ำ( x 1 , x 2 ) ) ] / 2 1x1x2δ[1δ(max(x1,x2))+δ(min(x1,x2))]/212

คำสั่งนี้เทียบเท่ากับ เมื่อใดก็ตามที่ ดังนั้นมันเป็นสิ่งที่จำเป็นและเพียงพอสำหรับขั้นตอนการตัดสินใจของผู้ทดลองที่จะถูกระบุโดยฟังก์ชั่นที่เพิ่มขึ้นอย่างเข้มงวด ชุดของขั้นตอนซึ่งรวมถึง แต่มีขนาดใหญ่กว่าทุก“กลยุทธ์ผสม ” ของ1 มีขั้นตอนการตัดสินใจแบบสุ่มมากมายที่ดีกว่าขั้นตอนแบบไม่สุ่มใด ๆ !x > Y δ ' : S [ 0 , 1 ] Qδ(x)>δ(y)x>y.δ:S[0,1].Q

3. ปัญหา“ สองซอง”

มันเป็นกำลังใจที่การวิเคราะห์ที่ตรงไปตรงมาเปิดเผยชุดของการแก้ปัญหา "คาดเดาที่มีขนาดใหญ่" รวมถึงคนที่ดีที่ไม่ได้ระบุมาก่อน ให้เราเห็นว่าวิธีการเดียวกันนี้สามารถเปิดเผยเกี่ยวกับปัญหาอื่น ๆ ต่อหน้าเราปัญหา“ สองซองจดหมาย” (หรือ“ ปัญหากล่อง” เพราะบางครั้งเรียกว่า) สิ่งนี้เกี่ยวข้องกับเกมที่เล่นโดยการสุ่มเลือกหนึ่งในสองซองจดหมายซึ่งหนึ่งในนั้นเป็นที่รู้จักกันว่ามีเงินมากเป็นสองเท่า หลังจากเปิดซองจดหมายและสังเกตปริมาณ 2 x x / 2 , 5 x / 4x ของเงินในนั้นผู้เล่นตัดสินใจว่าจะเก็บเงินไว้ในซองจดหมายที่ยังไม่ได้เปิด (เพื่อ "สลับ") หรือเพื่อเก็บเงินไว้ในซองจดหมายที่เปิดอยู่ ใครจะคิดว่าการสลับและไม่สลับจะเป็นกลยุทธ์ที่ยอมรับได้อย่างเท่าเทียมกันเนื่องจากผู้เล่นมีความไม่แน่นอนเท่ากันว่าซองจดหมายใดที่มีจำนวนมาก ความขัดแย้งคือการสลับที่ดูเหมือนจะเป็นตัวเลือกที่ดีกว่าเพราะมันมีทางเลือก "น่าจะเป็นไปได้อย่างเท่าเทียมกัน" ระหว่างการจ่ายเงิน และ ซึ่งคาดว่าค่าของ เกินกว่าค่าในซองจดหมายที่เปิด โปรดทราบว่ากลยุทธ์ทั้งสองนี้กำหนดขึ้นและคงที่2xx/2,5x/4

ในสถานการณ์นี้เราอาจเขียนอย่างเป็นทางการ

S={xR | x>0},Ω={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},andΔ={Switch,Do not switch}.

เมื่อก่อนการตัดสินใจใด ๆ ขั้นตอน ได้รับการพิจารณาจากฟังก์ชั่น เพื่อขณะนี้โดยการเชื่อมโยงกับความน่าจะเป็นของการไม่เปลี่ยนที่อีกครั้งซึ่งสามารถเขียน(x) ความน่าจะเป็นของการสลับต้องแน่นอนว่าเป็นค่าเสริมS [ 0 , 1 ] , δ ' ( x ) 1 - δ ' ( x )δS[0,1],δ(x)1δ(x).

การสูญเสียดังแสดงในตารางที่ 2เป็นค่าลบของผลตอบแทนของเกม มันเป็นหน้าที่ของสถานะที่แท้จริงของธรรมชาติ , ผลลัพธ์ (ซึ่งอาจเป็น หรือ ), และการตัดสินใจ, ซึ่งขึ้นอยู่กับผลลัพธ์x ω 2 ωωxω2ω

ตารางที่ 2

LossLossOutcome(x)SwitchDo not switchCostω2ωωω[2(1δ(ω))+δ(ω)]2ωω2ωω[1δ(2ω)+2δ(2ω)]

นอกเหนือไปจากการแสดงฟังก์ชั่นการสูญเสียตารางที่ 2 นอกจากนี้ยังมีการคำนวณค่าใช้จ่ายในขั้นตอนการตัดสินใจโดยพล \เนื่องจากเกมดังกล่าวสร้างผลลัพธ์ทั้งสองที่มีความน่าจะเป็นเท่ากับความเสี่ยงเมื่อ เป็นสถานะที่แท้จริงของธรรมชาติคือ1δ ω12ω

Riskδ(ω)=ω[2(1δ(ω))+δ(ω)]/2+ω[1δ(2ω)+2δ(2ω)]/2=(ω/2)[3+δ(2ω)δ(ω)].

ขั้นตอนอย่างต่อเนื่องซึ่งหมายถึงการเปลี่ยนเสมอ ( ) หรือมักจะยืน pat ( ) จะมีความเสี่ยง 2 ฟังก์ชันที่เพิ่มขึ้นอย่างเข้มงวดหรือโดยทั่วไปฟังก์ชันใด ๆ มีช่วงในซึ่ง สำหรับทุกค่าบวกจริง กำหนดโพรซีเดอร์ มีฟังก์ชันความเสี่ยงซึ่งน้อยกว่าอย่างเคร่งครัดเสมอ และดีกว่ากระบวนการคงที่โดยไม่คำนึงถึงสถานะที่แท้จริงของธรรมชาติ ! δ ( x ) = 1 - 3 ω / 2 δ [ 0 , 1 ] δ ( 2 x ) > δ ( x ) x , δ - 3 ω / 2 ωδ(x)=0δ(x)=13ω/2δ[0,1]δ(2x)>δ(x)x,δ3ω/2ωดังนั้นขั้นตอนคงที่จึงยอมรับไม่ได้เนื่องจากมีกระบวนการที่มีความเสี่ยงซึ่งบางครั้งต่ำกว่าและไม่เคยสูงกว่า

กลยุทธ์

การเปรียบเทียบสิ่งนี้กับโซลูชันก่อนหน้าของปัญหา“ เดาซึ่งใหญ่กว่า” แสดงการเชื่อมต่ออย่างใกล้ชิดระหว่างทั้งสอง ในทั้งสองกรณีได้รับการแต่งตั้งอย่างเหมาะสมขั้นตอนการสุ่มเป็น demonstrably ดีกว่า“เห็นได้ชัด” กลยุทธ์อย่างต่อเนื่อง

กลยุทธ์การสุ่มเหล่านี้มีคุณสมบัติเด่น:

  • ไม่มีสถานการณ์เลวร้ายสำหรับกลยุทธ์การสุ่ม: ไม่ว่าจำนวนเงินในซองจดหมายจะถูกเลือกในระยะยาวกลยุทธ์เหล่านี้จะไม่เลวร้ายยิ่งกว่ากลยุทธ์คงที่

  • ไม่มีกลยุทธ์แบบสุ่มที่มีค่า จำกัด ที่และควบคุมใด ๆ ของผู้อื่น: หากความคาดหวังของเมื่ออยู่ในซองจดหมายที่เกินความคาดหมายของมีสถานะที่เป็นไปได้อื่น ๆ ด้วยในซองจดหมายและความคาดหวังของเกินกว่าที่ของ \1 δ ( ω , 2 ω ) ε ( η , 2 η ) ε δ01δ(ω,2ω)ε(η,2η)εδ

  • กลยุทธ์รวมถึงเป็นกรณีพิเศษกลยุทธ์เทียบเท่ากับหลายกลยุทธ์แบบเบย์ กลยุทธ์ใดที่ระบุว่า“สวิทช์ถ้าน้อยกว่าเกณฑ์บางและอยู่อย่างอื่น” สอดคล้องกับเมื่อมิฉะนั้นx T δ ( x ) = 1 x T , δ ( x ) = 0δxTδ(x)=1xT,δ(x)=0

ถ้าอย่างนั้นการเข้าใจผิดในการโต้แย้งที่สนับสนุนการสลับเปลี่ยนอยู่เสมอคืออะไร? มันอยู่ในสมมติฐานโดยนัยว่ามีการแจกแจงความน่าจะเป็นสำหรับทางเลือก โดยเฉพาะอย่างยิ่งเมื่อมีการสังเกต ในซองจดหมายที่เปิดอยู่อาร์กิวเมนต์ที่ใช้งานง่ายสำหรับการสลับขึ้นอยู่กับความน่าจะเป็นเงื่อนไข Prob (จำนวนเงินในซองจดหมายที่ไม่ได้เปิด | ถูกสังเกต) ซึ่งเป็นความน่าจะเป็นที่กำหนดไว้ในชุด แต่สิ่งเหล่านี้ไม่สามารถคำนวณได้จากข้อมูล กรอบการตัดสินใจเชิงทฤษฎีไม่จำเป็นต้องมีการแจกแจงความน่าจะเป็นใน เพื่อแก้ปัญหาและไม่ระบุปัญหาx ΩxxΩ

ผลลัพธ์นี้แตกต่างจากที่ได้รับจาก (1) และการอ้างอิงในวิธีที่ละเอียดอ่อน แต่สำคัญ โซลูชั่นอื่น ๆ ทั้งหมดถือว่า (ถึงแม้ว่ามันจะไม่เกี่ยวข้อง) มีการกระจายความน่าจะก่อนใน แล้วแสดงเป็นหลักว่ามันจะต้องเป็นเครื่องแบบกว่า ที่ในที่สุดก็เป็นไปไม่ได้ อย่างไรก็ตามการแก้ปัญหาของปัญหาสองซองจดหมายที่ให้ไว้ที่นี่ไม่ได้เกิดขึ้นเนื่องจากขั้นตอนการตัดสินใจที่ดีที่สุดสำหรับการแจกแจงก่อนหน้านี้บางส่วนและการวิเคราะห์ดังกล่าวถูกมองข้าม ในการรักษาปัจจุบันมันไม่สำคัญว่าการกระจายความน่าจะเป็นก่อนหน้านั้นสามารถมีอยู่ได้หรือไม่ เราอาจอธิบายลักษณะนี้เป็นSΩS.ความแตกต่างระหว่างการไม่แน่ใจว่าสิ่งที่ซองจดหมายมี (ตามที่อธิบายโดยการกระจายก่อนหน้า) และการไม่รู้เนื้อหาอย่างสมบูรณ์ (เพื่อไม่ให้การกระจายก่อนหน้านี้มีความเกี่ยวข้อง)

4. สรุป

ในปัญหา“ คาดเดาซึ่งใหญ่กว่า” ขั้นตอนที่ดีคือการตัดสินใจแบบสุ่มว่าค่าที่สังเกตได้นั้นมีขนาดใหญ่กว่าของทั้งสองโดยมีความน่าจะเป็นที่เพิ่มขึ้นเมื่อค่าที่สังเกตเพิ่มขึ้น ไม่มีขั้นตอนที่ดีที่สุดเดียว ในปัญหา“ สองซองจดหมาย” ขั้นตอนที่ดีเป็นอีกครั้งที่จะตัดสินใจแบบสุ่มว่าจำนวนเงินที่สังเกตได้นั้นคุ้มค่าที่จะเก็บไว้ (นั่นคือมันเป็นจำนวนที่มากขึ้นของทั้งสอง) พร้อมความน่าจะเป็นที่เพิ่มขึ้นเมื่อค่าที่สังเกตเห็นเพิ่มขึ้น ไม่มีขั้นตอนที่ดีที่สุดอีกครั้ง ในทั้งสองกรณีหากผู้เล่นหลายคนใช้ขั้นตอนดังกล่าวและเล่นเกมอย่างอิสระสำหรับระบุดังนั้น (โดยไม่คำนึงถึงมูลค่าของ ) โดยรวมพวกเขาจะชนะมากกว่าที่พวกเขาแพ้เพราะกระบวนการตัดสินใจของพวกเขาชอบการเลือกที่ใหญ่กว่า จำนวนโอห์มωω

ในปัญหาทั้งสองข้อสมมติเพิ่มเติม - การกระจายก่อนหน้านี้เกี่ยวกับสถานะของธรรมชาติ - นั่นไม่ใช่ส่วนหนึ่งของปัญหาก่อให้เกิดความขัดแย้งที่ชัดเจน โดยมุ่งเน้นไปที่สิ่งที่ระบุไว้ในแต่ละปัญหาข้อสันนิษฐานนี้จะหลีกเลี่ยงโดยสิ้นเชิง (ล่อลวงอย่างที่มันควรจะเป็น) ทำให้ความขัดแย้งจะหายไปและทางออกที่ตรงไปตรงมาจะเกิดขึ้น

ข้อมูลอ้างอิง

(1) D. Samet, I. Samet และ D. Schmeidler, One Observation Puzzles ปริศนาสองซอง American Mathematical รายเดือน 111 (เมษายน 2004) 347-351

(2) J. Kiefer การอนุมานทางสถิติเบื้องต้น Springer-Verlag, New York, 1987


8
นี่เป็นบทความสั้น ๆ ที่ฉันเขียนเมื่อสิบปีก่อน แต่ไม่เคยตีพิมพ์ (บรรณาธิการใหม่ของ AMM ไม่เห็นความสนใจทางคณิตศาสตร์ในนั้น) ฉันได้พูดถึงเรื่องที่ฉันเล่นเกมสองซองกับผู้ชมโดยใช้เงินจริงจำนวนมาก
whuber

1
เขียนได้ดีมาก! Joe Blitzstein พูดคุยเกี่ยวกับปัญหา evelope ทั้งสองในการบรรยาย Harvard Stat 110 ซึ่งให้บริการฟรีบน youtube หากใครก็ตามที่สนใจ btw
Benjamin Lindqvist

@whuber พิจารณาตัวแปรนี้ สมมติว่าฉันเลือกเงินสองจำนวนเช่นที่หนึ่งเท่ากับสองเท่า จากนั้นฉันก็พลิกเหรียญที่ยุติธรรมเพื่อตัดสินว่าจะไปไหนในซองจดหมาย ตอนนี้คุณเลือกซองจดหมายแบบสุ่มและลองนึกภาพจำนวนที่อยู่ข้างในเรียกมันว่า (ถ้าขั้นตอนนี้น่าสงสัยให้พิจารณากรณีของการเปิดซองจดหมายและดูจำนวนจริง - เนื่องจากเหตุผลใช้ไม่ว่าคุณจะเห็นคุณค่าเท่าใด ภายในก็ควรนำไปใช้กับทั่วไป ) จากนั้นคำนวณมูลค่าที่คาดหวังของเงินในซองจดหมายอื่น ๆ เป็น ...x E = ( 1 / 2 ) ( x / 2 ) + ( 1 / 2 ) ( 2 x ) = 1.25 x > xxxE=(1/2)(x/2)+(1/2)(2x)=1.25x>x
Zubin Mukerjee

ฉันเดาว่าฉันไม่เข้าใจว่าด้วยเหตุผลใดฉันจึง "สันนิษฐานว่ามีการเผยแพร่ก่อนหน้านี้เกี่ยวกับสภาวะของธรรมชาติ" ใช่ฉัน เห็นได้ชัดว่าการใช้เหตุผลไม่ถูกต้องเพราะฉันไม่สามารถปรับเปลี่ยนไปใช้ซองจดหมายอื่นได้เพียงแค่คิดถึงซองจดหมายแรก (เนื่องจากตรรกะเดียวกันจะใช้กับซองที่สองเมื่อฉันสลับหนึ่งครั้ง)
Zubin Mukerjee

2
@Zubin มีข้อผิดพลาดพื้นฐาน (แต่น่าสนใจ) ในการวิเคราะห์นั้นคือ ให้มีปริมาณน้อยลงในซองจดหมายสองซอง ได้รับการสังเกตของคุณรู้ว่าทั้งหรือและว่าโอกาสของการสังเกตในกรณีใดกรณีหนึ่งคือ1/2ในกรณีที่อดีตจำนวนในซองจดหมายอื่น ๆ ที่เป็นและในกรณีหลังมันเป็นแต่ในการที่จะกำหนดที่ถูกต้องคาดหวังที่จะคุณต้องถือว่ามีบางส่วนกระจายสำหรับ\ โอกาสที่เท่าเทียมกันไม่เท่ากับความน่าจะเป็นที่เท่ากัน x θ = x θ = x / 2 1 / 2 Y 2 x x / 2 Y θθxθ=xθ=x/21/2Y2xx/2Yθ
whuber

7

ปัญหาโดยทั่วไปที่มีปัญหาสองซองคือปัญหาตามที่นำเสนอบนวิกิพีเดียอนุญาตให้ขนาดของค่าในซองจดหมายเปลี่ยนแปลงหลังจากตัวเลือกแรกได้ถูกทำขึ้น ปัญหาได้รับการกำหนดอย่างไม่ถูกต้อง

แต่สูตรของโลกที่แท้จริงของปัญหานี้คือ: คุณมีสองซองเหมือนกัน: และที่Bคุณสามารถเลือกซองจดหมายใดก็ได้จากนั้นให้สลับB B = 2 AABB=2A

กรณีที่ 1: คุณได้เลือก หากคุณเปลี่ยนคุณได้รับดอลลาร์AAA

กรณีที่ 2: คุณได้เลือกBหากคุณเปลี่ยนคุณจะเสียเงินABA

นี่คือจุดที่ข้อบกพร่องในการขัดแย้งแบบสองซองเข้ามาในขณะที่คุณกำลังมองหามูลค่าครึ่งหนึ่งหรือสูญเสียเงินของคุณเป็นสองเท่าคุณยังไม่ทราบค่าดั้งเดิมของและค่าได้รับการแก้ไขแล้ว สิ่งที่คุณกำลังมองหาที่เป็นทั้งหรือไม่หรือA + A - A 2 A 1AA+AA2A12A

หากเราสมมติว่าความน่าจะเป็นในการเลือกหรือในแต่ละขั้นตอนเท่ากัน หลังจากการแลกเปลี่ยนที่เสนอครั้งแรกผลลัพธ์สามารถเป็นได้ทั้ง:BAB

กรณีที่ 1: เลือก , ไม่มีการสลับ: รางวัลAAA

กรณีที่ 2: เลือกสลับสำหรับ : รางวัลB 2 AAB2A

กรณีที่ 3: เลือกไม่มีการสลับ: รางวัล2 AB2A

กรณีที่ 4: เลือกสลับสำหรับ: รางวัลA ABAA

ผลลัพธ์ที่ได้คือว่าครึ่งเวลาที่คุณได้รับและครึ่งเวลาที่คุณได้รับ2Aสิ่งนี้จะไม่เปลี่ยนแปลงไม่ว่าคุณจะได้รับการแลกเปลี่ยนกี่ครั้งก็ตามและจะไม่เปลี่ยนแปลงโดยขึ้นอยู่กับการรู้ว่ามีอะไรอยู่ในซองเดียว2 AA2A


IMO ปัญหาบอกว่าคุณจะไม่แพ้ A ไม่ว่าจะเกิดอะไรขึ้น ดังนั้น + A vs -A ของคุณจึงไม่เหมาะสม คุณชนะ A หรือ 2A
เลี่ยนน้อย

7

การตีความคำถามของฉัน

ฉันสมมติว่าการตั้งค่าในปัญหา 3 เป็นดังนี้: ผู้จัดเลือกจำนวนและใส่ในซองแรก จากนั้นจัดพลิกเหรียญเป็นธรรมและอยู่บนพื้นฐานที่ทั้งทำให้หรือซองจดหมายที่สอง ผู้เล่นรู้ทั้งหมดนี้แต่ไม่ใช่X 0.5 X 2 X X XXX0.5X2XXหรือผลของการพลิกเหรียญ ผู้จัดทำให้ซองจดหมายแรก (ปิด) และถามว่าผู้เล่นต้องการเปลี่ยนหรือไม่ ผู้ถามระบุว่า 1. ผู้เล่นต้องการสลับเพราะการสลับเพิ่มความคาดหวัง (ถูกต้อง) และ 2. ว่าหลังจากการสลับการให้เหตุผลแบบสมมาตรเหมือนกันและผู้เล่นต้องการสลับกลับ (ไม่ถูกต้อง) ฉันยังสมมติว่าผู้เล่นเป็นตัวแทนเบย์เซียนที่มีความเสี่ยงที่เป็นเหตุเป็นเหตุเป็นเหตุเป็นผลและกระจายความน่าจะเป็นมากกว่าและเพิ่มจำนวนเงินที่คาดหวังได้สูงสุดX

โปรดทราบว่าหากผู้เล่นเราไม่ทราบเกี่ยวกับขั้นตอนการโยนเหรียญอาจไม่มีเหตุผลในตอนแรกที่จะยืนยันว่าความน่าจะเป็นคือ 0.5 สำหรับซองจดหมายที่สองจะสูง / ต่ำ

ทำไมไม่มีความขัดแย้ง

ปัญหาของคุณ 3 (ตามที่อธิบายไว้ในคำตอบของฉัน) ไม่ใช่ความขัดแย้งของซองจดหมาย ให้จะเป็นตัวแปรสุ่ม Bernoulli กับPกำหนดจำนวนเงินที่ในซองที่ 2 เพื่อให้หมายถึงและหมายถึงYในสถานการณ์สมมติที่นี่จะถูกเลือกโดยไม่มีความรู้ผลการพลิกเหรียญและทำให้และเป็นอิสระซึ่งหมายถึง1.25X ดังนั้นถ้าหาก X> 0 (หรืออย่างน้อยZP(Z=1)=0.5YZ=1Y=2XZ=0Y=0.5XXZXE(YX)=1.25X

E(Y)=E(E(YX))=E(1.25X)=1.25E(X)
E(X)>0) ผู้เล่นจะชอบเปลี่ยนเป็นซองจดหมาย 2 อย่างไรก็ตามไม่มีอะไรที่ขัดแย้งกันเกี่ยวกับความจริงที่ว่าถ้าคุณให้ฉันข้อเสนอที่ดี (ซองที่ 1) และโอกาสที่จะเปลี่ยนเป็นข้อตกลงที่ดีกว่า (ซองจดหมาย 2) ฉันจะต้องการ เพื่อสลับไปยังการจัดการที่ดีกว่า

ในการก่อให้เกิดความขัดแย้งคุณต้องทำให้สถานการณ์สมมาตรเพื่อที่คุณจะสามารถโต้แย้งได้ว่าฉันต้องการเปลี่ยนจากซองจดหมาย 2 เป็นซองจดหมาย 1 เพียงแค่นี้จะเป็นบุคคลที่ผิดธรรมดา: ฉันอยากจะเปลี่ยนตลอดไป ในคำถามคุณยืนยันว่าสถานการณ์นั้นมีความสมมาตรอย่างไรก็ตามไม่มีการให้เหตุผล สถานการณ์ไม่สมมาตร: ซองจดหมายที่สองประกอบด้วยจำนวนเงินที่ถูกเลือกเป็นหน้าที่ของเหรียญพลิกและจำนวนเงินในซองจดหมายแรกในขณะที่จำนวนเงินในซองจดหมายแรกไม่ได้เลือกเป็นหน้าที่ของเหรียญพลิกและ จำนวนเงินในซองที่สอง ดังนั้นอาร์กิวเมนต์สำหรับการสลับกลับจากซองจดหมายที่สองจึงไม่ถูกต้อง

ตัวอย่างที่มีความเป็นไปได้น้อย

ขอให้เราสมมติว่า (ความเชื่อของผู้เล่นนั้นเป็น)หรือมีความน่าจะเป็นที่เท่ากันและคำนวณผลการคำนวณเป็นกรณี ๆ ไป ในกรณีนี้เป็นไปได้สำหรับเป็น , แต่ละที่มีความน่าจะเป็น1/4ก่อนอื่นเรามาดูเหตุผลของผู้เล่นเมื่อถือซองแรกX=10X=40(X,Y){(10,5),(10,20),(40,20),(40,80)}1/4

  1. หากซองจดหมายของฉันมีซองจดหมายที่สองมีทั้งหรือกับความน่าจะเป็นเท่ากันดังนั้นโดยการเปลี่ยนผมได้รับโดยเฉลี่ย2.5105200.5×(5)+0.5×10=2.5
  2. หากซองจดหมายของฉันมีซองจดหมายที่สองมีทั้งหรือที่มีความน่าจะเป็นเท่ากันดังนั้นโดยการเปลี่ยนผมได้รับโดยเฉลี่ย104020800.5×(20)+0.5×(40)=10

โดยเฉลี่ยแล้วสิ่งเหล่านี้จะได้รับการสลับเป็นดังนั้นผู้เล่นจึงสลับ ตอนนี้ให้เราทำการวิเคราะห์แบบทีละกรณีของการสลับกลับ:0.5×2.5+0.5×10=6.25

  1. หากซองจดหมายของฉันมีซองเก่าที่มีความน่าจะเป็น 1 มีและฉันได้รับโดยการสลับ5105
  2. หากซองจดหมายของฉันมีซองจดหมายเก่ามีหรือที่มีความน่าจะเป็นเท่ากันและโดยการเปลี่ยนผมได้รับ52010400.5×(10)+0.5×20=5
  3. หากซองจดหมายของฉันมีซองเก่าที่มีความน่าจะเป็น 1 ประกอบด้วยและฉันสูญเสียโดยการสลับ804040

ตอนนี้ค่าที่คาดหวังคือความน่าจะเป็นค่าเฉลี่ยถ่วงน้ำหนักของกำไรโดยการเปลี่ยนกลับเป็น-6.25 ดังนั้นการสลับกลับจะยกเลิกการได้รับผลประโยชน์ที่คาดหวัง0.25×5+0.5×5+0.25×(40)=6.25

อีกตัวอย่างหนึ่งที่มีความเป็นไปได้อย่างต่อเนื่อง

คุณอาจคัดค้านตัวอย่างก่อนหน้าของฉันโดยอ้างว่าฉันอาจเลือกการกระจายผ่านอย่างชาญฉลาดเพื่อในกรณีผู้เล่นรู้ว่าเขากำลังสูญเสีย ให้เราพิจารณากรณีที่มีการแจกแจงแบบไม่มีขอบเขตอย่างต่อเนื่อง: ,เป็นอิสระจากก่อนหน้านี้และเป็นฟังก์ชันของและเหมือนก่อนหน้านี้ กำไรที่คาดหวังของการเปลี่ยนจากไปเป็นอีกครั้ง0.25 สำหรับสวิตช์ด้านหลังอันดับแรกเราคำนวณความน่าจะเป็นแบบมีเงื่อนไขXY=80XXExp(1)ZXYXZXYE(0.25X)=0.25E(X)=0.25P(X=0.5YY=y)ใช้ทฤษฎีบทของเบย์: และในทำนองเดียวกันดังนั้น เงื่อนไขที่คาดว่าจะได้รับจากการสลับกลับไปที่ซองจดหมายแรกคือ และรับความคาดหวังมากกว่าสิ่งนี้จะกลายเป็น ซึ่งจะยกเลิกการรับที่คาดหวังของสวิตช์แรก

P(X=0.5YY=y)=P(Z=1Y=y)=p(Y=yZ=1)P(Z=1)p(Y=y)=p(2X=y)P(Z=1)p(Y=y)=0.25e0.5yp(Y=y)
P(X=2YY=y)=e2yp(Y=y)
E(XYY=y)=0.125ye0.5y+ye2yp(Y=y),
Y
E(XY)=00.125ye0.5y+ye2yp(Y=y)p(Y=y)dy=0.25,

วิธีแก้ปัญหาทั่วไป

สถานการณ์ที่เห็นในสองตัวอย่างต้องเกิดขึ้นเสมอ: คุณไม่สามารถสร้างการแจกแจงความน่าจะเป็นสำหรับด้วยเงื่อนไขเหล่านี้:ไม่เท่ากับ 0,คือ Bernoulli กับ ,เป็นอิสระจาก ,เมื่อและอย่างอื่นและเป็นอิสระ นี่คือคำอธิบายในบทความ Wikipediaภายใต้หัวข้อ 'การเสนอการแก้ปัญหาทางเลือก': เงื่อนไขดังกล่าวจะบ่งบอกถึงความน่าจะเป็นที่ซองจดหมายขนาดเล็กมีจำนวนระหว่าง (X Z P ( Z = 1 ) =X,Z,YXZP(Z=1)=0.5ZXY=2XZ=10.5XY,Z2n,2n+1P(2n<=min(X,Y)<2n+1)ด้วยสัญกรณ์ของฉัน) จะเป็นค่าคงที่ของจำนวนธรรมชาติทั้งหมดซึ่งเป็นไปไม่ได้สำหรับการแจกแจงความน่าจะเป็นที่เหมาะสมn

โปรดทราบว่ามีอีกเวอร์ชั่นของความขัดแย้งที่น่าจะเป็นไม่จำเป็นต้องเป็น 0.5 แต่ความคาดหวังของซองจดหมายอื่น ๆ ตามเงื่อนไขจำนวนเงินในซองจดหมายนี้ยังคงสูงกว่าเสมอ การแจกแจงความน่าจะเป็นไปตามเงื่อนไขประเภทนี้ (เช่นให้ปริมาณในซองจดหมายเป็นอิสระครึ่งคูชี) แต่ตามที่บทความของวิกิพีเดียอธิบายพวกเขาต้องการค่าเฉลี่ยไม่ จำกัด ฉันคิดว่าส่วนนี้ค่อนข้างไม่เกี่ยวข้องกับคำถามของคุณ แต่สำหรับความสมบูรณ์ต้องการพูดถึงเรื่องนี้


ฉันแก้ไขคำถามของฉันที่พยายามอธิบายว่าทำไมฉันจึงคิดว่ามันคล้ายกับความขัดแย้งของซองจดหมายและคุณต้องการเปลี่ยนตลอดไป
evan54

@ evan54 ฉันเขียนคำตอบของฉันใหม่เพื่อให้มีการแปลความหมายของปัญหาการตั้งค่า 3 คำอธิบายเพิ่มเติมเกี่ยวกับสาเหตุที่สถานการณ์ไม่สมมาตรตัวอย่างและอื่น ๆ
Juho Kokkala

ฉันคิดว่าฉันใกล้จะได้มันแล้ว ฉันคิดว่าเมื่อมีการพลิกเหรียญและซองจดหมาย 2 มีครึ่ง / สองเท่าของจำนวนเงินในมือของคุณคุณอยู่ในสถานการณ์ของความขัดแย้งซองจดหมาย แต่วิธีที่คุณไปถึงที่นั่นรับประกันว่าคุณจะดีกว่าการสลับ มันสมเหตุสมผลไหม
evan54

ถ้าเป็นเช่นนั้นมีวิธีทำให้เป็นทางการมากขึ้นหรือไม่? ผมอาจจะไตร่ตรองเกี่ยวกับมันมากขึ้น ..
evan54

1
@ evan54 ไม่แน่ใจ ประเด็นทั้งหมดของความขัดแย้งคือว่ามันเป็นสถานการณ์ที่ไม่มีประโยชน์ที่จะเปลี่ยน ดังนั้นสิ่งใดก็ตามที่คุณเปลี่ยนไปสู่การตั้งค่าของปัญหาที่ส่งผลให้มันเป็นข้อดีที่จะเปลี่ยนอย่างน้อยในตอนแรกดังนั้นจะต้องไม่เท่ากับการตั้งค่าของความขัดแย้งของซองจดหมายสองซอง โปรดทราบว่าในการตั้งค่าของคุณการสลับครั้งแรกเท่านั้น หลังจากที่คุณสลับเป็นครั้งแรกคุณคาดว่าจะสูญเสียโดยการสลับกลับ ตรรกะที่มีข้อบกพร่องในการโต้เถียงเกิดขึ้นหากคุณพยายามที่จะโต้แย้งว่าคุณควรเปลี่ยนกลับ
jsk

4

ปัญหาที่ 1: ตกลงเล่นเกม กุญแจสำคัญในที่นี้คือคุณรู้ว่าความน่าจะเป็นที่แท้จริงของการชนะ 5 vs 20 เนื่องจากผลลัพธ์ขึ้นอยู่กับการพลิกของเหรียญที่ยุติธรรม

ปัญหาที่ 2: ปัญหาเหมือนกับปัญหา 1 เนื่องจากคุณได้รับแจ้งว่ามีความน่าจะเป็นเท่ากับที่ทั้ง 5 หรือ 20 อยู่ในซองอื่น

ปัญหา 3: ความแตกต่างใน 3 ปัญหาคือว่าบอกฉันซองอื่น ๆ ที่มีทั้ง หรือในก็ไม่ได้หมายความว่าผมควรจะคิดว่าเป็นไปได้สองอย่างเท่าเทียมกันมีแนวโน้มที่ค่าที่เป็นไปได้ทั้งหมดของXการทำเช่นนี้หมายถึงที่ไม่เหมาะสมก่อนที่เกี่ยวกับค่าที่เป็นไปได้ของXดูความละเอียดของเบย์ต่อความขัดแย้งX/22XXX


ฉันเห็นว่าเราตีความปัญหา 3 แตกต่างกันเล็กน้อย ฉันสันนิษฐานว่า OP สร้างโครงสร้างการตั้งค่าในปัญหา 3 โดยเฉพาะเพื่อให้ซองที่ 2 มีความน่าจะเป็น 0.5 / 0.5 นี่เป็นไปได้อย่างชัดเจนโดยไม่มีการแจกแจงที่ไม่เหมาะสม แต่ความเป็นไปได้สำหรับซองจดหมาย 1 ไม่น่าจะเท่ากันเมื่อกำหนดจำนวนในซองจดหมายที่สอง
Juho Kokkala

เห็นด้วยถ้า OP หมายถึงคุณได้รับแจ้งว่าซองจดหมายอีกอันนั้นมีหรือมีความน่าจะเป็นที่เท่ากันดังนั้นปัญหาที่ 3 จะไม่เทียบเท่ากับซองจดหมาย 2 เส้นขนาน 2 XX/22X
jsk

ใช่นั่นคือการคิดของฉันว่าในปัญหา 3 มีความน่าจะเป็นเท่ากับระหว่าง X / 2 และ 2X ดังนั้นคุณถือ 3 ซองให้เขา 10 จากนั้นพลิกเหรียญเพื่อดูว่าคุณให้เขา 20 หรือ 5 (พวกเขาถูกปิด) ถ้าเขาตัดสินใจเปลี่ยน
evan54

1
@ evan54 - หากคุณสุ่มพลิกหลังจากที่คุณเลือกซองจดหมายที่จะให้ฉันมันก็เท่ากับปัญหา 1; หากคุณเลือกทั้งจำนวนเงินและจากนั้นทำการสุ่มพลิกซองจดหมายที่คุณให้ฉันแล้วมันเป็นสถานการณ์ที่อธิบายไว้ข้างต้น พวกเขากำลังสถานการณ์ที่แตกต่างกัน
Peteris

1
@ evan54 - การตัดสินใจของผู้เล่นที่ดีที่สุดขึ้นอยู่กับวิธีที่คุณทำซองจดหมายเหล่านั้น หากคุณไม่บอกผู้เล่นว่าคุณทำอย่างนั้นอย่างไร (เฉพาะที่ 50/50 ประโยค) กลยุทธ์ที่ดีที่สุดนั้นขึ้นอยู่กับสมมติฐานของผู้เล่นว่าคุณมีแนวโน้มที่จะทำมันไม่ทางใดก็ทางหนึ่งซองแรกที่คุณเตรียมมีค่าน้อยกว่า กว่าซองที่สองที่คุณเตรียมไว้ หากพวกเขาถูกสับอย่างเป็นธรรม (และไม่ได้เปิด) มันไม่สำคัญว่าผู้เล่นเลือก; หากผู้เล่นคิดว่าคุณน่าจะ (> 50%) เริ่มแรกให้ซองจดหมายแรกแก่เขาจากนั้นผู้เล่นควรสลับและยึดติดกับสิ่งนั้น
Peteris

1

นี่เป็นคำอธิบายที่เป็นไปได้ที่ฉันมี ฉันคิดว่ามันผิด แต่ฉันไม่แน่ใจ ฉันจะโพสต์เพื่อให้คะแนนและแสดงความคิดเห็น หวังว่าบางคนจะเสนอคำอธิบายที่ดีกว่า

ดังนั้นสิ่งเดียวที่เปลี่ยนไประหว่างปัญหา 2 และปัญหา 3 คือจำนวนเงินกลายเป็นในซองจดหมายที่คุณถือเป็นแบบสุ่ม หากคุณอนุญาตให้จำนวนเงินนั้นติดลบดังนั้นอาจมีใบเรียกเก็บเงินแทนเงินดังนั้นมันสมเหตุสมผลดี ข้อมูลเพิ่มเติมที่คุณได้รับเมื่อคุณเปิดซองจดหมายคือไม่ว่าจะเป็นใบเรียกเก็บเงินหรือเงินดังนั้นคุณจึงต้องเปลี่ยนเป็นกรณี ๆ ไป

อย่างไรก็ตามหากคุณได้รับแจ้งว่าไม่มีความเป็นไปได้ปัญหาก็จะยังคงอยู่ (แน่นอนว่าคุณกำหนดความน่าจะเป็นที่พวกเขาโกหกหรือไม่)


การแนะนำความเป็นไปได้ของจำนวนเงินติดลบเป็นการสังเกตที่น่าสนใจ แต่ไม่จำเป็นสำหรับการแก้ไขปัญหาในคำถามของคุณ ดูคำตอบของฉัน
Juho Kokkala

ไม่จำเป็นต้องถือว่าปริมาณในซองจดหมายเป็นแบบสุ่ม: พอเพียงที่ไม่ทราบ สมมติว่ามีการสุ่มให้ข้อมูลเพิ่ม - อย่างไรก็ตามอาจมีน้อย - นั่นไม่ได้ให้ไว้ในปัญหา!
whuber

1
ความแตกต่างที่ใหญ่ที่สุดระหว่าง 2 และ 3 คือการได้รับการบอกจำนวนอื่น ๆ คือหรือไม่เหมือนกับที่บอกว่ามีความเป็นไปได้สองอย่างเท่ากัน สมมติว่าทั้งสองมีความเป็นไปได้เท่าเทียมกันไม่เหมือนกับที่บอกว่าทั้งสองมีแนวโน้ม 2 XX/22X
jsk

1

ปัญหา 2A: การ์ดบันทึกย่อ 100 ใบอยู่ในขวดทึบแสง เขียน " $ 10" ที่ด้านหนึ่งของการ์ดแต่ละใบ ฝั่งตรงข้ามเขียนว่า " $ 5" หรือ " $ 20" คุณได้รับบัตรและดูที่ด้านหนึ่งเท่านั้น จากนั้นคุณจะได้เลือกด้านใดด้านหนึ่ง (ด้านที่เปิดเผยหรือด้านที่ซ่อนอยู่) และคุณจะชนะในจำนวนนั้น

หากคุณเห็น " $ 5" คุณรู้ว่าคุณควรเลือกข้างที่ซ่อนอยู่และจะชนะ$ 10 ถ้าคุณเห็น " $ 20" คุณรู้ว่าคุณควรเลือกข้างที่เปิดเผยและจะชนะ$ 20 แต่ถ้าคุณเห็น " $ 10 "ฉันไม่ได้ให้ข้อมูลเพียงพอแก่คุณคำนวณความคาดหวังของฝั่งที่ซ่อนอยู่ ถ้าฉันบอกว่ามีจำนวนบัตร { $ 5, $ 10} จำนวนเท่ากับ { $ 10, $ 20} ใบความคาดหวังจะเป็น$ 12.50 แต่คุณไม่พบความคาดหวังจากonlyความจริง - ซึ่งยังคงเป็นจริง - คุณมีโอกาสเท่ากันในการเปิดเผยมูลค่าที่สูงขึ้นหรือต่ำลงบนการ์ด คุณจำเป็นต้องรู้จำนวนบัตรแต่ละชนิดที่มี

ปัญหา 3A: ใช้ jar เดียวกัน แต่คราวนี้การ์ดทั้งหมดมีค่าต่างกันและไม่ทราบค่าที่เขียนลงบนการ์ดเหล่านั้น สิ่งเดียวที่เหมือนกันคือในแต่ละการ์ดด้านหนึ่งมีค่าสองเท่าของอีกด้านหนึ่ง

เลือกไพ่และด้านข้าง แต่อย่ามองมัน มีโอกาส 50% ที่เป็นด้านที่สูงกว่าหรือด้านล่าง ทางออกหนึ่งที่เป็นไปได้คือการ์ดนั้นคือ {X / 2, X} หรือ {X, 2X} ที่มีความน่าจะเป็น 50% โดยที่ X คือด้านของคุณ แต่เราเห็นว่าความน่าจะเป็นที่จะเลือกสูงหรือต่ำนั้นไม่เหมือนกันเนื่องจากไพ่สองใบที่กันมีแนวโน้มที่จะอยู่ในขวดเท่า ๆ กันdifferent

สิ่งที่เปลี่ยนแปลงระหว่างปัญหาของคุณที่ 2 และปัญหา 3 คือการที่คุณทำทั้งสองน่าจะเป็นเหมือนกันในปัญหา 2 โดยกล่าวว่า "ซองจดหมายนี้อย่างใดอย่างหนึ่งมี$ 5 หรือ$ 20 ในนั้นมีโอกาสที่เท่าเทียมกัน." ด้วยค่าที่ไม่รู้จักซึ่งไม่สามารถเป็นจริงได้ในปัญหา 3


0

ภาพรวม

ฉันเชื่อว่าวิธีที่คุณแก้ไขปัญหานั้นถูกต้องสมบูรณ์ คุณต้องแยกความแตกต่างของสถานการณ์ "Coin Flip" จากสถานการณ์ที่เพิ่มเงินลงในซองก่อนที่จะเลือกซองจดหมาย

การไม่แยกแยะสถานการณ์เหล่านั้นขึ้นอยู่กับรากเหง้าของความสับสนของหลาย ๆ คน

ปัญหาที่ 1

หากคุณพลิกเหรียญเพื่อตัดสินใจว่าจะเพิ่มเงินของคุณเป็นสองเท่าหรือแพ้ครึ่งหนึ่งให้เล่นเกมเสมอ แทนที่จะเป็นสองเท่าหรือไม่มีอะไรเลยมันเป็นสองเท่าหรือแพ้บางอย่าง

ปัญหาที่ 2

นี่คือสิ่งเดียวกันกับสถานการณ์พลิกเหรียญ ความแตกต่างเพียงอย่างเดียวคือคนที่หยิบซองจดหมายพลิกก่อนที่จะให้ซองจดหมายแรกให้คุณ หมายเหตุคุณไม่ได้เลือกซองจดหมาย !!!! คุณได้รับซองจดหมายหนึ่งซองจากนั้นเลือกตัวเลือกเพื่อสลับ นี่คือความแตกต่างที่ลึกซึ้ง แต่สำคัญต่อปัญหา 3 ซึ่งมีผลต่อการกระจายตัวของนักบวช

ปัญหาที่ 3

นี่คือการตั้งค่าแบบคลาสสิกสำหรับปัญหาสองซอง ที่นี่คุณจะได้รับทางเลือกระหว่างสองซองจดหมาย จุดสำคัญที่สุดที่ต้องตระหนักคือ

  • มีจำนวนเงินสูงสุดที่สามารถอยู่ในซองจดหมายใด ๆ เนื่องจากผู้ที่รันเกมมีทรัพยากร จำกัด หรือมีจำนวน จำกัด ที่พวกเขายินดีลงทุน
  • หากคุณโทรหาจำนวนเงินสูงสุดที่อาจอยู่ในซองจดหมาย M คุณจะไม่ได้รับหมายเลขใด ๆ ระหว่าง 0 ถึง M เท่ากันถ้าคุณคิดว่าจะมีการสุ่มเงินระหว่าง 0 ถึง M ในซองแรกและครึ่งหนึ่งของ สำหรับสอง (หรือสองครั้งคณิตศาสตร์ยังคงใช้งานได้) หากคุณเปิดซองจดหมายคุณน่าจะเห็นสิ่งที่น้อยกว่า M / 2 มากกว่า M / 2 3 เท่า (นี่เป็นเพราะครึ่งหนึ่งของเวลาที่ซองจดหมายทั้งสองจะมีค่าน้อยกว่า M / 2 และอีกครึ่งหนึ่งของเวลา 1 ซองจดหมายจะ)
  • เนื่องจากไม่มีการแจกแจงแบบสม่ำเสมอ 50% ของเวลาที่คุณเพิ่มเป็นสองเท่าและ 50% ของเวลาที่คุณลดครึ่งไม่ได้ใช้
  • เมื่อคุณคำนวณความน่าจะเป็นจริงคุณจะพบว่าค่าที่คาดหวังของซองจดหมายแรกคือ M / 2 และ EV ของซองจดหมายที่สองการสลับหรือไม่ก็คือ M / 2

ที่น่าสนใจถ้าคุณสามารถเดาได้ว่าจำนวนเงินสูงสุดในซองจดหมายนั้นคืออะไรหรือถ้าคุณสามารถเล่นเกมได้หลายครั้งคุณจะได้รับประโยชน์จากการสลับเมื่อใดก็ตามที่คุณเปิดซองจดหมายน้อยกว่า M / 2 ฉันจำลองปัญหาซองจดหมายทั้งสองที่นี่และพบว่าหากคุณมีข้อมูลภายนอกนี้โดยเฉลี่ยคุณสามารถทำได้ 1.25 เช่นเดียวกับการสลับหรือไม่เคยสลับเลย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.