ซองจดหมาย Paradox


8

มีสองซอง หนึ่งประกอบด้วยx เงินและอื่น ๆ ประกอบด้วย 2xจำนวนเงิน จำนวนที่แน่นอน "x"ไม่เป็นที่รู้จักสำหรับฉัน แต่ฉันรู้ด้านบนฉันเลือกซองจดหมายหนึ่งซองแล้วเปิดดูฉันเห็นแล้ว y เงินในนั้นชัดอยู่ที่ไหน y{x,2x}.

ตอนนี้ฉันถูกเสนอให้เก็บหรือสลับซองจดหมาย

ค่าที่คาดหวังของการสลับคือ (122y+1212y)=54y. ค่าที่คาดหวังในการรักษาซองจดหมายของฉันคือy.

ดูเหมือนว่าฉันควรเปลี่ยนซองจดหมายเสมอ คำถามสองข้อของฉัน:

เหตุผลนี้ถูกต้องหรือไม่

มันแตกต่างกันหรือไม่ถ้าฉันไม่ได้รับอนุญาตให้เปิดซองและดู y จำนวนเงินและจากนั้นฉันได้รับตัวเลือกให้สลับไปเรื่อย ๆ ?


2
ที่เกี่ยวข้อง: en.wikipedia.org/wiki/Two_envelopes_problem
Herr K.

1
คุณไม่สามารถคาดหวังได้ แต่คุณควรเริ่มด้วยความเชื่อเกี่ยวกับ x และอัพเดทความเชื่อของคุณตามกฎของเบย์ เมื่อคุณเห็น y ความเชื่อของคุณเกี่ยวกับซองจดหมายที่คุณเปิดจะมีการเปลี่ยนแปลง
HRSE

สมมติว่า x กระจายอย่างสม่ำเสมอระหว่าง 0 ถึง . แล้วไง?
Kitsune Cavalry

@KitsuneCavalry ไม่มีความคลาดเคลื่อนดังกล่าว (โปรดส่งโปรแกรมที่สร้างการแจกแจงดังกล่าวให้ฉันด้วย) ในความเป็นจริงไม่มีการแก้ปัญหาใดที่สร้างความเชื่อมั่นแบบ Pior ในคำถามของคุณสำหรับค่าทั้งหมดของy. ในลิงค์ของ Herr K. สิ่งนี้ได้อธิบายไว้ในen.wikipedia.org/wiki/…
Giskard

3
@Kitsune ม้าเครื่องแบบกระจายข้ามเส้นครึ่งหนึ่ง (หรือทั้งบรรทัด) เป็นที่รู้จักกันดีที่ไม่เหมาะสมก่อนในสถิติคชกรรมดูรสชาติstats.stackexchange.com/a/97790/28746หรือ stats.stackexchange.com/a/ 35794/28746
Alecos Papadopoulos

คำตอบ:


5

นี่คือวิธีการ "เพิ่มประสิทธิภาพยูทิลิตี้ / ทฤษฎีเกม" ที่คาดว่าจะเกิดขึ้นกับเรื่องนี้ ในกรอบดังกล่าวคำตอบปรากฏชัดเจน

อาคาร

เราได้รับการบอกกล่าวด้วยความซื่อสัตย์อย่างแท้จริงว่า x จำนวนเงินที่เป็นบวกอย่างเคร่งครัดตั๋วสองใบต่อไปนี้วางอยู่ในกล่อง: {A=x,B=2x} ด้วยหมายเลขประจำตัวที่ได้รับมอบหมาย 1 และ {A=2x,B=x} ด้วยหมายเลขประจำตัวที่ได้รับมอบหมาย 0. จากนั้นวาดจาก Bernoulli (p=0.5) ตัวแปรสุ่มถูกดำเนินการและขึ้นอยู่กับผลลัพธ์และเหตุการณ์ที่เกิดขึ้นจำนวน x และ 2x ถูกวางไว้ในซองจดหมาย A และ B. เราไม่ได้บอกว่าคุณค่าของx คือหรือจำนวนเท่าใดไปที่ซองจดหมาย

กรณีแรก: เลือกซองจดหมายพร้อมตัวเลือกเพื่อสลับโดยไม่เปิด

ปัญหาแรกคือเราจะเลือกซองจดหมายได้อย่างไร สิ่งนี้เกี่ยวข้องกับการตั้งค่า ดังนั้นสมมติว่าเราคาดหวังอรรถประโยชน์สูงสุดด้วยฟังก์ชั่นยูทิลิตี้u().

เราสามารถจำลองโครงสร้างความน่าจะเป็นที่นี่โดยพิจารณาตัวแปรสุ่มสองขั้ว A และ Bเป็นตัวแทนของซองจดหมายและจำนวนเงินในพวกเขา การสนับสนุนของแต่ละคนคือ{x,2x}. แต่พวกเขาไม่ได้เป็นอิสระ ดังนั้นเราต้องเริ่มต้นด้วยการกระจายข้อต่อ ในรูปแบบตารางการแจกแจงร่วมและการแจกแจงที่สอดคล้องกันคือ

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

สิ่งนี้บอกเราว่า A และ B มีการกระจายระยะขอบเท่ากัน

แต่นี่หมายความว่าไม่สำคัญว่าเราจะเลือกซองจดหมายอย่างไรเพราะเราจะได้รับยูทิลิตี้ที่คาดหวังไว้เสมอ

0.5u(x)+0.5u(2x)

สิ่งที่เรากำลังเผชิญอยู่ที่นี่คือการเดิมพันแบบผสม (วิธีเลือกซองจดหมาย) บนการเดิมพันที่เหมือนกันสองครั้ง (แต่ละซอง) เราสามารถเลือกA ด้วยความน่าจะเป็น 1, 0หรืออะไรก็ตามที่อยู่ในระหว่าง (และสมบูรณ์สำหรับ B) มันไม่สำคัญ เราจะได้รับยูทิลิตี้ที่คาดหวังเหมือนกันเสมอ โปรดทราบว่าทัศนคติของเราที่มีต่อความเสี่ยงไม่ได้มีบทบาทที่นี่

ดังนั้นเราจะเลือกซองจดหมายพูด Aและเรากำลังดูอยู่ ตอนนี้ยูทิลิตี้ที่เราคาดหวังคืออะไร? ตรงเช่นเดียวกับก่อนที่จะเลือก การหยิบซองจดหมายด้วยวิธีใดก็ตามจะไม่ส่งผลต่อความน่าจะเป็นของสิ่งที่อยู่ข้างใน

เราได้รับอนุญาตให้เปลี่ยน สมมติว่าเราทำและตอนนี้เรากำลังถือซองจดหมายB. ตอนนี้ยูทิลิตี้ที่คาดหวังคืออะไร? เหมือนเดิมทุกประการ

เหล่านี้เป็นสองสถานะที่เป็นไปได้ของโลกสำหรับเรา: เลือก A หรือเลือก B. ภายใต้ตัวเลือกใด ๆ ทั้งสองสถานะของโลกหมายถึงค่าเดียวกันกับแรงผลักดันที่เราเลือก / สันนิษฐาน (เช่นเพิ่มประโยชน์สูงสุดที่คาดหวัง)

ดังนั้นที่นี่เราไม่สนใจที่จะเปลี่ยน และที่จริงเราสามารถสุ่มเลือกได้

กรณีที่สอง: เปิดซองพร้อมตัวเลือกในการสลับหลังจาก

สมมติว่าเราได้เลือกแล้ว Aเปิดแล้วพบภายในจำนวนเงิน y{x,2x}. สิ่งนี้เปลี่ยนแปลงหรือไม่?

มาดูกัน. ฉันสงสัยว่าคืออะไร

P(A=xA{x,2x})=?

ดี, {x,2x} คือพื้นที่ตัวอย่างซึ่งตัวแปรสุ่ม Aถูกกำหนดไว้ การปรับสภาพในพื้นที่ตัวอย่างทั้งหมดเช่นบนซิกม่าพีชคณิตเล็กน้อยไม่ส่งผลกระทบต่อความน่าจะเป็นหรือค่าคาดหวัง ราวกับว่าเราสงสัยว่า "อะไรคือคุณค่าของA ถ้าเรารู้ว่าค่าที่เป็นไปได้ทั้งหมดอาจถูกทำให้เป็นจริง? "ไม่มีความรู้ที่มีประสิทธิภาพได้รับดังนั้นเราจึงยังคงอยู่ที่โครงสร้างความน่าจะเป็นดั้งเดิม

แต่ฉันก็สงสัยว่ามันคืออะไร

P(B=xA{x,2x})=?

คำสั่งการปรับสภาพดูอย่างถูกต้องว่าเป็นซิกม่า - พีชคณิตที่สร้างโดยเหตุการณ์ {A{x,2x}}เป็นพื้นที่ตัวอย่างทั้งหมดซึ่งสุ่มเวกเตอร์ (A,B)ได้รับการกำหนด จากตารางของการแจกแจงร่วมข้างต้นเราจะเห็นได้ว่าการจัดสรรความน่าจะเป็นของการร่วมนั้นเทียบเท่ากับการจัดสรรความน่าจะเป็นของระยะขอบ (คุณสมบัติ "เกือบจะแน่นอน" เนื่องจากการปรากฏตัวของเหตุการณ์สองศูนย์ ดังนั้นที่นี่เช่นกันเราจำเป็นต้องกำหนดความน่าจะเป็นสำหรับBบนพื้นที่ตัวอย่างทั้งหมด มันเป็นไปตามที่การกระทำของเราในการเปิดซองจดหมายไม่ได้ส่งผลกระทบต่อโครงสร้างความน่าจะเป็นสำหรับB ด้วย

เข้าสู่ทฤษฎีเกมควบคู่ไปกับการตัดสินใจ เราได้เปิดซองจดหมายและเราต้องตัดสินใจว่าจะสลับหรือไม่ ถ้าเราไม่เปลี่ยนเราได้รับประโยชน์u(y). หากเราเปลี่ยนเราก็จะอยู่ในสองสถานะที่เป็นไปได้ของโลก

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

เราไม่ทราบว่ารัฐใดมีอยู่จริง แต่จากการอภิปรายข้างต้นเรารู้ว่าแต่ละรัฐมีความน่าจะเป็น p=0.5 ของที่มีอยู่

เราสามารถสร้างแบบจำลองนี้เป็นเกมที่คู่ต่อสู้ของเราคือ "ธรรมชาติ" และที่เรารู้ว่าธรรมชาติเล่นอย่างมั่นใจด้วยกลยุทธ์แบบสุ่ม : ด้วยp=0.5 y=x และด้วย p=0.5, y=2x. แต่ตอนนี้เราก็เช่นกันว่าหากเราไม่เปลี่ยนการจ่ายเงินของเราก็แน่นอน ดังนั้นนี่คือเกมของเราในรูปแบบปกติด้วยการจ่ายผลตอบแทนของเรา:

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

เราควรต้านทานสิ่งล่อใจที่จะทดแทน u(x) และ u(2x) สำหรับ u(y). u(y)เป็นผลตอบแทนที่รู้จักและแน่นอน การจ่ายเงินสำหรับกลยุทธ์ "Switch" ไม่เป็นที่รู้จักจริง ๆ (เนื่องจากเราไม่ทราบคุณค่าของx) ดังนั้นเราจึงควรย้อนกลับทดแทน ถ้าy=x แล้วก็ u(2x)=u(2y), และถ้า y=2x แล้วก็ u(x)=u(y/2). ดังนั้นนี่คือเกมของเราอีกครั้ง:

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

ตอนนี้การจ่ายผลตอบแทนทั้งหมดในเมทริกซ์เป็นที่รู้จัก มีกลยุทธ์ที่โดดเด่นบริสุทธิ์หรือไม่?

ผลตอบแทนที่คาดหวังของกลยุทธ์ "Switch" คือ

E(VS)=0.5u(2y)+0.5u(y/2)

ผลตอบแทนที่คาดหวังของกลยุทธ์ "Don't Switch" คือ

E(VDS)=u(y)

เราควรเปลี่ยนถ้า

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

และตอนนี้ทัศนคติต่อความเสี่ยงกลายเป็นสิ่งสำคัญ ไม่ใช่เรื่องยากที่จะอนุมานได้ว่าภายใต้พฤติกรรมเสี่ยงและความเสี่ยงที่เป็นกลางเราควรเปลี่ยน

สำหรับพฤติกรรมที่เสี่ยงต่อความเกลียดชังฉันพบผลลัพธ์ที่ยอดเยี่ยม:

สำหรับฟังก์ชั่นยูทิลิตี้ "เว้าน้อย" (ด้านบนอย่างเคร่งครัด) กว่าลอการิทึม (พูด, สแควร์รูท), จากนั้นเราควรยังคงสลับ

สำหรับยูทิลิตี้ลอการิทึม u(y)=lnyเราไม่แยแสระหว่างการสลับหรือไม่

สำหรับ "เว้ามากขึ้น" มากกว่า (อย่างเคร่งครัดด้านล่าง) ฟังก์ชั่นยูทิลิตี้ลอการิทึมเราไม่ควรเปลี่ยน

ฉันปิดด้วยแผนภาพของกรณีลอการิทึม

ป้อนคำอธิบายรูปภาพที่นี่

สมมติ y=4. แล้วก็y/2=2,2y=8. เส้นΓΔΕคือบรรทัดที่ยูทิลิตี้ที่คาดหวังจาก "สวิตช์" จะอยู่ เนื่องจากธรรมชาติเล่น5050 กลยุทธ์มันจะเป็นจริง ณ จุด Δซึ่งเป็นจุดกึ่งกลางของ ΓΔΕ. เมื่อถึงจุดนั้นด้วยยูทิลิตี้ลอการิทึมเราได้รับยูทิลิตี้ตัวเดียวกันจาก "Don't Switch" เช่นln(4) สำหรับตัวอย่างตัวเลขนี้


การเรียกใช้ "การหลีกเลี่ยงความเสี่ยง" ผ่านฟังก์ชั่นยูทิลิตี้ลอการิทึมไม่สามารถแก้ไขความขัดแย้งได้ ตามที่ระบุไว้โดย @HRSE โดยใช้ทฤษฎีบทของเบย์ความน่าจะเป็นที่การจ่ายเงินตอบแทนu(2y) และ u(y/2มีไม่ 0.5 หลังจากที่ได้เห็นจำนวนเงินในซองแรก สิ่งนี้จะถือเป็นปัญหาที่ไม่เหมาะสมอย่างยิ่งสำหรับเครื่องแบบที่น่าสงสัยมาก่อนx (สำหรับ x>0) หากใช้อย่างถูกวิธีก่อนx สะท้อนความเชื่อของคน ๆ หนึ่งเกี่ยวกับ x) วิธีแก้ปัญหาจะเปลี่ยนหาก y มีขนาดเล็กพอและเก็บซองจดหมายแรกไว้ได้ yมีขนาดใหญ่พอสมควร ดูjstor.org/stable/2685310
Jarle Tufto

@JarleTufto วิธีที่ฉันเห็นมันเครื่องแบบก่อนหน้านั้นถูกต้องมาก่อนถ้าใครตัดสินใจที่จะเชื่อว่าผู้จัดงานของเกมเมื่อพวกเขาบอกว่าจำนวนเงินถูกวางไว้ในซองหลังจาก Bernoulli วาดด้วย p=0.5. หากใครอยากจะสงสัยอย่าเชื่อผู้จัดงานและสร้างความเชื่อก่อนหน้านี้ขึ้นมาแน่นอนว่ามันเป็นสิทธิ์ของเขา แต่เขาจะต้องมาพร้อมกับการโต้แย้งเพื่อโน้มน้าวฉันว่าก) เหตุใดผู้จัดงานจึงโกหกและข) เขาเลือกที่แตกต่างกันก่อนที่เขาจะเลือก โปรดทราบว่าคำตอบของฉันสันนิษฐานว่าเราเชื่อว่าผู้จัดงานในเรื่องนี้
Alecos Papadopoulos

แน่นอนฉันยอมรับว่าคุณได้รับซองจดหมายแต่ละใบที่มีจำนวนเงิน X และ 2Xตามลำดับโดยมีความน่าจะเป็นเท่ากับ 1/2 สิ่งที่ฉันพูดคือชุดเครื่องแบบไม่เหมาะสมโดยปริยายมาก่อนX ที่คุณใช้นั่นคือ π(x)=1, เพื่อทุกสิ่ง x>0 นำไปสู่ความขัดแย้งเพราะทฤษฎีบทของเบย์ก็นำไปสู่ P(X=y|Y=y)=P(X=y/2|Y=y)=1/2 ที่ไหน yคือจำนวนที่สังเกตได้ในซองแรก การใช้ที่เหมาะสมก่อนπ(x) แต่ความน่าจะเป็นตามเงื่อนไขเหล่านี้แตกต่างกันและการตัดสินใจที่ดีที่สุดขึ้นอยู่กับ y(และแน่นอนฟังก์ชั่นยูทิลิตี้)
Jarle Tufto

@JarleTufto นี้ไม่เหมาะสมก่อนที่คุณพูดถึงมันสะท้อนให้เห็นถึงความน่าจะเป็นที่เกี่ยวข้องกับสิ่งที่?
Alecos Papadopoulos

จำนวนเงินในซองจดหมายสองซองคือ X และ 2X. การกระจายความน่าจะเป็นก่อนแสดงถึงความเชื่อของคุณเกี่ยวกับXก่อนที่จะเปิดซองจดหมายใด ๆ คุณอาจจะใช้สิ่งนี้มาก่อนโดยปริยายหรือคุณยอมรับความผิดพลาดของการคำนวณความน่าจะเป็นตามเงื่อนไขย้อนกลับ
Jarle Tufto

0

หากคุณเปิดซองจดหมายE1และเห็นว่าค่าที่เป็นE1 = Yแล้วมันเป็นความจริงว่าซองอื่น ๆE2ค่า 's อยู่ใน{E2 = Y / 2, E2 = 2Y}

นอกจากนี้ยังเป็นความจริงที่คาดว่าค่าตัวของซองจดหมายที่เป็น(Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y)

ข้อผิดพลาดคือสมมติว่าPr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2ไม่ว่าYคืออะไร วิธีที่ง่ายที่สุดในการแสดงสิ่งนี้คือการสมมติว่าซองจดหมายแต่ละอันมีเงินกระดาษของสหรัฐอเมริกาในหลายสกุลเงิน ถ้าy = $ 1แล้วมันเป็นไปไม่ได้สำหรับE2จะเป็นY / 2

หลักฐานที่เข้มงวดมากขึ้นมีรายละเอียดมากเกินไปที่จะให้ที่นี่ แต่บทสรุปของมันคือครั้งแรกคิดว่าสำหรับค่าใด ๆZที่Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) นี่เป็นข้อสมมติเดียวกับในย่อหน้าสุดท้ายซึ่งขยายเป็นช่วงของค่า แต่ถ้าสิ่งนี้เป็นจริงสำหรับค่าใด ๆ ของZก็หมายความว่าPr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1))คงที่สำหรับทุกค่าของNตั้งแต่ -inf ถึง INF เนื่องจากเป็นไปไม่ได้ข้อสมมติฐานจึงไม่ถูกต้อง

+++++

นั่นอาจทำให้สับสนเล็กน้อยดังนั้นให้ฉันลองตัวอย่าง คุณได้รับซองจดหมายสองชุดสองชุด ในหนึ่งชุดประกอบด้วย 10 และ 20 ดอลลาร์ ในอีกซองหนึ่งมี 20 และ 40 คุณเลือกชุดหนึ่งจากนั้นเปิดซองหนึ่งซองในชุดนั้นเพื่อค้นหา 20 จากนั้นคุณจะได้รับโอกาสให้เปลี่ยนซองจดหมายอื่นในชุดนั้น คุณควร

ใช่ควรเปลี่ยน กำไรที่คาดหวังจากการเปลี่ยนไปใช้ซองจดหมายอื่นคือ [(20-10) + (20-40)] / 2 = +5

โปรดทราบว่าอินสแตนซ์นี้- นั่นคือเมื่อรู้ว่าคุณพบ 20 และไม่ใช่ 10 หรือ 40 จะเหมาะกับเงื่อนไขที่คุณอธิบายในคำถามของคุณ ดังนั้นทางออกของคุณทำงาน แต่การทดสอบนั้นไม่ตรงกับคำอธิบายนั้น หากคุณพบ 10 หรือถ้าคุณพบ 40 ความน่าจะเป็นที่ซองจดหมายอื่นมี 20 คือ 100% กำไรที่คาดหวังคือ +10 และ -20 ตามลำดับ และถ้าคุณหาค่าเฉลี่ยสามค่าที่เป็นไปได้เหนือความน่าจะเป็นคุณจะได้สามค่าคุณจะได้ 10/4 + 5/2 - 20/4 = 0


ทำไมฉันถึงคิดว่าซองจดหมายไม่สามารถมี 50 เซ็นต์ได้? คำถามก็ถามโดยเฉพาะเกี่ยวกับเวลาที่คุณไม่รู้จำนวนที่เป็นไปได้ที่อาจเป็นในจำนวนที่สัมพันธ์กันดังนั้นฉันไม่ได้ติดตามเรื่องนี้
Kitsune Cavalry

ฉันบอกว่ามันเป็นวิธีการที่ง่าย มันเริ่มต้นด้วย 'สมมติว่าซองจดหมายแต่ละอันมีเงินกระดาษของสหรัฐ' เนื่องจากคุณไม่สามารถมีเงินกระดาษ 50 เซ็นต์ในสหรัฐฯได้ Pr (E2 =2|E1=1) = 1 ประเด็นก็คือว่าสมมติว่า Y / 2 และ 2Y นั้นมีโอกาสเท่ากันเมื่อคุณไม่รู้ว่า Y กำลังสมมติว่ามีการแจกแจงแบบพฤตินัยสำหรับ Y ที่เป็นไปไม่ได้
JeffJo

0

โดยทั่วไปปัญหาจะแก้ไขไม่ได้เนื่องจากคุณไม่ได้ระบุขั้นตอนการสุ่มของการทดสอบทั้งหมด

แต่ให้ Y เป็นค่าของซองจดหมายที่คุณเลือกและ X คือซองจดหมายอื่น คำตอบก็คือE[X|Y=y]- ซึ่งเป็นความคาดหวังที่มีเงื่อนไข อย่างไรก็ตามสมมติว่ามีการแจกแจงทั่วไปของ Y, Y ถูกดึงมาอย่างสม่ำเสมอจากทั้งหมดR. แต่แล้วPr(Y=y)=0และโดยBorel – Kolmogorovบุคคลที่ผิดธรรมดาความคาดหวังจะแก้ไม่ได้


@JeffJo ฉันไม่สามารถแสดงความคิดเห็นในโพสต์ของคุณเนื่องจากไม่มีชื่อเสียงเพียงพอ ฉันเพิ่มคำตอบนี้เพราะเชื่อว่าเกี่ยวข้องกับโพสต์ของคุณ
John Rambo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.