การเสนอราคาแบบสุ่มที่เหมาะสมที่สุด


7

คำถามนี้มาจากเว็บไซต์นี้ที่ฉันอ่านบ่อยๆ

ผู้เล่นสองคนไปเล่นเกมโชว์สุดฮอตชื่อ“ Higher Number Wins” ทั้งสองเข้าไปในคูหาแยกกันและแต่ละอันก็กดปุ่มและตัวเลขสุ่มระหว่างศูนย์ถึงหนึ่งปรากฏบนหน้าจอ (ณ จุดนี้ไม่ทราบหมายเลขของผู้อื่น แต่พวกเขารู้ว่าหมายเลขถูกเลือกจากการแจกแจงชุดมาตรฐาน) พวกเขาสามารถเลือกที่จะเก็บหมายเลขแรกนั้นไว้หรือกดปุ่มอีกครั้งเพื่อยกเลิกหมายเลขแรกและรับวินาที ตัวเลขสุ่มซึ่งพวกเขาจะต้องเก็บ จากนั้นพวกเขาออกมาจากคูหาของพวกเขาและดูหมายเลขสุดท้ายของผู้เล่นแต่ละคนบนกำแพง รางวัลแกรนด์ฟุ่มเฟือย - กรณีที่เต็มไปด้วยทองคำแท่ง - มอบให้กับผู้เล่นที่รักษาจำนวนที่สูงขึ้น หมายเลขใดที่เป็นทางลัดที่ดีที่สุดสำหรับผู้เล่นที่จะยกเลิกหมายเลขแรกและเลือกหมายเลขอื่น? ใส่อีกวิธีหนึ่งภายในช่วงที่ควรเลือกเก็บหมายเลขแรก

นี่เป็นปัญหาการประมูลที่แปลกประหลาดมากกับผู้เล่นที่สมมาตร (ฉันถือว่าผู้เล่นมีความเสี่ยงที่เป็นกลาง) หรือเกมลอตเตอรี่ / เกมทฤษฎีที่แปลกมาก

คุณจะเข้าหาคำถามนี้ทางคณิตศาสตร์และคุณจะได้คำตอบอะไร? ไม่มีรางวัลสำหรับฉันที่จะได้รับคำตอบที่ถูกต้องกับปริศนาของเว็บไซต์ฉันแค่อยากรู้ สัญชาตญาณของฉันบอกฉันว่าการตัดยอดที่เหมาะสมคือ 0.5 เนื่องจากคุณมีโอกาส 50-50 ที่จะสูงหรือต่ำกว่าหมายเลขของคู่ต่อสู้ของคุณไม่ว่าเขา / เธอจะสุ่มหมายเลขสุ่มใหม่หรือไม่ แต่ฉันไม่แน่ใจ


ฉันไม่คิดว่าความเสี่ยงต่อความเป็นกลางนั้นไม่เกี่ยวข้องกับเรื่องนี้ผู้เล่นเพียงแค่พยายามเพิ่มโอกาสในการชนะให้ได้มากที่สุด การจ่ายผลตอบแทนเป็นแบบไบนารีไม่มีผลลัพธ์เฉลี่ยที่ปลอดภัย
Giskard

@denesp คุณอาจเสี่ยงต่อการรู้สึกว่าถ้าคุณพูด 0.46 คุณอาจไม่ต้องการที่จะวาดใหม่แม้ว่าคุณจะมีโอกาสที่จะได้หมายเลขที่ดีกว่าแย่กว่าก็ตาม
Kitsune Cavalry

1
@ KitsuneCavalry ฉันเห็นสิ่งที่คุณพูด แต่นั่นจะเป็นความคิดที่ "พฤติกรรม" ของความเกลียดชังความเสี่ยงตามที่กำหนดไว้ในขั้นตอนระหว่างกาลมากกว่าผลสุดท้าย
เชน

@ Shane แน่นอนฉันได้ยิน ya และฉันก็ไม่กังวลเกี่ยวกับเรื่องนี้อยู่ดี
Kitsune Cavalry

คำตอบ:


6

ก่อนอื่นฉันจะแสดงให้เห็นว่า 0.5 (หรือ 12) จุดตัดไม่ทำงานเป็นสมดุลสมมาตรจากนั้นคุณสามารถตัดสินใจด้วยตัวเองหากคุณต้องการคิดเกี่ยวกับปัญหาหรืออ่านคำตอบที่สมบูรณ์

ให้เราแสดงถึงจุดตัดโดย cx,cy. สมมติว่าผู้เล่นทั้งสองใช้กลยุทธ์c=12. ให้เราแสดงจำนวนผู้เล่นx และ y ตามลำดับโดย x1 และ y1 และจำนวนที่สองที่เป็นไปได้ x2 และ y2. สมมติx1=23. ด้วยการรักษาความน่าจะเป็นนี้ไว้สำหรับผู้เล่นx ชนะคือ

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
นี่ก็หมายความว่า 23เป็นค่ามัธยฐานของการแจกแจงนี้

สมมติว่าตอนนี้ x1=12. ด้วยการรักษาความน่าจะเป็นนี้ไว้สำหรับผู้เล่นx ชนะคือ

P(y1<12)P(y2<12)=1212=14
แต่ถ้าเขาจะทิ้ง x1=12 เขามีความน่าจะเป็น
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
ของการชนะ 38>14 ดังนั้นการรักษา x1=12 (และสภาพแวดล้อม) ไม่เหมาะสมดังนั้นจึงไม่สามารถเคลื่อนไหวได้อย่างสมดุล


แจ้งเตือนสปอยเลอร์

หากผู้เล่น y มีการตัดออก cy และผู้เล่น x ดึง x1=cy และทำให้มันน่าจะเป็นที่ผู้เล่น x ชนะคือ

P(y1<cy)P(y2<cy)=cycy=cy2.
หากผู้เล่น x จะทิ้งที่ไหน x1 ความน่าจะเป็นที่เขาชนะคือ
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
สมมติว่ามีความสมดุลสมมาตรนั่นคือ cx=cy=c.
(ฉันไม่คิดว่าดุลยภาพอื่นจะมีอยู่ แต่ฉันไม่ได้พิสูจน์มัน)
เนื่องจากความน่าจะเป็นที่จะชนะนั้นต่อเนื่องตามมูลค่าของx1ค่าการตัด c เป็นเช่นนั้นถ้า x1=c ความน่าจะเป็นในการชนะจะเท่ากันเมื่อ x1จะถูกเก็บไว้และเมื่อมันถูกทิ้ง ซึ่งหมายความว่า
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.


มีคนทำแบบเดียวกันกับคุณและทำการคำนวณ Wolfram นี้เพื่อตรวจสอบอีกครั้ง: tinyurl.com/j9xey5tดังนั้นฉันจะไปข้างหน้าแล้วบอกว่าสิ่งนี้ถูกต้อง ตอนนี้ถ้าคุณแก้ปัญหารูปแบบทั่วไปของเกมนี้ฉันจะให้คำตอบที่ดีที่สุด: P Kidding ~ (แม้ว่ามันจะน่าสนใจที่จะเห็นว่าเกมเปลี่ยนไปอย่างไรกับโอกาสที่จะได้รับการเรียกใหม่มากขึ้น) การตัดยอดแก้ไขของคุณหมายความว่าผู้เล่นทั้งสอง % ของการชนะหรือคุณยังคิดว่ามีข้อผิดพลาดในคำตอบของคุณ?
Kitsune Cavalry

@ KitsuneCavalry ฉันคิดว่าการยอมรับมันก่อนกำหนดเล็กน้อย แต่โชคดีที่การคำนวณถูกต้องและเหตุผลของฉันเกี่ยวกับ 50% นั้นผิด การตัดมีสูงมากจนการวาดเป็น 'โชคดี' ดังนั้นคุณจึงมีโอกาสชนะมากกว่า 50% ถ้าคุณวาดมัน ก่อนที่จะเสมอคุณจะได้ 50%
Giskard

หากนับรวมถึงสิ่งใดเว็บไซต์ที่ให้คำถามจะให้คำตอบ คุณได้รับเงิน รู้สึกเหมือนเป็นผู้ชนะในวันนี้ คุณได้รับมัน B)
Kitsune Cavalry

2

สมมติว่าคนที่ 1 เลือกทางลัด c1 และคนที่ 2 เลือกตัดยอดจาก c2กับ c2c1. ปล่อยp1(x) เป็นความน่าจะเป็นที่จำนวนสุดท้ายของบุคคลที่ 1 ไม่เกิน x. p1(x) เท่ากับ c1x ถ้า x<c1 และ c1x+xc1มิฉะนั้น. กำหนดp2(x)เหมือนกับ ตอนนี้พล็อตp2(x) ต่อต้าน p1(x) บนพล็อตพารามิเตอร์สำหรับ 0x1. ผลลัพธ์คือสามส่วนของเส้น:

  • หนึ่งจาก (0,0) ถึง (c12,c1c2)สอดคล้องกับ 0xc1;
  • หนึ่งจาก (c12,c1c2) ถึง (c1c2+c2c1,c22)สอดคล้องกับ c1xc2;
  • หนึ่งจาก (c1c2+c2c1,c22) ถึง (1,1)สอดคล้องกับ c2x1.

ส่วนของเส้นสามเส้นนี้แบ่งตารางหน่วยออกเป็นสองส่วน พื้นที่ของส่วนใต้กราฟคือความน่าจะเป็นที่บุคคล 1 มีจำนวนสูงกว่า เรขาคณิตบางอันแสดงว่าบริเวณนี้เป็น12+12(c2c1)(c1c2+c21). เพื่อให้มีความสมดุลที่มั่นคงทั้งอนุพันธ์ย่อยของสิ่งนี้จะต้องเป็นศูนย์เช่น

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

การเพิ่มสมการแสดงให้เห็นว่า (c2c1)(1+c1+c2)=0ซึ่งเป็นไปได้ก็ต่อเมื่อ c1=c2. กลับมาเป็นสมการหนึ่ง1c1c12=0ดังนั้นดุลคงตัวเดียวจึงอยู่ที่ c1=c2=512.


นี่เป็นคำตอบที่ดี แต่ทำไมคุณถึงเรียกดุลยภาพว่าดุลยภาพ?
Giskard

1
@denesp ฉันเดาว่ามันซ้ำซ้อน
f ''
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.