เดิมพันของ Blackwell


12

ฉันได้อ่านเกี่ยวกับความขัดแย้งเดิมพัน Blackwell เกี่ยวกับการไม่ได้ผลตู้เสื้อผ้า นี่คือบทสรุป: คุณจะมีสองซองจดหมายและE_yซองจดหมายมีจำนวนเงินสุ่ม แต่คุณไม่รู้อะไรเลยเกี่ยวกับการกระจายเกี่ยวกับเงิน คุณเปิดหนึ่งตรวจสอบจำนวนเงินที่มี ( ) และต้องเลือก: ใช้ซองจดหมายหรือ ?E y x E x E yExEyxExEy

Futility Closet หมายถึงนักคณิตศาสตร์ชื่อ Leonard Wapner:“ โดยไม่คาดคิดมีบางสิ่งที่คุณสามารถทำได้โดยไม่เปิดซองอื่นเพื่อให้ตัวเองดีกว่าโอกาสที่จะทำให้ถูกต้อง”

ความคิดซึ่งดูเหมือนว่าผิดที่ฉันจะเป็นดังนี้: เลือกจำนวนสุ่มdหากใช้E_xถ้าเลือกE_yd < x E x d > x E ydd<xExd>xEy

Wapner:“ ถ้า d อยู่ระหว่าง x และ y การทำนายของคุณ (ตามที่ระบุโดย d) จะรับประกันว่าถูกต้อง สมมติว่าสิ่งนี้เกิดขึ้นกับความน่าจะเป็น p หาก d มีค่าน้อยกว่าทั้ง x และ y การทำนายของคุณจะถูกต้องเฉพาะในกรณีที่หมายเลข x ที่คุณเลือกนั้นใหญ่กว่าของทั้งสอง มีโอกาส 50 เปอร์เซ็นต์ของสิ่งนี้ ในทำนองเดียวกันถ้า d มากกว่าตัวเลขทั้งสองการคาดคะเนของคุณจะถูกต้องเฉพาะในกรณีที่หมายเลขที่คุณเลือกน้อยกว่าทั้งสอง สิ่งนี้เกิดขึ้นกับความน่าจะเป็น 50 เปอร์เซ็นต์เช่นกัน”

หากเป็นไปได้ว่าอยู่ในเป็นจำนวนมากกว่าศูนย์แล้วประสบความสำเร็จเฉลี่ยของวิธีนี้คือ{2} ซึ่งหมายความว่าการสังเกตตัวแปรสุ่มที่ไม่เกี่ยวข้องจะให้ข้อมูลเพิ่มเติมแก่เรา[ x , y ] 1d[x,y]12+p2

ฉันคิดว่ามันผิดทั้งหมดและปัญหาอยู่ที่การเลือกหมายเลขสุ่ม มันหมายความว่าอะไร? ชอบจำนวนเต็มใด ๆ ในกรณีนั้นความน่าจะเป็นที่อยู่ระหว่างและเป็นศูนย์เพราะทั้งและมี จำกัดd x y x ypdxyxy

ถ้าเราบอกว่ามีการ จำกัด จำนวนเงินสูงสุดพูดหรืออย่างน้อยเราก็เลือก d จากสูตรก็จะลดลงตามคำแนะนำเล็กน้อยในการเลือกถ้าและ เลือกถ้า 21 ... M E Y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

ฉันคิดถึงบางสิ่งที่นี่หรือไม่

แก้ไข

ตกลงตอนนี้ฉันเริ่มที่จะเห็นว่าความขัดแย้งที่ชัดเจนมาจากไหน ฉันคิดว่าเป็นไปไม่ได้ที่ตัวแปรสุ่มที่ไม่เกี่ยวข้องสามารถให้ข้อมูลเพิ่มเติมได้

อย่างไรก็ตามทราบว่าเราต้องมีสติเลือกการกระจายของd ตัวอย่างเช่นเลือกขอบเขตสำหรับการแจกชุดหรือของการกระจาย Poissionian เป็นต้นชัดเจนว่าถ้าเราเล่นให้กับถั่วลิสงและเราเลือกการกระจายของdให้เหมือนกันในดอลลาร์0 นี้น่าจะเป็นครั้งสุดท้ายจะขึ้นเป็นครั้งแรกและสำคัญที่สุดในการตัดสินในสิ่งที่เราสามารถจะอยู่ในซองจดหมาย[ 10 9 , 2 10 9 ] P ( d ( x , y ) ) = 0λ[109,2109]P(d(x,y))=0

กล่าวอีกนัยหนึ่งหากเทคนิคการทำงานแล้วสมมติฐานที่เราไม่ทราบว่าการกระจายของเงินในซองจดหมาย (ละเมิดจำนวนเงินสำหรับซองจดหมายที่ถูกเลือก) คืออะไร อย่างไรก็ตามถ้าเราไม่รู้จริง ๆ ว่ามีอะไรอยู่ในซองจดหมายดังนั้นในสถานการณ์กรณีที่เลวร้ายที่สุดเราจะไม่ปล่อยสิ่งใดโดยการใช้มัน

แก้ไข 2

ความคิดอื่น ได้รับให้เราเลือกสำหรับการวาดภาพ , การกระจายที่ไม่ใช่เชิงลบอย่างต่อเนื่องดังกล่าวว่าx) เราได้รับอนุญาตให้ทำเช่นนั้นฉันถูกต้องไหม? เราดำเนินการตามคำแนะนำ - ถ้าเราเก็บซองจดหมายไว้ถ้าเราเปลี่ยนซองจดหมาย เหตุผลไม่เปลี่ยนแปลงขึ้นอยู่กับวิธีที่เราเลือกการแจกแจงซึ่งอาจเป็นได้ว่า (หรือฉันเข้าใจผิด?)d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

อย่างไรก็ตามด้วยวิธีที่เราเลือกการกระจายสิ่งที่เราทำตอนนี้เทียบเท่ากับการโยนเหรียญ เราโยนเหรียญและถ้าเป็นหัวเราจะเปลี่ยนซองจดหมายถ้าเป็นหางเราติดกับซองจดหมายที่เราถือ ฉันผิดตรงไหน

แก้ไข 3 :

ตกลงฉันเข้าใจแล้ว ถ้าเรายึดฟังก์ชันความน่าจะเป็นของบน (เช่นเราสุ่มตัวอย่างจากการแจกแจงแบบสม่ำเสมอในช่วง , ดังนั้นความน่าจะเป็นไม่เป็นอิสระจากy))x d ( 1 , 2 x ) P ( d ( x , y ) ) P ( การตัดสินใจที่ถูกต้อง| d ( x , y ) )dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

ดังนั้นถ้า (ด้วยความน่าจะเป็น ) การคาดเดาจะถูกต้องเสมอเหมือนเมื่อก่อน หากเป็นจำนวนที่ต่ำกว่าและมากกว่ามีโอกาสสูงที่จะต่ำกว่ามากกว่าที่จะสูงกว่าดังนั้นเราจึงมีอคติต่อการตัดสินใจที่ไม่ถูกต้อง การใช้เหตุผลแบบเดียวกันนั้นเมื่อสูงกว่าของตัวเลขทั้งสองp x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

นั่นหมายความว่าเราจะต้องเลือกกระบวนการของการวาดภาพเป็นอิสระจากxกล่าวอีกนัยหนึ่งเราต้องคาดเดาเกี่ยวกับพารามิเตอร์ของการแจกแจงที่ดึงและที่เลวร้ายที่สุดที่เกิดขึ้นคือเรายังคงคาดเดาแบบสุ่ม แต่สิ่งที่ดีที่สุดที่เกิดขึ้นคือการเดาของเราถูกต้องแล้วเราก็มีข้อได้เปรียบ วิธีนี้ควรจะดีกว่าการคาดเดา "x และ y ฉันจะคิดว่าอย่างน้อย 1 $แต่อย่างน้อย10 $ดังนั้นถ้าเราเก็บไว้และถ้าไม่เราแลกเปลี่ยนมัน" ฉันยัง ดู.x x y x > 5dxxyx>5

ฉันถูกทำให้เข้าใจผิดโดยการกำหนดป๊อป - ไซของปัญหาในหนังสือของ Wapner ( ความคาดหวังที่ไม่คาดคิด: ความอยากรู้ของลูกบอลคริสตัลทางคณิตศาสตร์ ) ซึ่งระบุ

"ไม่ว่าด้วยวิธีใดก็ตามให้เลือกจำนวนเต็มบวกแบบสุ่ม" (Wapner แนะนำการกระจายทางเรขาคณิต - การโยนเหรียญจนกว่าหัวแรกจะปรากฏขึ้นทำซ้ำกระบวนการถ้า ) "ถ้าเดาสูงขึ้นและถ้าเดา ต่ำกว่า (... ) คุณจะเดาได้อย่างถูกต้องมากกว่า 50 เปอร์เซ็นต์ของเวลาเพราะชี้อย่างถูกต้องมากกว่า 50 เปอร์เซ็นต์ของเวลา! "d > x d < x dd=xd>xd<xd


1
มีความเกี่ยวข้องอย่างใกล้ชิด: stats.stackexchange.com/questions/95694
whuber

2
นี่ค่อนข้างแตกต่างจากปัญหาของสองซองจดหมายในแง่ที่ว่า: (1) อาร์กิวเมนต์ที่ให้สำหรับการสลับในปัญหาสองซองนั้นผิดพลาดข้อบกพร่องในการโต้แย้งสามารถมองเห็นได้โดยการเพิ่ม Bayesian ก่อนในขณะที่ (2) อาร์กิวเมนต์ มอบให้โดย Wapner สำหรับการเดิมพันของ Blackwell ถูกต้อง
Matthew Gunn

หากจำนวนเงินในซองจดหมายเป็นองค์ประกอบโดยพลการของชุดตัวเลข S เงื่อนไขที่เพียงพอและจำเป็นสำหรับกลยุทธ์ของ Wapner ในการทำงานคือ CDF ของจำนวนที่คุณเลือกที่จะเพิ่มขึ้นอย่างเข้มงวดใน S.
Reinstate Monica

ตกลงฉันยังคงมีบางสิ่งบางอย่าง - โปรดดู EDIT 2 ของฉัน แต่ดูเหมือนว่าฉันจะโยนเหรียญได้ แต่มันก็ยังใช้งานได้ตามเหตุผล ฉันผิดตรงไหน
มกราคม

คำตอบ:


8

นี้เป็นที่รู้จักกันอย่างแพร่หลายมากขึ้นเป็นปัญหาสองซองจดหมาย โดยทั่วไปจำนวนเงินจะได้รับเป็นและแต่ก็ไม่จำเป็นต้องเป็นเช่นนี้2 AA2A

บางจุด:

  1. คุณไม่สามารถเลือกจำนวนเต็มแบบสุ่มอย่างสม่ำเสมอ * แต่ส่วนที่ยกมานั้นดูเหมือนจะไม่ต้องการให้เป็นแบบเดียวกัน เลือกการแจกแจง - มันไม่สำคัญว่ามันจะเป็นอะไรสำหรับการโต้แย้งตราบใดที่มันมีความน่าจะเป็นที่จะมีค่าที่แน่นอนเกิน

  2. มันจะไม่มีเหตุผลที่จะเลือกจำนวนเต็มกับกฎการตัดสินใจที่ยกมาเพราะเงินไม่ต่อเนื่องซึ่งหมายความว่ามีโอกาสที่ไม่ใช่ศูนย์และไม่มีรายการใด ๆ สำหรับกรณีนี้ (หรืออีกวิธีหนึ่งคือปรับเปลี่ยนกฎเพื่อระบุสิ่งที่ต้องทำเมื่อมีค่าเท่ากัน)d d=x

  3. นอกเหนือจากนั้นคุณสามารถเลือกจากการกระจายอย่างต่อเนื่องที่ไม่เป็นลบ - จากนั้นเราไม่ต้องกังวลเกี่ยวกับความเสมอภาคd

* (หรือคุณไม่สามารถเลือกเลขจำนวนเต็มแบบไม่ลบอย่างสม่ำเสมอหรือจำนวนเต็มบวกแบบสุ่มแบบสม่ำเสมอ)


ถ้าเราบอกว่ามีการ จำกัด จำนวนเงินสูงสุดพูดหรืออย่างน้อยเราก็เลือกจากสูตรก็จะลดลงตามคำแนะนำเล็กน้อยในการเลือกถ้าและ เลือกถ้าMd1...MEyx<M/2Exx>M/2

หากปรากฎว่าการแจกแจงแบบสุ่มที่ถูกเลือกครอบคลุมสิ่งนี้น่าจะใช้ได้ (ให้คุณดีกว่า 50-50) หากการกระจายตัวติดอยู่ในครึ่งเดียวมันจะไม่เกิดขึ้นxM/2

อย่างไรก็ตามเวอร์ชันของเกมนี้ที่ฉันนำเสนอเป็นครั้งแรกคือมีคนนำเสนอที่ซองจดหมาย (อาจ) พยายามลดรายได้ของคุณจากเกม กลยุทธ์ของการใช้การกระจายเพื่อตัดสินใจว่าจะสลับไปยังซองจดหมายอื่นจะยังคงใช้งานได้ในอินสแตนซ์นั้น


ตกลงคะแนน (1-3) ดังนั้นฉันได้รับอนุญาตให้เลือกการกระจายแบบสุ่มที่ไม่เป็นลบและต่อเนื่องของที่ถูกต้องหรือไม่ แต่การตัดสินใจขึ้นอยู่กับการโยนเหรียญ ... ฉันผิดหรือเปล่า? dP(d<x)=P(d>x)
มกราคม

คุณไม่ต้องการเลย คุณแค่ต้องการความน่าจะเป็นที่ไม่เป็นศูนย์ที่จะได้ระหว่างสองจำนวน P(d<x)=P(d>x)
Glen_b -Reinstate Monica

ใช่ แต่ฉันได้รับอนุญาตให้กำหนดฟังก์ชั่นความหนาแน่นสำหรับตามที่ฉันต้องการใช่มั้ย ฉันทำเช่นนั้นเพื่อนำการโต้แย้งไปสู่ข้อสรุปที่ไร้สาระ d
มกราคม

ด้วยการทำให้กลยุทธ์ของคุณเป็นฟังก์ชั่นของ x คุณไม่ได้ให้ความได้เปรียบในการเลือกตัวเลือกที่ถูกต้องเมื่อ d อยู่ระหว่าง x และ y - คุณกำลังกำหนดทางออกของคุณในการชนะเกม หากลิงก์ที่คุณให้อ้างว่ากลยุทธ์ดังกล่าวใช้งานได้พวกเขาจะผิด
Glen_b

อะไรในการให้เหตุผลของ Wapner ห้ามฉันจะกำหนดฟังก์ชั่นน่าจะนำมาใช้เพื่อเป็นหน้าที่ของ ? ตราบใดที่ดังนั้นการใช้เหตุผลของเขายังคงใช้ได้อยู่ฉันผิดหรือเปล่า? ถ้าฉันใช้การแจกแจงแบบต่อเนื่องและไม่เป็นลบซึ่งรวมถึง (เช่นการกระจายแบบสม่ำเสมอในจากนั้นฉันรับประกันได้ว่านี่เป็นกรณีนี้และฉันยังคงตัดสินใจถูกต้องหาก .dxP(d(x,y))>0x(1,2x)d(x,y)
มกราคม

7

อาร์กิวเมนต์ของ Wapner นั้นถูกต้อง!

ความคิดเห็นบางส่วน:

  • ปฏิบัติตามกลยุทธ์การตัดที่อธิบายซึ่งเราสลับซองจดหมายหากนั้นไร้ประโยชน์ที่สุดในความคาดหวังของอดีต ด้วยตัวเลือกที่ดีของมันมีประโยชน์ทีเดียวx<dd
  • หากคุณเพิ่ม Bayesian ก่อน (เช่นคุณเพิ่มความเชื่อเกี่ยวกับการกระจายเงินเริ่มต้นในซองจดหมาย) คุณสามารถแก้ปัญหาเพื่อให้ได้ค่าที่ดีที่สุดของจากความเชื่อเดิมของคุณd
  • ในบางสถานการณ์ (เช่นเมื่อคุณสังเกตยิ่งมีโอกาสมากขึ้นที่คุณจะได้รับซองจดหมายขนาดใหญ่) กลยุทธ์การตัดออกก็เหมาะสมที่สุด
  • ในการตั้งค่าแบบเบย์ทั่วไปคุณสามารถทำได้ดีกว่ากลยุทธ์การตัดง่ายๆสำหรับนักบวชหลายคน

ปัญหาที่เกี่ยวข้อง แต่แตกต่างกัน:

เนื่องจาก @Glen_b และ @whuber หลายคนกล่าวถึงมีปริศนาที่เกี่ยวข้องที่เรียกว่าปัญหาสองซองซึ่งมีการโต้แย้งที่ผิดพลาดสำหรับการสลับเปลี่ยนซองจดหมายและข้อบกพร่องในการโต้แย้งสามารถมองเห็นได้โดยใช้วิธีการแบบเบส์และเพิ่มความเชื่อก่อนหน้า เนื้อหาของทั้งสองซอง

ในบางแง่มุมปริศนาที่อธิบายไว้ที่นี่ค่อนข้างแตกต่าง อาร์กิวเมนต์ของ Wapner นั้นถูกต้อง!


1
ตกลงตอนนี้ฉันเห็นว่าความขัดแย้งมาจากไหน หรือจะเฉพาะเจาะจงที่ข้อมูลเพิ่มเติมไหลเข้าสู่ระบบ ด้วยการเลือกการกระจายตัวของdอย่างมีสติเราใช้ความรู้เบื้องต้นของเราเกี่ยวกับสถานที่ที่มากหรือน้อยจำนวนเงินในซองจดหมายทั้งสองควรจะเป็น สถานการณ์กรณีที่เลวร้ายที่สุดความรู้ของเราไม่มีประโยชน์ แต่วิธีการรับประกันว่าเราจะไม่เสียเปรียบหากใช้มัน
มกราคม

หลังจากความคิดบางอย่างฉันยังไม่ได้รับ - ดูแก้ไข 2
วันที่

สถานการณ์ (A) ลองนึกภาพซองขนาดเล็กมีและซองขนาดใหญ่มี20ลองเลือก = 15d) กฎการตัดสินใจจะนำคุณไปสู่ทางเลือกที่ถูกต้อง 100% ของเวลา! 1020dP(x<d)=P(x>d)
Matthew Gunn

ตอนนี้เรามาตรวจสอบบางสถานการณ์ (B) ลองนึกภาพซองจดหมายขนาดเล็กมีจำนวนดอลลาร์แปลก ๆ จาก 1 ถึง 9 (เช่น 1 หรือ 3 หรือ 5 หรือ 7 หรือ 9) และซองจดหมายขนาดใหญ่มีมากกว่า 1 ดอลลาร์ เลือกแล้วd) แม้ว่าที่นี่คุณจะเห็นว่ากฎการตัดสินใจไม่เป็นประโยชน์! จะนำไปสู่การตัดสินใจที่เหมาะสมถ้าหรือและการตัดสินใจที่ผิดถ้า9 จำคู่ที่เป็นไปได้คือ (1,2), (3, 4), (5, 6), (7, 8) (9, 10) $ สิ่ง BAYESIAN ที่เหมาะสมที่สุดที่จะรู้ว่าการกระจายตัวเริ่มต้นนี้จะถูกตำหนิถ้าคุณเห็น จำนวนเงินแปลก ๆ P ( x < d ) = P ( x > d ) < 5.5 x = 1 , 3 , 5 , 6 , 8 , 10 x = 2 , 4 , 7 , 9d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9
Matthew Gunn

เราไม่รู้การกระจายตัวของและดังนั้นเราจึงไม่สามารถเลือกมันในแบบที่คุณเสนอ เมื่อเราเปิดซองจดหมายเรารู้ว่าแต่เราไม่รู้ว่ามันถูกเลือกแบบสุ่มจากจำนวนเต็ม 1 ถึง 9 ดังนั้นเราจึงไม่สามารถเลือกเป็น 5.5 ได้ ดังกล่าวโดย @Glen_b ข้างต้นจะต้องเลือกจากที่ไม่ใช่เชิงลบกระจายอย่างต่อเนื่อง y x d dxyxdd
มกราคม

0

ฉันรู้สึกทึ่งกับสิ่งนี้และใช้วิธีการอย่างจริงจังในการเล่นกับมันใน Excel

ฉันสร้างตัวเลขสุ่มสามตัวสำหรับ x, y และ d ในช่วง 1-100 จากนั้นฉันทำการเปรียบเทียบระหว่าง d กับ x และระหว่าง x กับ y และดูผลลัพธ์ไม่ว่าจะถูกหรือผิด

ฉันทำอย่างนี้ 500 ครั้งแล้วซ้ำอีกหลายครั้งและได้คำตอบที่ถูกต้องเป็นประจำ 330 330 จาก 500 ตามที่คาดการณ์ไว้

ฉันเพิ่มช่วงของ d เป็น 1-10000 และคำตอบที่ถูกต้องลดลงประมาณ 260 สำหรับ 500 วิ่ง

ใช่แล้วการเลือก d ขึ้นอยู่กับค่าที่คาดหวังของ x และ y

BoB


0

ฉันคิดว่าความขัดแย้งที่ชัดเจนกับการขยายตัวของ Wapner ของสมการ p + (1-p) / 2 คือมันถือว่า (1-p) / 2> 0 สำหรับช่วง d จำนวนมากค่านี้คือ 0

ตัวอย่างเช่น: d ใด ๆ ที่เลือกจากการกระจายแบบสมมาตรซึ่งมีศูนย์กลางอยู่ที่ค่าในซองจดหมายเปิดให้ความน่าจะเป็นที่ 1/2 และ 1/2 ที่ถูกต้อง

การกระจายที่เลือกแบบไม่สมมาตรดูเหมือนว่าจะมีอคติต่อตัวเลือกผิดทาง 1/2 เวลา

ดังนั้นมีวิธีเลือกช่วงและการกระจายสำหรับ d เช่นที่สมการนี้ถือ?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.