เพื่อเพิ่มโอกาสในการเดาผลการพลิกเหรียญอย่างถูกต้องฉันควรเลือกผลลัพธ์ที่เป็นไปได้มากที่สุดหรือไม่?


20

นี่ไม่ใช่การบ้าน ฉันสนใจที่จะเข้าใจว่าตรรกะของฉันถูกต้องกับปัญหาสถิติอย่างง่ายนี้หรือไม่

สมมติว่าผมมีเหรียญ 2 ด้านที่น่าจะเป็นของการพลิกหัวคือและน่าจะเป็นของการพลิกหางเป็น(H) สมมติว่าการโยนทั้งหมดมีความน่าจะเป็นอิสระ ตอนนี้สมมติว่าฉันต้องการเพิ่มโอกาสในการทำนายว่าเหรียญจะเป็นส่วนหัวหรือส่วนท้ายของการพลิกครั้งต่อไป ถ้า , ฉันสามารถคาดเดาหัวหรือหางที่สุ่มและน่าจะเป็นของฉันเป็นที่ถูกต้องคือ0.51 - P ( H ) P ( H ) = 0.5 0.5P(H)1P(H)P(H)=0.50.5

ทีนี้สมมติว่าถ้าฉันต้องการเพิ่มโอกาสในการคาดเดาให้ถูกต้องมากที่สุดฉันควรจะคาดเดาก้อยที่ความน่าจะเป็นคือหรือไม่?0.8P(H)=0.20.8

ถ้าฉันมีแบบ 3 ด้านและความน่าจะเป็นในการหมุน 1, 2 หรือ 3 คือ , , และฉันควรเดา 2 เสมอเพื่อเพิ่มโอกาสในการคาดเดาให้ถูกต้องที่สุดหรือไม่? มีวิธีอื่นอีกไหมที่จะทำให้ฉันเดาได้แม่นยำขึ้นP ( 2 ) = 0.5 P ( 3 ) = 0.4P(1)=0.1P(2)=0.5P(3)=0.4


4
ฟังดูเหมือนว่าคุณกำลังถามถึงความเป็นอิสระ: ตัวอย่างเช่นถ้าคุณได้เป็นหัวหน้าครั้งเดียวนั่นจะทำให้ 'ก้อย' มีโอกาสมากขึ้นในครั้งต่อไปหรือไม่? หากนี่ไม่ใช่สิ่งที่คุณถามคุณช่วยอธิบายคำถามของคุณได้ไหม (ถ้าฉันเข้าใจคำถามของคุณถูกต้องคำตอบคือ 'ใช่': ในสถานการณ์เช่นเหรียญที่โยนผลลัพธ์ที่เป็นไปได้มากที่สุดจะเป็นผลลัพธ์ที่มีความเป็นไปได้สูงสุดเสมอโดยไม่คำนึงถึงสิ่งที่เกิดขึ้นก่อนหน้านี้)
arboviral

ขอบคุณสำหรับความช่วยเหลือ @arboviral ใช่ฉันกำลังสมมติความเป็นอิสระ ฉันได้อัปเดตคำถามเพื่อระบุสิ่งนี้แล้ว
เต่า

4
การสมมติความเป็นอิสระสิ่งที่ดีที่สุดที่คุณสามารถทำได้คือเลือกข้างที่มีความน่าจะเป็นสูงสุด คิดแบบนี้ คุณไม่มีข้อมูลอื่นที่จะคาดเดาได้ดีขึ้น สิ่งที่คุณรู้เกี่ยวกับลูกเต๋าคือความถี่ที่ด้านหนึ่งปรากฏขึ้นและสิ่งที่คู่สุดท้ายพ่น แต่ความเป็นอิสระบอกคุณว่าแถวก่อนหน้าไม่มีผลกระทบกับการโยนปัจจุบัน บางทีถ้าคุณมีข้อมูลเพิ่มเติมเช่นจำนวนกำลังที่ใช้ในการโยนลูกเต๋ามือซ้าย / มือขวาโยนหรือจำนวนการสั่นก่อนที่จะกลิ้ง อย่างไรก็ตามหากลูกเต๋ามีความยุติธรรมอย่างแท้จริงฉันก็ยังสงสัยว่าระดับของรายละเอียดนั้นจะให้การทำนายที่ดีกว่า
Brent Ferrier

การเดาของคุณถูกต้อง มันเป็นผลมาจากความไม่เสมอภาคของผู้ถือ (ด้วยพารามิเตอร์ ) (1,)
whuber

คุณรู้หรือไม่ว่า P (H) = 0.2? หรือว่าเป็นสิ่งที่คุณต้องคิดออกโดยการสังเกตผลลัพธ์?
Akavall

คำตอบ:


43

คุณถูก. ถ้าและคุณใช้การสูญเสียศูนย์หนึ่ง(นั่นคือคุณต้องเดาผลลัพธ์ที่เกิดขึ้นจริงซึ่งตรงข้ามกับความน่าจะเป็นหรือบางสิ่งบางอย่างและการรับหัวเมื่อคุณเดาว่าหางไม่เท่ากัน รับหางเมื่อคุณคาดเดาหัว) คุณควรเดาหางทุกครั้งP(H)=0.2

ผู้คนมักจะคิดผิดพลาดว่าคำตอบคือการคาดเดาการสุ่มเลือก 80% ของการทดลองและหัวในส่วนที่เหลือ กลยุทธ์นี้เรียกว่า "การจับคู่ความน่าจะเป็น " และได้รับการศึกษาอย่างกว้างขวางในการตัดสินใจเชิงพฤติกรรม ดูตัวอย่าง

ตะวันตก, RF, & Stanovich, KE (2003) ความน่าจะเป็นที่ตรงกับที่สมาร์ท? ความสัมพันธ์ระหว่างตัวเลือกความน่าจะเป็นและความสามารถทางปัญญา หน่วยความจำและความรู้ความเข้าใจ, 31 , 243–251 ดอย: 10.3758 / BF03194383


1
+1 สำหรับตัวชี้การจับคู่ความน่าจะเป็น ไม่เคยได้ยินมาก่อน แต่ฉันแน่ใจว่าฉันใช้ประโยชน์จากมันทุกวันเป็นอคติทางปัญญา! :)
leekaiinthesky

2
(+1) สิ่งนี้เกี่ยวข้องกับความเข้าใจผิดที่พบบ่อยในการตีความโมเดลการถดถอยแบบหลายชื่อ & สิ่งที่คล้ายกัน: ผู้คนสามารถประหลาดใจที่การกระจายตัวของชั้นเรียนที่คาดการณ์ไม่ตรงกับการกระจายของชั้นเรียนที่สังเกตไว้ . (ดีใจที่ทราบว่ามีชื่ออยู่)
Scortchi - Reinstate Monica

1
(+1) สำหรับคำว่า "การจับคู่ความน่าจะเป็น"
Haitao Du

13

คุณจำเป็นต้องถามคำถามที่น่าสนใจเป็นอย่างยิ่ง: ฉันควรทำนายโดยใช้ "MAP Bayesian" การประมาณค่าสูงสุดหลังหรือ "Real Bayesian"

สมมติว่าคุณรู้ว่าการแจกแจงที่แท้จริงที่จากนั้นใช้การประมาณค่า MAP สมมติว่าคุณต้องการคาดคะเน 100 การพยากรณ์ในผลการค้นหา 100 ครั้งต่อไป คุณควรคาดเดาว่าฟลิปคือหางไม่ต้องเดาหัวและหาง สิ่งนี้เรียกว่า "MAP Bayesian" โดยทั่วไปคุณกำลังทำอยู่20 80P(H)=0.22080

argmaxθf(x|θ)

ไม่ยากที่จะพิสูจน์ว่าโดยการทำเช่นนั้นคุณสามารถลดข้อผิดพลาดที่คาดการณ์ไว้ (การสูญเสีย 0-1) หลักฐานที่สามารถพบได้ในหน้า ~ 53 รู้เบื้องต้นเกี่ยวกับการเรียนรู้ทางสถิติ


มีอีกวิธีหนึ่งในการทำสิ่งนี้เรียกว่าวิธี "เบย์จริง" โดยทั่วไปคุณไม่ได้พยายาม "เลือกผลลัพธ์ที่มีความน่าจะเป็นสูงที่สุด แต่ให้พิจารณาทุกกรณีที่เป็นไปได้" ดังนั้นหากมีคนขอให้คุณ "คาดการณ์ 100 ถัดไป" การพลิกคุณควรหยุดเขา / เธอเพราะเมื่อคุณได้รับ 100 ไบนารีผลลัพธ์ ข้อมูลความน่าจะเป็นของแต่ละผลลัพธ์จะหายไป แต่คุณควรถามว่าคุณต้องการทำอะไรหลังจากรู้ผลลัพธ์

สมมติว่าเขา / เธอมีฟังก์ชั่นการสูญเสียบางอย่าง (ไม่จำเป็นต้องสูญเสีย 0-1 เช่นฟังก์ชั่นการสูญเสียสามารถถ้าคุณพลาดหัวคุณต้องจ่าย$ 1 แต่ถ้าคุณพลาดหางคุณต้องจ่าย$ 5 คือการสูญเสียที่ไม่สมดุล) จากการทำนายของคุณจากนั้นคุณควรใช้ความรู้ของคุณเกี่ยวกับการแจกแจงผลลัพธ์เพื่อลดการสูญเสียการกระจายทั้งหมด

xyp(x,y)L(f(x),y)

นั่นคือการรวมความรู้ของคุณเกี่ยวกับการแจกแจงสู่การสูญเสียแทนที่จะเป็น "วิธีการคิดแบบสเตจ" เพื่อรับการทำนายและทำขั้นตอนถัดไป

ยิ่งไปกว่านั้นคุณมีสัญชาตญาณที่ดีมากเกี่ยวกับสิ่งที่จะเกิดขึ้นเมื่อมีผลลัพธ์ที่เป็นไปได้มากมาย การประมาณค่า MAP จะไม่ทำงานได้ดีถ้าจำนวนผลลัพธ์มีขนาดใหญ่และมวลความน่าจะเป็นแพร่กระจายอย่างกว้างขวาง ลองคิดดูว่าคุณมีลูกเต๋า 100 แต้มและคุณรู้ว่าการแจกแจงที่แท้จริง ที่ไหนและPตอนนี้คุณทำอะไรกับ MAP คุณจะเดาได้เสมอว่าคุณจะได้ด้านแรกเนื่องจากมีความน่าจะเป็นที่มากที่สุดเมื่อเทียบกับคนอื่น ๆ อย่างไรก็ตามคุณจะผิดของเวลา !!P ( S 2 ) = P ( S 3 ) = P ( S 100 ) = 0.9 / 99 = 0.009090 S 1P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%


4
MAP ยังเป็นแบบเบย์ นอกจากนี้คุณอธิบายทั้งสองวิธีโดยไม่ต้องหมาย แต่อย่างใดกับการใช้ไพรเออร์สิ่งที่สามารถทำให้เข้าใจผิดตั้งแต่คุณเขียนเกี่ยวกับวิธีการแบบเบย์และไพรเออร์มีคุณลักษณะหลักของวิธีการเหล่านั้น
ทิม

'ดังนั้นถ้ามีคนขอให้คุณ "คาดการณ์ 100 ถัดไป" พลิกคุณควรปฏิเสธที่จะทำเช่นนั้น'ถ้ามีคนให้ฉันหนึ่งพันล้านยูโรถ้าฉันทำนายถูกต้องฉันอาจจะไม่ปฏิเสธ หรือคุณอาจหมายถึง 'ทำนาย' ในความหมายที่แตกต่างจาก 'พยายามเดา'
JiK

"เมื่อคุณได้รับ 100 ไบนารี่ผลลัพธ์ความน่าจะเป็นสำหรับผลลัพธ์แต่ละรายการจะหายไป"ในตอนแรกฉันอ่านมันว่า "เมื่อคุณได้รับ 100 ไบนารี่ผลลัพธ์" และไม่เข้าใจประโยค แต่ตอนนี้ฉันรู้แล้วว่ามันอาจหมายถึง "เมื่อคุณให้ 100 ผลลัพธ์ไบนารี " อันไหนถูกต้องและถ้าเป็นอันแรกมันหมายถึงอะไร?
JiK

1
จุดเล็ก ๆ น้อย ๆ : ฉันอาจเพิ่มเส้นแนวตั้งหลังจากย่อหน้าที่สองเพื่อระบุว่าสองย่อหน้าแรกนั้นมีเทคนิคเพียงพอที่จะตอบคำถามตามตัวอักษรและส่วนที่เหลือเป็นข้อมูลเพิ่มเติม (ซึ่งเป็นเรื่องที่น่าสนใจและมีประโยชน์)
JiK

2
ในย่อหน้าสุดท้าย: "การประมาณค่า MAP จะไม่ทำงานหากจำนวนผลลัพธ์มีขนาดใหญ่ - - อย่างไรก็ตามคุณจะผิด 90% ของเวลา !!" การทำงานไม่ดีเป็นคำถามของบริบทเสมอ หากนี่เป็นตัวอย่างของเกมการเดิมพันที่เกิดขึ้นซ้ำ (เงินกองกลางถูกแบ่งระหว่างคนที่เดาถูกต้องหรือคืนเงินหากไม่มีใครเดา) กลยุทธ์ของ MAP นั้นจะชนะเงินจำนวนมากในระยะยาวถ้าคุณเล่นกับคนที่เดาการเดา จากการกระจายของผลลัพธ์
JiK

4

เนื่องจากความเป็นอิสระค่าคาดหวังของคุณจะถูกขยายให้ใหญ่ที่สุดเสมอหากคุณเดาว่าเป็นไปได้มากที่สุด ไม่มีกลยุทธ์ที่ดีกว่าเพราะการโยน / หมุนแต่ละครั้งไม่ได้ให้ข้อมูลเพิ่มเติมเกี่ยวกับเหรียญ / ตาย

ทุกที่ที่คุณคาดเดาผลลัพธ์ที่มีโอกาสน้อยกว่าที่คุณคาดหวังว่าจะชนะนั้นน้อยกว่าถ้าคุณเดากรณีที่เป็นไปได้มากที่สุดดังนั้นคุณจะดีกว่าเพียงแค่เดากรณีที่เป็นไปได้มากที่สุด

หากคุณต้องการทำเพื่อที่คุณจะไม่จำเป็นต้องเปลี่ยนกลยุทธ์ในขณะที่คุณพลิกคุณอาจพิจารณาเหรียญ / ตายที่คุณไม่ทราบราคาในตอนแรกและคุณต้องคิดออกเมื่อคุณหมุน


1
ให้ฉันคำตอบนี้เป็นคำอธิบายที่ง่ายที่สุด; หากคุณต้องกำหนดกลยุทธ์โดยพิจารณาจากผลลัพธ์ที่ได้ก่อนหน้านี้การแบ่งความน่าจะเป็น "อิสระ"
Walfrat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.