การถดถอยของการเข้าใจผิดของนักการพนันหมายถึง


29

ในมือข้างหนึ่งผมมีความถดถอยไปหมายและในทางกลับกันผมมีความเชื่อที่ผิด gambler's

ความผิดพลาดของนักพนันนั้นถูกนิยามโดยมิลเลอร์และซันจูร์โจ (2019) ว่า“ ความเชื่อที่ผิดที่ว่าลำดับแบบสุ่มมีแนวโน้มที่จะกลับรายการอย่างเป็นระบบนั่นคือแนวโน้มของผลลัพธ์ที่คล้ายกันนั้นมีแนวโน้มที่จะจบลงมากกว่า ครั้งในแถวจะคิดว่ามีแนวโน้มที่จะตกก้อยในการทดลองครั้งต่อไป

ฉันมีผลงานที่ดีในเกมที่แล้วและจากการถดถอยถึงค่าเฉลี่ยฉันอาจจะมีประสิทธิภาพที่แย่ลงในเกมถัดไป

แต่จากการเข้าใจผิดของนักการพนัน: พิจารณาความน่าจะเป็นที่สองต่อไปนี้โดยสมมติว่าเป็นเหรียญที่ยุติธรรม

  1. ความน่าจะเป็น 20 หัวจากนั้น 1 หาง = 0.520×0.5=0.521
  2. ความน่าจะเป็น 20 หัวจากนั้น 1 หัว = 0.520×0.5=0.521

จากนั้น ...

ลองพิจารณาตัวอย่างง่ายๆ: ชั้นเรียนของนักเรียนทำการทดสอบจริง / เท็จ 100 เรื่องในหัวข้อ สมมติว่านักเรียนทุกคนสุ่มเลือกคำถามทุกข้อ จากนั้นคะแนนของนักเรียนแต่ละคนจะได้รับการตระหนักถึงหนึ่งในชุดของตัวแปรสุ่มแบบอิสระและแบบกระจายซึ่งมีค่าเฉลี่ยที่คาดหวังไว้ที่ 50

โดยธรรมชาติแล้วนักเรียนบางคนจะได้คะแนนสูงกว่า 50 และอย่างมีนัยสำคัญต่ำกว่า 50 โดยบังเอิญ หากใช้เพียงคะแนนสูงสุด 10% ของนักเรียนและให้การทดสอบครั้งที่สองซึ่งพวกเขาเลือกสุ่มในทุกรายการอีกครั้งคะแนนเฉลี่ยจะถูกคาดหวังอีกครั้งใกล้ถึง 50

ดังนั้นค่าเฉลี่ยของนักเรียนเหล่านี้จะ "ถอยหลัง" ไปตลอดทางจนถึงค่าเฉลี่ยของนักเรียนทุกคนที่ทำแบบทดสอบเดิม ไม่ว่านักเรียนจะทำคะแนนในแบบทดสอบเดิมอย่างไรการทำนายคะแนนที่ดีที่สุดในการสอบครั้งที่สองคือ 50

ในกรณีพิเศษหากใช้คะแนนสูงสุดเพียง 10% ของนักเรียนและให้แบบทดสอบครั้งที่สองซึ่งพวกเขาเลือกสุ่มในทุกรายการอีกครั้งคะแนนเฉลี่ยจะถูกคาดหวังอีกครั้งใกล้ถึง 50

จากการเข้าใจผิดของนักการพนันไม่ควรคาดหวังความน่าจะเป็นแบบเดียวกันกับการให้คะแนนและไม่น่าจะใกล้เคียงกับ 50 มากขึ้น?

มิลเลอร์, JB, & Sanjurjo, A. (2019) ประสบการณ์ยืนยันการเข้าใจผิดของนักการพนันอย่างไรเมื่อขนาดตัวอย่างถูกเพิกเฉย


5
ฉันไม่เห็นว่าการเข้าใจผิดของนักพนันเชื่อมโยงกับความน่าจะเป็นสองอย่างที่คุณคำนวณ คุณช่วยอธิบายได้อย่างแม่นยำมากขึ้นว่าอะไรที่คุณเข้าใจว่าการเข้าใจผิดนี้เป็นอย่างไร
whuber

เกมของคุณมีหัวต่อเนื่องที่ยาวที่สุดหรือไม่?
AdamO

1
ฉันชอบคำอธิบายนี้จริงๆ คำตอบที่ผ่านมาดูเหมือนจะยังไม่ได้ล้างมันให้ฉันเลย การถดถอยของค่าเฉลี่ยปรากฏขึ้นเพื่อให้กิจกรรมอิสระขึ้นอยู่กับ บางทีการถดถอยของค่าเฉลี่ยนั้นไม่สามารถใช้สำหรับการสังเกตเพียงครั้งเดียวมันใช้ได้เฉพาะเมื่อมีค่าเฉลี่ยเท่านั้น
icc97

คำตอบ:


28

ฉันคิดว่าความสับสนสามารถแก้ไขได้โดยพิจารณาว่าแนวคิดของ "การถดถอยสู่ค่าเฉลี่ย" ไม่มีอะไรเกี่ยวข้องกับอดีต มันเป็นเพียงการสังเกตซ้ำซากว่าในแต่ละรอบการทดลองเราคาดหวังผลเฉลี่ย ดังนั้นหากก่อนหน้านี้เรามีผลลัพธ์ที่สูงกว่าค่าเฉลี่ยเราก็คาดหวังผลลัพธ์ที่แย่กว่านั้นหรือถ้าเรามีผลลัพธ์ที่ต่ำกว่าค่าเฉลี่ยเราก็คาดหวังได้ดีกว่า ประเด็นสำคัญคือความคาดหวังของตัวเองไม่ได้ขึ้นอยู่กับประวัติก่อนหน้าใด ๆ เช่นเดียวกับในความผิดพลาดของนักพนัน


เผง ในบริบทของคำถามนี้ถ้าหัวสามารถตีความได้ว่าเป็น "ผลลัพธ์ที่ดี" จากนั้นในตัวอย่างของ OP ผลลัพธ์ที่แย่กว่านั้นน่าจะตามมาหลังจากสตริงผลลัพธ์ที่ดีและผลลัพธ์ที่ดีกว่าน่าจะตามมาหลังจากสตริงผลลัพธ์ที่ไม่ดี .
อะมีบากล่าวว่า Reinstate Monica

5
ดูเหมือนว่าคุณจะขัดแย้งกับตัวเอง คุณรัฐและthe expectation itself does not depend on any previous history if we previously had an above average outcome then we expect a worse resultคุณใช้คำว่าคาดหวังทั้งสองแห่งและพูดคุยเกี่ยวกับประวัติในอดีต / ก่อนหน้าในสถานที่ทั้งสอง
Erik

6
ไม่มีความขัดแย้ง เราไม่คาดหวังผลลัพธ์ที่แย่กว่านั้นเพราะผลลัพธ์นั้นขึ้นอยู่กับอีกฝ่ายเราคาดหวังผลลัพธ์ที่แย่กว่านั้นเพราะเราเห็นผลลัพธ์ที่อยู่เหนือความคาดหมายของเรา ความคาดหวังของตัวเองนั้นคงที่และไม่เปลี่ยนแปลงจากการเห็นผลลัพธ์ก่อนหน้า
dsaxton

@Erik บางทีการอ้างอิงอาจช่วยได้ แต่ประเด็นที่ควรทราบคือวิธีแยกความแตกต่างทั้งสองด้าน อันดับแรกเราคาดหวังผลเฉลี่ยหรือเชื่อว่าเป็นไปได้มากที่สุด เมื่อเปรียบเทียบกับผลลัพธ์จริงการคาดการณ์นั้นอาจค่อนข้างดีหรือไม่ดีขึ้นอยู่กับว่าผลลัพธ์นั้นดีหรือไม่ดีนั้นสัมพันธ์กับความคาดหวังของเรา เราไม่ได้รับข้อมูลเกี่ยวกับอนาคต! เราเป็นเพียงการเปรียบเทียบผลที่เกิดขึ้นจริงของเรากับค่าเฉลี่ย (ความคิดเห็นนี้คือตอนที่ซ้ำซ้อน แต่ฉันทิ้งมัน).
wedstrom

9
ไม่ต้องถอนรากถอนโคนเพราะคำตอบของคุณมีความคลุมเครือซึ่งทำให้คำถามเกิดขึ้นตั้งแต่แรก กล่าวคืออะไรผลลัพธ์ที่ "แย่ลง" หลังจากผลคะแนนเฉลี่ยที่สูงกว่าคืออะไร OP ตีความว่าเป็น "เลวร้ายยิ่งกว่าค่าเฉลี่ย" (การตีความที่ให้ความรู้สึกที่ถูกต้องอย่างสังหรณ์ใจเนื่องจากการเข้าใจผิดในโลกที่เป็นธรรม) ในขณะที่การถดถอยถึงค่าเฉลี่ยหมายความว่ามันจะ "แย่กว่าประวัติศาสตร์" คำตอบ (ถูกต้อง) ของคุณจะสามารถเข้าใจได้เฉพาะผู้ที่รู้คำตอบที่ถูกต้องเท่านั้น หากคุณแก้ไขในบางรูปแบบคุณจะได้รับ upvote ของฉัน
Rumtscho

17

หากคุณจะพบว่าตัวเองอยู่ในตำแหน่งดังกล่าวในฐานะบุคคลที่มีเหตุผล (และสมมติว่าเป็นเหรียญที่ยุติธรรม) ทางออกที่ดีที่สุดของคุณคือการเดา หากคุณพบว่าตัวเองอยู่ในฐานะนักพนันที่เชื่อโชคลางสิ่งที่ดีที่สุดของคุณก็คือการดูเหตุการณ์ก่อนหน้านี้และพยายามหาเหตุผลของคุณเกี่ยวกับอดีต - เช่น "ว้าวหัวร้อนแรงเวลาต้าน!" หรือ " ไม่มีทางที่เราจะได้เห็นหัวหน้าอีกคน - ความน่าจะเป็นของแนวนั้นต่ำอย่างไม่น่าเชื่อ!"

การเข้าใจผิดของนักการพนันไม่ได้ตระหนักว่าทุก ๆ 20 เหรียญโยนเราอย่างบ้าคลั่ง - ตัวอย่างเช่นมันไม่น่าจะพลิก 10 หัวแล้ว 10 ก้อยไม่น่าจะพลิกหัวและก้อยสลับกันไม่น่าจะแยก 4 ของ ฯลฯ มันเป็นไปไม่ได้ที่จะพลิก HHTHHTTTHT .. เพราะสำหรับสตริงใด ๆ มีวิธีเดียวเท่านั้นที่จะเกิดขึ้นจากผลลัพธ์ที่แตกต่างกันมากมาย ดังนั้นการทำให้สิ่งใด ๆ เหล่านี้เป็น "น่าจะเป็น" หรือ "ไม่น่าเป็นไปได้" นั้นถือเป็นความเข้าใจผิด

การถดถอยไปสู่ค่าเฉลี่ยนั้นเป็นความเชื่อที่ถูกต้องซึ่งในระยะยาวการสังเกตของคุณควรมาบรรจบกันเป็นค่าคาดหวังที่แน่นอน ตัวอย่างเช่นการเดิมพันของฉันที่การโยนเหรียญ 10 ถึง 20 เป็นสิ่งที่ดีเพราะมีหลายวิธีในการบรรลุเป้าหมาย การเดิมพันที่ 15 จาก 20 นั้นมีโอกาสน้อยกว่ามากเนื่องจากมีจำนวนของสตริงที่น้อยกว่าที่จะได้รับการนับครั้งสุดท้าย มันน่าสังเกตว่าถ้าคุณนั่งไปรอบ ๆ และพลิกเหรียญ (พอใช้) นานพอคุณจะพบกับสิ่งที่ประมาณ 50/50 - แต่คุณจะไม่จบลงด้วยสิ่งที่ไม่มี "ริ้ว" หรือสิ่งที่ไม่น่าจะเป็นไปได้อื่น ๆ เหตุการณ์ในนั้น นั่นคือแกนหลักของความแตกต่างระหว่างแนวคิดทั้งสองนี้

TL; DR : : การถดถอยของค่าเฉลี่ยบอกว่าเมื่อเวลาผ่านไปคุณจะพบกับการกระจายที่สะท้อนการคาดการณ์ในการทดสอบใด ๆ การเข้าใจผิดของนักพนัน (ผิด) บอกว่าการโยนเหรียญแต่ละครั้งมีหน่วยความจำเหมือนกับผลลัพธ์ก่อนหน้าซึ่งควรส่งผลต่อผลลัพธ์ที่เป็นอิสระต่อไป


1
การเข้าใจผิดของนักพนันเป็นแนวคิดที่ผิดหรือไม่? ฉันไม่สามารถรับส่วนสำคัญที่ ขออภัย
Luis P.

6
ความผิดพลาดของนักพนันคือ .. ความผิดพลาด มันผิดมันเป็นเหตุผลที่ไม่ดี การถดถอยของค่าเฉลี่ยคือสถิติล้วนๆ :)
Derek Janni

1
Regression to the mean is the rightly-founded belief that in the long run, your observations should converge to a finite expected value- นั่นคือ "การเข้าใจผิดของนักการพนัน" - หลังจากที่มีหัวเป็นจำนวนมากตอนนี้ก้อยมีโอกาสมากขึ้นเพราะด้วยเหรียญที่ยุติธรรมมันจะมาบรรจบกัน ...
Izkata

2
@Izkata ไม่มาก การถดถอยไปสู่ค่าเฉลี่ยว่าด้วยการทดลองจำนวนมากเส้นด้านใดด้านหนึ่งควรจะออกมาอย่างหยาบ ๆ และยิ่งการทดลองมากเท่าไหร่คุณก็ยิ่งใกล้ค่าเฉลี่ยที่คุณได้รับมากขึ้นเท่านั้น หากคุณพลิกพอที่จะได้รับ 100 หัวคุณอาจมีริ้วหางเพื่อรักษาสมดุลไว้ที่ไหนสักแห่งในการกระจายของคุณเนื่องจากมีเส้นของหัวและก้อยเท่ากัน ที่สำคัญการถดถอยถึงค่าเฉลี่ยไม่ได้ทำให้สมมติฐานเกี่ยวกับตัวเลขเฉพาะใด ๆ เฉพาะค่ารวมเมื่อขนาดตัวอย่างเพิ่มขึ้น
Ethan

1
@Izkata Gambler เข้าใจผิดทำให้การเรียกร้องเกี่ยวกับสิ่งที่จะเกิดขึ้นกับผลลัพธ์เฉพาะใด ๆ การถดถอยของค่าเฉลี่ยทำให้ข้อความทั่วไปเกี่ยวกับสิ่งที่เราคาดหวังจากผลลัพธ์หลายประการ
Derek Janni

5

ฉันพยายามจำไว้เสมอว่าการถดถอยไปสู่ค่าเฉลี่ยนั้นไม่ใช่กลไกการชดเชยสำหรับการสังเกตค่าผิดปกติ

ไม่มีความสัมพันธ์ที่เป็นเหตุและผลระหว่างการเล่นการพนันที่โดดเด่นจากนั้นไป 50-50 หลังจากนั้น เป็นวิธีที่มีประโยชน์ในการจดจำว่าเมื่อคุณสุ่มตัวอย่างจากการแจกจ่ายคุณมีแนวโน้มที่จะเห็นคุณค่าใกล้เคียงกับค่าเฉลี่ยมากที่สุด (ลองคิดถึงความไม่เท่าเทียมของ Chebyshev ที่จะพูดที่นี่)


2
Yay Chebyshev! จุดที่ดี!
Derek Janni

4

นี่เป็นตัวอย่างง่ายๆ: คุณตัดสินใจที่จะโยนทั้งหมด 200 เหรียญ จนถึงตอนนี้คุณได้ขว้างพวกเขา 100 คนและคุณโชคดีมาก: มีหัว 100% โผล่ขึ้นมา (อย่างไม่น่าเชื่อฉันรู้ แต่เราแค่ทำให้ทุกอย่างเรียบง่าย)

มีเงื่อนไข 100 หัวในการโยน 100 ครั้งแรกคุณคาดว่าจะมีทั้งหมด 150 หัวเมื่อสิ้นสุดเกม ตัวอย่างสุดขั้วของการเข้าใจผิดของนักพนันคือการคิดว่าคุณยังคงคาดหวังเพียงแค่ 100 หัว (เช่นค่าที่คาดไว้ก่อนเริ่มเกม) แม้หลังจากได้ 100 ในการโยน 100 ครั้งแรก นักพนันคิดผิดพลาดว่าการโยน 100 ครั้งต่อไปจะต้องเป็นหาง ตัวอย่างของการถดถอยของค่าเฉลี่ย (ในบริบทนี้) คืออัตราการเป็นหัวหน้าของคุณ 100% คาดว่าจะลดลงเหลือ 150/200 = 75% (เช่นไปทางค่าเฉลี่ย 50%) เมื่อคุณจบเกม


1
@whuber นี่ไม่ใช่ตัวอย่างความสูงของพ่อและลูกหลาน แต่ฉันขอยืนยันว่ามันเป็นไปตามคำนิยามของวิกิพีเดีย: "การถดถอย (หรือไป) ค่าเฉลี่ยเป็นปรากฏการณ์ที่ถ้าตัวแปร [เช่นหัวเศษส่วนในการโยนเหรียญ] คือ สุดขีดในการวัดครั้งแรกมันจะมีแนวโน้มที่จะใกล้เคียงกับค่าเฉลี่ยในการวัดครั้งที่สองของมัน "
Adrian

3
ระวังด้วย Wikipedia: ภาษาเบื้องต้นนั้นมีจุดประสงค์เพื่อให้แนวคิดฮิวริสติกบางอย่าง แต่ไม่ค่อยมีคำจำกัดความ ที่จริงแล้วคำพูดของคุณไม่ใช่คำจำกัดความ (เพราะมันไม่ได้ระบุว่า "สุดขีด" หมายถึงอะไร) และไม่ถูกต้องภายใต้การตีความส่วนใหญ่ ยกตัวอย่างเช่นสำหรับตัวแปรสุ่มใด ๆ อย่างต่อเนื่องมีตรงโอกาสที่สองของทั้งสองการทดลองอิสระคือเพิ่มเติมจากค่าเฉลี่ยกว่าครั้งแรก 1/2
whuber

1
ฉันคิดว่าการให้คำอธิบายที่ชัดเจนเกี่ยวกับการเข้าใจผิดของนักการพนันและการถดถอยต่อค่าเฉลี่ยอาจมีความสำคัญมากกว่าการเสนอตัวอย่าง เมื่อมีเพียงตัวอย่างเท่านั้นยังไม่ชัดเจนว่าควรเข้าใจหรือเกี่ยวข้องกับสองวิชานี้อย่างไร
whuber

1
ในฐานะที่เป็นคนที่คิดคล้าย ๆ กับ OP ย่อหน้าที่สองของคุณเป็นเพียงตัวอย่างเดียวในคำตอบทั้งหมดที่อธิบายอย่างชัดเจนว่าความแตกต่างคืออะไร ตอนนี้มันสมเหตุสมผลมากขึ้น
Izkata

1
@whuber นั่นคือสิ่งที่คำตอบอื่น ๆ ส่วนใหญ่กำลังทำอยู่และพวกเขาก็ไม่ได้บอกให้ฉันรู้
Izkata

2

ฉันอาจจะผิด แต่ฉันคิดเสมอว่าความแตกต่างอยู่ในสมมติฐานของความเป็นอิสระ

ในการเข้าใจผิดของนักการพนันปัญหาคือความเข้าใจผิดของความเป็นอิสระ แน่นอนกว่าการโยนเหรียญ N จำนวนมากคุณจะอยู่ที่ประมาณ 50-50 แยก แต่ถ้าบังเอิญคุณไม่คิดว่าการโยน T ครั้งต่อไปของคุณจะช่วยได้แม้อัตราต่อรองจะผิดเพราะมีการโยนเหรียญแต่ละครั้งเป็นอิสระจาก ก่อนหน้า.

การถดถอยไปสู่ค่าเฉลี่ยคือสิ่งที่ฉันเห็นมันใช้ความคิดบางอย่างที่ดึงขึ้นอยู่กับการดึงครั้งก่อนหรือค่าเฉลี่ย / ค่าที่คำนวณก่อนหน้า ตัวอย่างเช่นให้ใช้เปอร์เซ็นต์การยิงของ NBA หากผู้เล่น A ทำคะแนนโดยเฉลี่ย 40% ของการยิงระหว่างอาชีพของเขาและเริ่มต้นปีใหม่ด้วยการยิง 70% ใน 5 เกมแรกของเขามันสมเหตุสมผลที่จะคิดว่าเขาจะถอยหลังไปสู่ค่าเฉลี่ยของอาชีพของเขา มีปัจจัยตามที่สามารถและจะมีอิทธิพลต่อการเล่นของเขา: ลายเส้นร้อน / เย็น, การเล่นเป็นเพื่อนร่วมทีม, ความเชื่อมั่นและข้อเท็จจริงที่ง่าย ๆ ว่าถ้าเขาต้องการรักษา 70% การยิงในปีนี้เขาจะทำลายสถิติ (ภายใต้ความสามารถในการแสดงปัจจุบันของผู้เล่นบาสเก็ตบอลมืออาชีพ) ในขณะที่คุณเล่นเกมมากขึ้นเปอร์เซ็นต์การยิงของคุณมีแนวโน้มว่าจะลดลงใกล้เคียงกับค่าเฉลี่ยในอาชีพของคุณ


คำอธิบายของคุณเกี่ยวกับการถดถอยหมายถึงฟังดูเหมือนตัวประมาณการหดตัว คุณสามารถให้คำจำกัดความเฉพาะของสิ่งที่คุณหมายถึงจริงโดย "ถดถอย"?
whuber

ฉันติดตามแนวคิดของ "ปรากฏการณ์นี้เกิดขึ้นเพราะคะแนนนักเรียนถูกกำหนดโดยความสามารถและส่วนหนึ่งโดยบังเอิญ" จากวิกิพีเดีย ความเข้าใจของฉันคือในขณะที่มีระดับของความน่าจะเป็นผลที่ได้รับการขับเคลื่อนด้วยความสามารถพื้นฐานบางอย่าง
Marsenau

2
ขอบคุณสำหรับการชี้แจง ไม่ชัดเจนว่าแนวคิดนั้นนำไปใช้กับความคิดที่ว่าเมื่ออาชีพของเราก้าวหน้าขึ้นค่าเฉลี่ยของคน ๆ นั้นจะเข้าใกล้ค่าเฉลี่ยของอาชีพมากขึ้น นั่นฟังดูเป็นเหมือนการพูดซ้ำซากหรือมีกฎจำนวนมาก ในความเป็นจริงมันฟังดูน่ากลัวเหมือนกับการเข้าใจผิดของนักพนันเอง!
whuber

1
หรือค่าเฉลี่ยอาชีพของคุณจะเพิ่มขึ้นเพื่อตอบสนองความสามารถใหม่ของคุณ :) ฉันคิดว่ามันเป็นความผิดพลาดในการโคลนน้ำด้วยทักษะที่แก้ไขไม่ได้
Erik

1
"ความเข้าใจผิดเกี่ยวกับความเป็นอิสระ" - นี่ดูเหมือนจะเป็นจุดวิกฤติ การถดถอยของค่าเฉลี่ยปรากฏขึ้นเพื่อให้กิจกรรมอิสระขึ้นอยู่กับ
icc97

2

กุญแจสำคัญคือเราไม่มีข้อมูลใด ๆ ที่จะช่วยเราในการจัดงานครั้งต่อไป (การเข้าใจผิดของนักพนัน) เพราะเหตุการณ์ต่อไปไม่ได้ขึ้นอยู่กับเหตุการณ์ก่อนหน้านี้ เราสามารถคาดเดาได้อย่างสมเหตุสมผลว่าชุดการทดลองจะเป็นอย่างไร การคาดเดาที่สมเหตุสมผลนี้คือค่าเฉลี่ยหรือที่รู้จักกันว่าผลลัพธ์เฉลี่ยที่เราคาดหวัง ดังนั้นเมื่อเราดูการเบี่ยงเบนในแนวโน้มค่าเฉลี่ยกลับไปสู่ค่าเฉลี่ยเมื่อเวลาผ่านไป / การทดลองเราจะเห็นการถดถอยของค่าเฉลี่ย

ในขณะที่คุณสามารถเห็นการถดถอยของค่าเฉลี่ยเป็นชุดของการกระทำที่สังเกตได้มันไม่ใช่ตัวทำนาย เมื่อมีการทดลองมากขึ้นสิ่งต่าง ๆ จะใกล้เคียงกับการแจกแจงแบบเกาส์ / เกาส์มากกว่าปกติ ซึ่งหมายความว่าฉันไม่ได้ตั้งสมมติฐานหรือคาดเดาว่าผลลัพธ์ต่อไปจะเป็นอย่างไร การใช้กฎจำนวนมากฉันสามารถสร้างทฤษฎีขึ้นมาได้ว่าแม้สิ่งต่าง ๆ จะได้รับความนิยมในปัจจุบัน แต่เมื่อเวลาผ่านไปสิ่งต่าง ๆ ก็จะสมดุลกัน เมื่อพวกเขาสมดุลตัวเองออกมาชุดผลลัพธ์ได้ถดถอยไปถึงค่าเฉลี่ย โปรดทราบว่าเราไม่ได้บอกว่าการทดลองในอนาคตนั้นขึ้นอยู่กับผลลัพธ์ที่ผ่านมา ฉันแค่สังเกตการเปลี่ยนแปลงในความสมดุลของข้อมูล

การเข้าใจผิดของนักพนันในขณะที่ฉันเข้าใจว่ามันเป็นเป้าหมายในทันทีและมุ่งเน้นไปที่การทำนายเหตุการณ์ในอนาคต ติดตามสิ่งที่นักการพนันต้องการ โดยทั่วไปแล้วเกมแห่งโอกาสถูกเอียงต่อนักการพนันในระยะยาวดังนั้นนักพนันต้องการทราบว่าการทดลองครั้งต่อไปจะเป็นอย่างไรเพราะพวกเขาต้องการใช้ประโยชน์จากความรู้นี้ สิ่งนี้นำไปสู่การที่นักการพนันจะคิดผิด ๆ ว่าการทดลองครั้งต่อไปขึ้นอยู่กับการทดลองครั้งก่อน สิ่งนี้สามารถนำไปสู่ทางเลือกที่เป็นกลางเช่น:

ห้าครั้งสุดท้ายของวงล้อรูเล็ตตกลงบนพื้นสีดำดังนั้นครั้งต่อไปที่ฉันวางเดิมพันสีแดง

หรือตัวเลือกสามารถให้บริการตนเอง:

ฉันได้บ้านทั้งหลังในมือ 5 หลังดังนั้นฉันจะเดิมพันใหญ่เพราะฉันอยู่ในช่วงที่ชนะและแพ้ไม่ได้


ดังนั้นตามที่คุณเห็นมีความแตกต่างที่สำคัญ:

  1. การถดถอยของค่าเฉลี่ยนั้นไม่ถือว่าการทดลองอิสระนั้นขึ้นอยู่กับการเข้าใจผิดของนักพนัน

  2. การถดถอยของค่าเฉลี่ยจะถูกนำไปใช้กับข้อมูลจำนวนมาก / การทดลองซึ่งการเข้าใจผิดของนักการพนันเกี่ยวข้องกับการทดลองครั้งต่อไป

  3. การถดถอยหมายถึงสิ่งที่เกิดขึ้นแล้ว นักการพนันผิดพยายามที่จะทำนายอนาคตตามค่าเฉลี่ยที่คาดหวังและผลลัพธ์ที่ผ่านมา


1
ที่จริงฉันไม่คิดว่าการถดถอยของค่าเฉลี่ยนั้นเกี่ยวข้องกับกฎจำนวนมากหรือว่ามันหมายถึงสิ่งที่คุณพูดในประโยคแรก
อะมีบาพูดว่า Reinstate Monica

@ amoeba ดังนั้นถ้าเราวางแผนที่จะพลิกเหรียญ 100 ครั้งและ 20 ครั้งในการทดลองเรามี 20 หัว ในตอนท้ายของการทดลองเรามี 55 หัว ฉันพยายามจะบอกว่านี่เป็นตัวอย่างของ "การถดถอยของค่าเฉลี่ย" มันเริ่มจากด้านลอปเปอร์ แต่เมื่อเวลาผ่านไปมันกลับสู่มาตรฐาน กฎของตัวเลขจำนวนมากเป็นอีกวิธีหนึ่งในการแสดงความคิดเห็นว่าสิ่งต่าง ๆ จะเฉลี่ยมากกว่าการทดลองมากพอซึ่งก็เหมือนกับการบอกว่าความไม่สมดุลเริ่มต้นจะทำให้เกิดความสมดุลในช่วงเวลาหนึ่งหรือถอยหลังไปสู่ค่าเฉลี่ย
Erik

1
ฉันเดาว่าฉันเริ่มเข้าใจประเด็นสำคัญเหล่านั้นด้วยกุญแจของคุณเอริค สวย! :) xxx
Luis P.

2

นักเรียนที่มีผลการเรียนดีกว่าซึ่งทำคะแนนได้แย่กว่าในคนขี้โกง

คำถามนี้ได้รับการแก้ไขมากมายตั้งแต่คำตอบสุดท้ายหกข้อ

คำถามที่แก้ไขมีตัวอย่างของการถดถอยกับค่าเฉลี่ยในบริบทของคะแนนนักเรียนใน 100คำถามการทดสอบจริงเท็จและทดสอบซ้ำสำหรับนักแสดงชั้นนำในการทดสอบที่เทียบเท่า การสอบซ้ำแสดงคะแนนเฉลี่ยที่สูงขึ้นอย่างมากสำหรับกลุ่มนักแสดงชั้นนำในการทดสอบครั้งแรก เกิดอะไรขึ้น? นักเรียนโกงครั้งแรกหรือไม่ ไม่มันเป็นสิ่งสำคัญที่จะต้องควบคุมการถดถอยของค่าเฉลี่ย ประสิทธิภาพการทดสอบสำหรับการทดสอบแบบปรนัยเป็นการรวมกันของโชคในการคาดเดาและความสามารถ / ความรู้ คะแนนบางส่วนของนักแสดงชั้นนำเป็นเพราะโชคดีซึ่งไม่จำเป็นต้องทำซ้ำในครั้งที่สอง

หรือพวกเขาควรอยู่ห่างจากวงล้อรูเล็ต?

Let's first assume that no skill at all was involved, that the student's were just flipping (fair) coins to determine their answers. What's the expected score? Well, each answer has independently a 50% chance of being the correct one, so we expect 50% of 100 or a score of 50.

But, that's an expected value. Some will do better merely by chance. The probability of scoring at least 60% correctly according to the binomial distribution is approximately 2.8%. So, in a group of 3000 students, the expected number of students to get a grade of 60 or better is 85.

Now let's assume indeed there were 85 students with a score of 60% or better and retest them. What's the expected score on retest under the same coin-flipping method? Its still 50% of 100! What's the probability that a student being retested in this manner will score above 60%? It's still 2.8%! So we should expect only 2 of the 85 (2.8%85) to score at least 60% on retest.

Under this setup it is a fallacy to assume an expected score on retest different from the expected score on the first test -- they are both 50% of 100. The gambler's fallacy would be to assume that the good luck of the high scoring students is more likely to be balanced out by bad luck on retest. Under this fallacy, you'd bet on the expected retest scores to be below 50. The hot-handed fallacy (here) would be to assume that the good luck of the high scoring students is more likely to continue and bet on the expected retest scores to be above 50.

Lucky coins and lucky flips

Reality is a bit more complicated. Let's update our model. First, it doesn't matter what the actual answers are if we are just flipping coins, so let's just score by number of heads. So far, the model is equivalent. Now let's assume 1000 coins are biased to be heads with probability of 55% (good coins G), 1000 coins are biased to be heads with probability of 45% (bad coins B), and 1000 have equal probability of being heads or tails (fair coins F) and randomly distribute these. This is analogous to assuming higher and lower ability/knowledge under the test taking example, but it is easier to reason correctly about inanimate objects.

The expected score is (551000+451000+501000)/3000=50 for any student given the random distribution. So, the expected score for the first test has not changed. Now, the probability of scoring at least 60% correctly, again using the binomial distribution is 18.3% for good coins, 0.2% for bad coins, and of course 2.8% still for the fair coins. The probability of scoring at least 60% is, since an equal number of each type of coin was randomly distributed, the average of these, or 7.1%. The expected number of students scoring at least 60% correctly is 21.

Now, if we do indeed have 21 scoring at least 60% correctly under this setup of biased coins, what's the expected score on retest? Not 50% of 100 anymore! Now you can work it out with Bayes theorem, but since we used equal size groups the probability of having a type of coin given a outcome is (here) proportional to the probability of the outcome given the type of coin. In other words, there is a 86%=18.3%/(18.3%+0.2%+2.8%) chance that those scoring at least 60% had a good coin, 1%=0.2%/(18.3%+0.2%+2.8%) had a bad coin, and 13% had a fair coin. The expected value of scores on retest is therefore 86%55+1%45+13%50=54.25 out of 100. This is lower than actual scores of the first round, at least 60, but higher than the expected value of scores before the first round, 50.

So even when some coins are better than others, randomness in the coin flips means that selecting the top performers from a test will still exhibit some regression to the mean in a retest. In this modified model, hot-handedness is no longer an outright fallacy -- scoring better in the first round does mean a higher probability of having a good coin! However, gambler's fallacy is still a fallacy -- those who experienced good luck cannot be expected to be compensated with bad luck on retest.


I've just got an idea. I'm gonna simulate that model and see how it works.
Luis P.

1

They are saying the same thing. You were mostly confused because no single experiment in the coin flip example has extreme result (H/T 50/50). Change it to "flipping ten fair coins at the same time in every experiment", and gamblers want to get all of them right. Then an extreme measurement would be that you happen to see all of them are heads.

Gambler fallacy: Treat each gamble outcome (coin flipping result) as IID. If you already know the distribution those IID shares, then the next prediction should come directly from the known distribution and has nothing to do with historical (or future) results (aka other IID).

Regression to the mean: Treat each test outcome as IID (since the student is assumed to be guessing randomly and have no real skill). If you already know the distribution those IID shares, then the next prediction comes directly from the known distribution and has nothing to do with historical (or future) results (aka other IID) (exactly as before up to here). But, by CLT, if you observed extreme values in one measurement (e.g by chance you were only sampling the top 10% students from the first test), you should know the result from your next observation/measurement will still be generated from the known distribution (and thus more likely to be closer to the mean than staying at the extreme).

So fundamentally, they both say the next measurement will come from the distribution instead of past results.


This is not a correct citation of the central limit theorem. It is merely a statement of what an independent event is.
AdamO

0

Let X and Y be two i.i.d. uniform random variables on [0,1]. Suppose we observe them one after another.

Gambler's Fallacy: P( Y | X ) != P( Y ) This is, of course, nonsense because X and Y are independent.

Regression to the mean: P( Y < X | X = 1) != P( Y < X ) This is true: LHS is 1, LHS < 1


0

Thanks your answers I think I could understand the difference between the Regression to the mean and Gambler's fallacy. Even more, I built a database to help me illustrate in the "real" case.

I built this situation: I collected 1000 students and I put them to do a test randomly answering questions .

The test score ranges from 01 to 05. As they are randomly answering questions, so each score has a 20% chance of being achieved. So for the first test the number of students with a score 05 should be something close to 200

(1.1) 10000,20

(1.2) 200

I Had 196 students with score 05 which is very close to the expected 200 students.

So I put those 196 students repeat the test is exepected 39 students with score 05.

(2.1) 1960,20

(2.2) 39

Well, according to the result I got 42 students which is within the expected.

For those who got score 05 I put them to repeat the test and so and forth...

Therefore, the expected numbers were:

Expected RETEST 03

(3.1) 420,20

(3.2) 8

(3.3) Outcomes (8)

Expected RETEST 04

(4.1) 80,20

(4.2) 1,2

(4.3) Outcomes (2)

Expected RETEST 05

(4.1) 20,20

(4.2) 0,1

(4.3) Outcomes (0)

If I'm expecting for a student who gets score 05 four times I shall to face the probability of 0,204, i.e, 1,2 student per 1000. However If I expect for a student who gets score 05 five times I should have at least 3.500 samples in order to get 1,12 student with score 05 in all tests

(5.1.) 0,205=0,00032

(5.2.) 0,000323500=1.2

Therefore the probability of the one student gets score 05 in the all 05 tests has nothing to do with his last score, I mean, I must not calculate the probability on the each test singly. I must look for those 05 tests like one event and calculate the probability for that event.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.