ความน่าจะเป็นของเหตุการณ์ในอนาคตเดียวในชีวิตจริง: หมายความว่าอย่างไรเมื่อพวกเขาพูดว่า“ ฮิลลารีมีโอกาสชนะ 75%”


79

เนื่องจากการเลือกตั้งเป็นเหตุการณ์ครั้งเดียวจึงไม่ใช่การทดลองที่สามารถทำซ้ำได้ ดังนั้นคำว่า "ฮิลลารีมีโอกาสชนะ 75%" ในทางเทคนิคหมายความว่าอะไร? ฉันกำลังมองหาความหมายที่ถูกต้องทางสถิติไม่ใช่สิ่งที่เข้าใจง่ายหรือเป็นแนวคิด

ฉันเป็นแฟนสถิติมือสมัครเล่นที่พยายามตอบคำถามนี้ที่เกิดขึ้นในการสนทนา ฉันค่อนข้างมั่นใจว่ามีการตอบสนองตามวัตถุประสงค์ที่ดี แต่ฉันไม่สามารถทำได้ด้วยตัวเอง ...


4
เนื่องจากการสำรวจไม่ได้ทำการประมาณความน่าจะเป็นและไม่มีบริบทเพิ่มเติมดูเหมือนว่าข้อความดังกล่าวจะขึ้นอยู่กับผลลัพธ์ปัจจุบันจากตลาดที่คาดการณ์เช่นตลาดอิเล็กทรอนิกส์ของรัฐไอโอวา (ดูtippie.uiowa.edu/iem ) ดูหน้าวิธีการของพวกเขาหรือเอกสารใด ๆ มากมายเกี่ยวกับตลาดทำนายสำหรับคำอธิบายที่ลึกกว่า
Mike Hunter

13
ประเด็นสำคัญคือเราสามารถแนบความน่าจะเป็นกับเหตุการณ์ที่ไม่ซ้ำกัน (เช่นครั้งเดียว) ซึ่งเราไม่สามารถใช้ความน่าจะเป็นเชิงประจักษ์ในลักษณะของ "ถ้าฉันหมุนตัวตายอย่างยุติธรรมหลายครั้งสัดส่วนของจำนวนครั้งที่ฉัน ม้วนหกจะเข้าใกล้หนึ่งในหก " แต่มีข้อโต้แย้งว่าระดับความเชื่อทางอัตวิสัยยังคงควรปฏิบัติในทางปฏิบัติเช่น "ความน่าจะเป็น" - ทางเทคนิคควรเชื่อฟังหลักการของความน่าจะเป็น ดังนั้นวิธีการปรัชญาคำถามนี้อาจทำให้การอ้างอิงถึงสิ่งที่เรียกว่าอาร์กิวเมนต์ดัตช์หนังสือ
Silverfish

19
75% ของสิ่งต่าง ๆ ที่มีโอกาสเกิดขึ้น 75% จะเกิดขึ้น
immibis

2
ขึ้นอยู่กับแหล่งที่มาของข้อความ ในบางกรณีมันหมายถึงความน่าจะเป็นภายใต้แบบจำลองตัวอย่างเช่น (เช่นเดียวกับการประเมินความน่าจะเป็นที่ fivethirtyeight.com) แต่ในกรณีอื่น ๆ มันเกี่ยวข้องกับบริบทอื่น ๆ มันอาจหมายถึงอย่างอื่น
Glen_b

3
ฉันได้อ่านจากนั้นจากผลสำรวจของคลินตันคาดว่าจะชนะ แต่ช่วงความเชื่อมั่นของตัวเลขนั้นมีโอกาส 25% ที่ผลลัพธ์จริงจะไม่เหมือนกับผลลัพธ์ที่คาดไว้
JimmyB

คำตอบ:


60

คำตอบทั้งหมดที่ให้ไว้มีประโยชน์ แต่พวกเขาไม่ค่อยแม่นยำทางสถิติดังนั้นฉันจะลองดู ในขณะเดียวกันฉันจะให้คำตอบทั่วไปแทนที่จะมุ่งเน้นไปที่การเลือกตั้งครั้งนี้

สิ่งแรกที่ต้องจำไว้เมื่อเราพยายามตอบคำถามเกี่ยวกับเหตุการณ์ในโลกแห่งความเป็นจริงเช่นคลินตันชนะการเลือกตั้งซึ่งตรงข้ามกับปัญหาทางคณิตศาสตร์ที่เกิดขึ้นเช่นการเอาลูกบอลหลากสีออกมาจากโกศนั่นก็คือ วิธีที่ไม่ซ้ำกันในการตอบคำถามและไม่ใช่คำตอบที่สมเหตุสมผล หากใครบางคนบอกว่า "ฮิลลารีมีโอกาสชนะ 75%" และไม่อธิบายรูปแบบการเลือกตั้งข้อมูลที่พวกเขาใช้ในการประมาณการผลการตรวจสอบความถูกต้องของโมเดลผลการตรวจสอบสมมติฐานของพวกเขา หมายถึงการโหวตที่ได้รับความนิยมหรือการโหวตจากการเลือกตั้ง ฯลฯ จากนั้นพวกเขาไม่ได้บอกคุณจริงๆว่าพวกเขาหมายถึงอะไรมีข้อมูลน้อยมากพอให้คุณประเมินว่าการทำนายของพวกเขาดีหรือไม่ นอกจากนี้มันไม่ได้

ดังนั้นขั้นตอนที่นักสถิติอาจใช้ในการประเมินโอกาสของคลินตันคืออะไร? แท้จริงแล้วพวกเขาจะแก้ไขปัญหาอย่างไร ในระดับสูงมีความน่าจะเป็นต่าง ๆ ของตัวเองสองสิ่งที่สำคัญที่สุดซึ่งเป็นประจำและ Bayesian

  • X1,X2,X1,X2,,Xnn

  • ในมุมมองแบบเบย์ความน่าจะเป็นหมายถึงระดับของความเชื่อมั่นหรือความน่าเชื่อถือ (ซึ่งอาจจะใช่หรือไม่ใช่ความเชื่อที่แท้จริงหรือไม่ก็ได้ขึ้นอยู่กับว่าคุณเป็นผู้นับถือนิกายเบส์) โอกาส 75% ที่จะได้รับชัยชนะคลินตันหมายความว่าเธอจะชนะ 75% ที่น่าเชื่อถือ ในทางกลับกันความน่าเชื่อถือสามารถเลือกได้อย่างอิสระ (ขึ้นอยู่กับรูปแบบของความเชื่อที่มีอยู่ก่อนหน้าหรือของนักวิเคราะห์) ภายใต้ข้อ จำกัด ของกฎพื้นฐานของความน่าจะเป็น (เช่นทฤษฎีบทของ Bayesและความจริงที่ว่าความน่าจะเป็น เหตุการณ์ส่วนประกอบ) วิธีหนึ่งในการสรุปกฎหมายเหล่านี้คือถ้าคุณเดิมพันผลการแข่งขันเสนอราคาให้แก่นักการพนันตามความน่าเชื่อถือของคุณดังนั้นนักพนันไม่สามารถสร้างหนังสือภาษาดัตช์ได้กับคุณนั่นคือชุดของการเดิมพันที่รับประกันว่าคุณจะเสียเงินไม่ว่าเหตุการณ์จะเกิดขึ้นจริง

ไม่ว่าคุณจะดูความน่าจะเป็นแบบประจำหรือแบบเบย์ก็ยังมีการตัดสินใจมากมายเกี่ยวกับวิธีการวิเคราะห์ข้อมูลและประเมินความน่าจะเป็น อาจเป็นวิธีที่ได้รับความนิยมมากที่สุดคือแบบจำลองการถดถอยแบบพารามิเตอร์เช่นการถดถอยเชิงเส้น ในการตั้งค่านี้นักวิเคราะห์จะเลือกตระกูลการแจกแจงตัวแปร (นั่นคือการวัดความน่าจะเป็น ) ซึ่งจัดทำดัชนีโดยเวกเตอร์ของตัวเลขที่เรียกว่าพารามิเตอร์ ผลลัพธ์แต่ละรายการเป็นตัวแปรสุ่มอิสระที่ดึงมาจากการกระจายนี้เปลี่ยนไปตามตัวแปรที่มีค่าที่ทราบ (เช่นอัตราการว่างงาน) ที่นักวิเคราะห์ต้องการใช้เพื่อทำนายผลลัพธ์ นักวิเคราะห์เลือกประมาณการค่าพารามิเตอร์โดยใช้ข้อมูลและเกณฑ์ของโมเดลที่เหมาะสมเช่นกำลังสองน้อยที่สุดหรือโอกาสสูงสุด การใช้การประมาณเหล่านี้แบบจำลองสามารถสร้างการทำนายผล (อาจเป็นเพียงค่าเดียวอาจเป็นช่วงเวลาหรือค่าชุดอื่น ๆ ) สำหรับค่าที่กำหนดของ covariates โดยเฉพาะอย่างยิ่งสามารถทำนายผลการเลือกตั้งได้ นอกเหนือจากตัวแบบพารามิเตอร์มีตัวแบบที่ไม่ใช่พารามิเตอร์ (นั่นคือแบบจำลองที่กำหนดโดยตระกูลการแจกแจงที่มีการทำดัชนีด้วยเวกเตอร์พารามิเตอร์ที่มีความยาวไม่สิ้นสุด) และวิธีการตัดสินใจเลือกค่าทำนายที่ไม่ได้ใช้แบบจำลองใด ๆ เช่นลักษณนามที่ใกล้ที่สุดเพื่อนบ้านและป่าสุ่ม

การคาดการณ์เป็นสิ่งหนึ่ง แต่คุณจะรู้ได้อย่างไรว่ามันดีหรือไม่? ท้ายที่สุดการทำนายที่ไม่ถูกต้องอย่างพอเพียงก็แย่กว่าไร้ประโยชน์ การทำนายการทดสอบเป็นส่วนหนึ่งของการฝึกฝนการตรวจสอบแบบจำลองที่มีขนาดใหญ่ขึ้นนั่นคือการวัดปริมาณของแบบจำลองที่กำหนดสำหรับวัตถุประสงค์ที่กำหนด สองวิธียอดนิยมสำหรับการตรวจสอบความถูกต้องของการทำนายคือการตรวจสอบความถูกต้องข้ามและแยกข้อมูลออกเป็นการฝึกอบรมและทดสอบชุดย่อยก่อนที่จะติดตั้งแบบจำลองใด ๆ ในระดับที่การเลือกตั้งที่รวมอยู่ในข้อมูลเป็นตัวแทนของการเลือกตั้งประธานาธิบดีสหรัฐอเมริกาปี 2016 การประมาณการความแม่นยำในการทำนายที่เราได้รับจากการคาดการณ์การตรวจสอบจะแจ้งให้เราทราบว่าการทำนายของเราจะเป็นการเลือกตั้งประธานาธิบดีสหรัฐปี 2559 แม่นยำเพียงใด


ฉันชอบคำตอบนี้มากชี้ให้เห็นว่ามีสองมุมมองร่วมกันคือสิ่งที่ฉันคาดหวังที่จะเห็น ฉันคิดว่าจะมีน้อยกว่านี้
Mike Wise

4
มีคำตอบสั้น ๆ อยู่สองสามข้อ ฉันต้องการที่จะลองอีกครั้งโดยสมบูรณ์
Kodiologist

7
ฉันไม่คิดว่ามุมมองที่พบบ่อยเป็นที่เชื่อถือได้ เหตุการณ์เช่นการเลือกตั้งไม่ได้เกิดจากการสุ่ม หากคุณทำซ้ำการเลือกตั้งหลายล้านครั้งภายใต้เงื่อนไขเดียวกันทุกประการคุณจะได้รับผลลัพธ์เหมือนกันล้านครั้ง เราเพียงแค่นำแบบสุ่มเข้าสู่แบบจำลองของเราเพื่อชดเชยความรู้ที่ไม่สมบูรณ์ของเงื่อนไข
Stefan

6
นั่นเป็นปัญหาที่ไม่มีข้อโต้แย้งในปรัชญาของสถิติ มุมมองของฉันเองคือไม่มีแบบจำลองจริง แต่บางรุ่นมีประโยชน์มากกว่าคนอื่น ๆ
ประสาทวิทยา

32

เมื่อนักสถิติต้องการทำนายผลลัพธ์แบบไบนารี (ฮิลลารีชนะและฮิลลารีไม่ชนะ) พวกเขาจินตนาการว่าเอกภพกำลังโยนเหรียญในจินตนาการ - หัวฮิลลารีชนะ หางเธอสูญเสีย สำหรับนักสถิติบางคนเหรียญแสดงถึงระดับความเชื่อในผลลัพธ์ เหรียญอื่น ๆ แสดงถึงสิ่งที่อาจเกิดขึ้นหากเราเรียกการเลือกตั้งในสถานการณ์เดียวกันซ้ำไปซ้ำมา การพูดเชิงปรัชญามันยากที่จะรู้ว่าเราหมายถึงอะไรเมื่อเราพูดถึงเหตุการณ์ในอนาคตที่ไม่แน่นอนแม้กระทั่งก่อนที่เราจะลากตัวเลขลงไป แต่เราสามารถดูว่ามาจากไหน

ณ จุดนี้ในการเลือกตั้งเรามีลำดับของแบบสำรวจความคิดเห็น แบบฟอร์มเหล่านี้: มีคน 1,000 คนที่สำรวจความคิดเห็นในรัฐโอไฮโอ รองรับทรัมป์ 40%, 39% รองรับฮิลลารีและ 21% ไม่มีความแน่นอน จะมีการสำรวจความคิดเห็นที่คล้ายกันจากการเลือกตั้งครั้งก่อน ๆ สำหรับผู้สมัครพรรคเดโมแครตพรรครีพับลิกัน สำหรับปีก่อนหน้านั้นก็มีผลลัพธ์เช่นกัน คุณอาจรู้ว่าผู้สมัครที่โหวต 40% ในการสำรวจความคิดเห็นในเดือนกรกฎาคมชนะ 8 จากการเลือกตั้ง 10 ครั้งก่อนหน้า หรือผลลัพธ์อาจบอกว่าในการเลือกตั้ง 7 ครั้งจากทั้งหมด 10 ครั้งพรรคเดโมแครตเข้ามาในรัฐโอไฮโอ คุณอาจรู้ว่ารัฐโอไฮโอเปรียบเทียบกับรัฐเท็กซัสอย่างไร (บางทีพวกเขาไม่เคยเลือกผู้สมัครคนเดียวกัน) - คุณอาจมีข้อมูลเกี่ยวกับวิธีการลงคะแนนเสียงแบบไม่มีการแบ่งแยก - และคุณอาจมีโมเดลที่น่าสนใจว่าเกิดอะไรขึ้นเมื่อผู้สมัครเริ่ม

ดังนั้นเมื่อคุณคำนึงถึงการเลือกตั้งครั้งก่อนคุณสามารถพูดได้ว่าเหรียญเลือกตั้งได้ถูกโยนทิ้งไปหลายครั้งแล้ว การเลือกตั้งครั้งเดียวกันไม่ได้มีการดำเนินการซ้ำทุก 4 ปี แต่เราสามารถทำเป็นว่ามันเป็น จากข้อมูลทั้งหมดนี้ผู้สำรวจจะสร้างแบบจำลองที่ซับซ้อนเพื่อทำนายผลลัพธ์สำหรับปีนี้

โอกาส 75% ในการชนะของฮิลลารีนั้นสัมพันธ์กับสถานะของความรู้ของเรา "วันนี้" มันบอกว่าผู้สมัครที่มีผลการสำรวจความคิดเห็นที่เธอมี "ตอนนี้" ในรัฐที่เธอมีพวกเขาและได้รับแนวโน้มในการสำรวจของเธอตลอดการรณรงค์ชนะการเลือกตั้งใน 3 ปีเลือกตั้งจาก 4 เดือนจาก ตอนนี้ความน่าจะเป็นในการชนะของเธอจะเปลี่ยนไปเนื่องจากโมเดลจะอิงตามสถานะของการสำรวจในเดือนสิงหาคม

สหรัฐอเมริกาไม่ได้มีการเลือกตั้งจำนวนมากในประวัติศาสตร์ของมันน้อยกว่าตั้งแต่เริ่มการเลือกตั้ง เราไม่สามารถมั่นใจได้ว่าแนวโน้มการโพลจากการพูดยุค 70 ยังคงใช้อยู่ ดังนั้นมันจึงหลบไปหน่อย

บรรทัดล่างคือว่าฮิลลารีควรเริ่มทำงานเกี่ยวกับคำปราศรัยการเข้ารับตำแหน่งของเธอ


1
เธอยังคงมีคำพูดตอบรับการเสนอชื่อเพื่อให้ผ่านก่อน
WBT

26

เมื่อนักสถิติกล่าวว่าพวกเขาไม่ได้หมายถึงระยะขอบแห่งชัยชนะหรือส่วนแบ่งของการโหวต พวกเขากำลังจำลองสถานการณ์การเลือกตั้งจำนวนมากและนับว่าผู้ลงคะแนนเสียงแต่ละคนได้รับเปอร์เซ็นต์การโหวตเท่าใด สำหรับโมเดลประธานาธิบดีที่แข็งแกร่งจำนวนมากพวกเขามีการคาดการณ์สำหรับแต่ละรัฐ บางตัวใกล้กันและหากการแข่งขันถูกเรียกใช้หลายครั้งผู้สมัครทั้งสองสามารถชนะ เนื่องจากช่วงเวลาการทำนายหลายครั้งทับซ้อนกับขอบแห่งชัยชนะเป็น 0 จึงไม่ใช่การตอบกลับแบบไบนารี แต่การจำลองจะบอกเราอย่างแม่นยำยิ่งขึ้นถึงสิ่งที่คาดหวัง

หน้าวิธีการของ FiveThirtyEight อาจช่วยทำความเข้าใจเพิ่มเติมสิ่งที่อยู่ภายใต้ประทุน: http://fivethirtyeight.com/features/a-users-guide-to-fivethirtyeights-2016-general-election-forecast/


17

มีตอนหนึ่งของวิทยุเสรีที่เกี่ยวข้องกับคำถามนี้มาก (โดยทั่วไปไม่ใช่เฉพาะการเลือกตั้ง) ในนั้นสตีเฟ่น Dubner สัมภาษณ์สัมภาษณ์นำของโครงการจากหน่วยงานป้องกันประเทศสหรัฐอเมริกาเพื่อกำหนดวิธีที่ดีที่สุดในการคาดการณ์เหตุการณ์ทางการเมืองทั่วโลก

มันยังช่วยให้รู้เรื่องการเมืองมากกว่าคนส่วนใหญ่ ฉันจะบอกว่าพวกเขาเกือบเงื่อนไขที่จำเป็นสำหรับการทำดี แต่พวกเขาไม่เพียงพอเพราะมีคนจำนวนมากที่ฉลาดและสนิทสนม มีมากมายของคนที่เป็นสมาร์ทมากและคิดว่ามันเป็นไปไม่ได้ที่จะแนบความน่าจะเป็นที่จะมีเหตุการณ์ที่ไม่ซ้ำกัน

แล้วพวกเขาก็หารือเกี่ยวกับสิ่งที่ไม่ได้จะทำอย่างไร

ถ้าคุณถามคำถามประเภทนั้นคนส่วนใหญ่พูดว่า“ คุณจะกำหนดความน่าจะเป็นให้เหตุการณ์ประวัติศาสตร์ที่ไม่เหมือนใครได้อย่างไร?”ดูเหมือนจะไม่มีวิธีใดที่จะทำเช่นนั้น สิ่งที่ดีที่สุดที่เราสามารถทำได้คือใช้การใช้คำฟุ่มเฟือยทำให้การคาดการณ์ที่คลุมเครือ เราสามารถพูดสิ่งต่าง ๆ เช่น“ เอาละนี่อาจเกิดขึ้น สิ่งนี้อาจเกิดขึ้นได้ สิ่งนี้อาจเกิดขึ้น” และการพูดบางสิ่งบางอย่างอาจเกิดขึ้นไม่ได้พูดมาก

จากนั้นตอนจะเข้าสู่วิธีการที่นักพยากรณ์ที่ประสบความสำเร็จมากที่สุดใช้ประเมินความน่าจะเป็นเหล่านี้

ดังนั้นไม่รู้อะไรเลยเกี่ยวกับเผด็จการแอฟริกันหรือประเทศแม้แต่สมมุติว่าฉันไม่เคยได้ยินเผด็จการนี้ฉันไม่เคยได้ยินเรื่องนี้ประเทศและฉันแค่ดูที่ฐานและฉันพูดว่า "อืมดูเหมือนว่า ประมาณ 87 เปอร์เซ็นต์” นั่นจะเป็นการประมาณการลางสังหรณ์ครั้งแรกของฉัน จากนั้นคำถามก็คือ“ ฉันจะทำยังไงดี?” จากนั้นฉันก็เริ่มเรียนรู้บางอย่างเกี่ยวกับประเทศและเผด็จการ และถ้าฉันได้เรียนรู้ว่าเผด็จการในคำถามที่อายุ 91 ปีและได้สูงมะเร็งต่อมลูกหมากที่ฉันควรปรับความน่าจะเป็นของฉัน และถ้าฉันได้เรียนรู้ว่ามีการจลาจลในเมืองหลวงและมีคำแนะนำเกี่ยวกับการรัฐประหารในทะเลผมอีกครั้งควรปรับความน่าจะเป็นของฉัน แต่การเริ่มต้นด้วยความน่าจะเป็นอัตราฐานเป็นวิธีที่ดีอย่างน้อยที่สุดให้แน่ใจว่าคุณจะอยู่ใน ballpark น่าเชื่อถือในตอนแรก

ตอนนี้มีชื่อว่าHow to Be Less Terrible ที่ทำนายอนาคตและเป็นการฟังที่สนุกมาก ฉันขอแนะนำให้คุณลองดูว่าคุณสนใจเรื่องแบบนี้ไหม!


3
+1 ในโพสต์เก่าฉันร่างวิธีการนี้ด้วยตัวอย่างการทำงาน ฉันมีเป้าหมายที่จะทำในลักษณะที่เป็นกลางเกี่ยวกับการถกเถียงแบบเบส์ vs- บ่อยครั้งซึ่งบ่งชี้ว่าวิธีการแบบเบย์นั้นไม่ใช่วิธีการเดียวในการประมาณความน่าจะเป็นพยากรณ์หรือให้ข้อมูลที่เป็นประโยชน์เกี่ยวกับเหตุการณ์ที่ไม่เหมือนใคร ฉันพยายามระบุความน่าจะเป็นของบทบาทในการวิเคราะห์เช่นนั้นและโดยปริยายเพื่อเน้นถึงความจำเป็นที่จะต้องประเมินความน่าจะเป็นอย่างแม่นยำ (แทนที่จะทำให้พวกเขาเป็นแบบ "ไม่ให้ข้อมูล")
whuber

1
ที่เกี่ยวข้องกับหัวข้อนี้คือการโต้เถียงที่เรียกว่า "มือร้อน" ในกระดาษที่ไม่เหมือนใครเรื่องประหลาดใจที่นักการพนันและมือชักนำล้มเหลว? มิลเลอร์และซานจูโรเสนอหลักฐานที่น่าเชื่อถือว่าวรรณคดีมีความผิดมานานหลายทศวรรษในการปฏิเสธการมีอยู่ของ "มือที่ร้อนแรง" วรรณกรรมประวัติศาสตร์มีพื้นฐานมาจากความน่าจะเป็นแบบไม่มีเงื่อนไขของการทดลอง iid Bernoulli ในขณะที่ความน่าจะเป็นแบบมีเงื่อนไขของลำดับที่ จำกัด ของการทดลองเดียวกันยืนยันว่าสัญชาตญาณมือร้อน ในทำนองเดียวกันสำหรับการเลือกตั้งเราสามารถรักษาการเลือกตั้งครั้งนี้เป็นผลมาจากลำดับของผลลัพธ์ที่น่าจะเป็นไปตามเงื่อนไข
Mike Hunter

15

การเลือกตั้งปี 2559 เป็นเหตุการณ์ที่เกิดขึ้นครั้งเดียว แต่เพื่อพลิกเหรียญหรือโยนของตายเป็น

เมื่อมีคนอ้างว่าพวกเขารู้ว่าผู้สมัครมีโอกาส 75% ที่จะชนะพวกเขาจะไม่ทำนายผล พวกเขาอ้างว่ารู้รูปร่างของคนตาย

ผลลัพธ์ของการเลือกตั้งไม่สามารถทำให้เป็นโมฆะได้ แต่ถ้าแบบจำลองที่พวกเขาใช้เพื่อมาถึง 75% นั้นถูกทดสอบกับการเลือกตั้งจำนวนมากก็อาจแสดงให้เห็นว่ามีค่าการทำนายที่ จำกัด หรืออาจจะเกิดมาเป็นสิ่งมีค่า

แน่นอนว่าเมื่อผู้ทำนายที่มีค่าเป็นที่รู้จักของผู้สมัครพวกเขาสามารถเปลี่ยนพฤติกรรมของพวกเขาและรูปแบบที่สามารถทำให้ไม่เกี่ยวข้อง หรืออาจถูกเป่าจนหมดสัดส่วน แค่ดูว่าเกิดอะไรขึ้นในไอโอวา


7
+1 สำหรับ "พวกเขาอ้างว่ารู้รูปร่างของคนตาย"
WBT

@WBT นั่นไม่ใช่ข้อความที่ผิดทั้งหมด 75% ไม่มีส่วนเกี่ยวข้องกับความน่าจะเป็น (ทางกายภาพ) ที่ (ถูกสันนิษฐานไว้ก่อน) เพื่อควบคุมเหตุการณ์สุ่มเช่นลูกเต๋าม้วน พวกเขาหมายถึงพวกเขามีระดับความแน่นอน 75%
อินนิสฟรี

1
@innisfree คำอุปมายังมีประโยชน์ แม้ว่าฉันจะรับรู้โดยความคิดเห็นของคุณเกี่ยวกับคำตอบอื่น ๆ ที่คุณไม่เห็นด้วย (และคุณยินดีที่จะโพสต์คำตอบอื่น) 75% เป็นคนที่อ้างว่าการกระจายความน่าจะเป็นผลลัพธ์จะเท่ากับของสี่ด้าน (เสี้ยม) ตาย ทั้งสี่ด้านมีป้ายกำกับว่า "ฮิลลารี" คำอุปมาที่ดีขึ้นเล็กน้อยถ้าคุณพิจารณา "รูปร่าง" เพื่อรวมป้ายผนึกด้วย
WBT

6

เมื่อมีคนบอกว่า "ฮิลลารีมีโอกาสชนะ 75%" พวกเขาหมายความว่าหากคุณเสนอการเดิมพันโดยที่คนคนหนึ่งได้รับ 25 ดอลลาร์หากฮิลลารีชนะและอีกคนได้รับ 75 ดอลลาร์หากฮิลลารีไม่ชนะพวกเขาจะพิจารณา เดิมพันที่ยุติธรรมและไม่มีเหตุผลใดที่จะชอบทั้งสองข้าง

เปอร์เซ็นต์เหล่านี้มักมาจากตลาดพยากรณ์ ข้อมูลเหล่านี้สรุปข้อมูลทั้งหมดที่มีอยู่และโดยทั่วไปแล้ววิธีการวิเคราะห์ที่มีประสิทธิภาพสูงกว่าการทำนายเหตุการณ์ส่วนใหญ่

ตลาดทำนายให้ผู้คนมีโอกาสเดิมพันว่าเหตุการณ์นั้นจะเกิดขึ้นหรือไม่ การจ่ายผลตอบแทนถูกกำหนดโดยการเจรจาระหว่างคนทั้งสองด้านของข้อเสนอ โดยทั่วไปผู้ที่มีความรู้พิเศษเกี่ยวกับข้อเสนอจะพยายามใช้ประโยชน์จากความรู้ที่ทำเงินซึ่งมีผลข้างเคียงของการรั่วไหลของข้อมูลนั้น

ตัวอย่างเช่นสมมติว่ามีตลาดทำนายว่าคนดังคนใดจะมีชีวิตอยู่จนถึงสิ้นปีนี้ สาธารณะรู้อายุของผู้มีชื่อเสียงและทุกคนสามารถค้นหาความน่าจะเป็นพื้นฐานที่คนดังจะตายภายในสิ้นปี หากนั่นคือทั้งหมดที่เป็นที่รู้จักกันคุณจะคาดหวังให้ผู้คนเต็มใจที่จะเดิมพันในด้านหนึ่งหรืออีกด้านหนึ่งของข้อเสนอนี้โดยประมาณ

ทีนี้สมมติว่ามีคนรู้ว่าคนดังมีสุขภาพไม่ดี แต่ซ่อนเร้นอยู่ หรือแม้แต่พูดว่าผู้คนจำนวนมากรู้ว่าครอบครัวของคนดังมีประวัติโรคหัวใจที่จะลดอัตราการรอดชีวิต ผู้ที่มีข้อมูลดังกล่าวยินดีที่จะดำเนินการด้านหนึ่งของข้อเสนอดังกล่าวทำให้เกิดการปรับอัตราเช่นเดียวกับผู้ซื้อดันราคาหุ้นขึ้นและผู้ขายดันลง

กล่าวอีกนัยหนึ่งเมื่ออัตราต่อรองต่ำเกินไปผู้ที่มองหากำไรจะผลักดันพวกเขา และเมื่อพวกเขาสูงเกินไปคนที่มองหาผลกำไรผลักพวกเขาลง ในที่สุดราคาของการเดิมพันสะท้อนให้เห็นถึงภูมิปัญญาโดยรวมของทุกคนในอัตราต่อรองของข้อเสนอที่เกิดขึ้นเช่นเดียวกับราคาทั้งหมดสะท้อนให้เห็นถึงภูมิปัญญาโดยรวมในค่าใช้จ่ายและค่าของสิ่งต่าง ๆ


2
เป็นเรื่องน่าเสียดายที่ไม่มีคำตอบอื่นใดที่กล่าวถึงการเดิมพันนี่เป็นคำจำกัดความของความน่าจะเป็น ... ดูเหมือนว่าทุกคนจะลืมมัน
Michael Le Barbier Grünewald

2
@ MichaelGrünewald: ไม่มาก ในขณะที่เป็นไปได้ที่จะมีอัตราต่อรองการพนันที่สะท้อนถึงความน่าจะเป็นจริง (เช่นผู้ที่เกี่ยวข้องกับวงล้อรูเล็ตหรือเกมไพ่) นั่นไม่ใช่สิ่งนี้ การเดิมพันอัตราต่อรองสำหรับผู้ที่จะชนะการเลือกตั้งนั้นคล้ายคลึงกับราคาหุ้น ... โดยพื้นฐานแล้วพวกเขารู้สึกอย่างไร
Robert Harvey

@RobertHarvey ประเด็นก็คือความน่าจะเป็นที่แสดงความเชื่อแบบอัตนัย (คำคาดหวังควรเตือนเราว่า) ใช่ฉันสามารถสร้างแบบจำลองรวมข้อมูลโดยใช้วิธีที่ฉลาดที่สุด แต่ในที่สุดสิ่งที่ฉันสามารถระบุได้คือ“ จากข้อมูลที่มีอยู่ทั้งหมดที่ฉันสามารถเข้าถึงได้ฉันเชื่อว่าอัตราเดิมพันเหล่านี้มีความยุติธรรม” ไม่มีสิ่งเช่น "ความน่าจะเป็นที่แท้จริง" - แคลคูลัสความน่าจะเป็นช่วยให้เราสามารถคำนวณความเชื่อของเราได้ ถ้าคุณไม่สนใจที่จะนิยาม“ ความน่าจะเป็นที่แท้จริง”
Michael Le Barbier Grünewald

@ RobertHarvey คุณสามารถยืนยันว่าทุกอย่างขึ้นอยู่กับความรู้สึกของผู้คน ถ้าฉันโต้แย้งทางคณิตศาสตร์มันเป็นเพราะฉันรู้สึกว่ามันถูกต้อง ผู้คนมีอิสระในการตัดสินใจว่าจะยอมรับข้อเสนอใดสำหรับการเดิมพันด้วยวิธีการใด ๆ ที่พวกเขาต้องการโดยพลการหรือเข้มงวด ในวิธีการทำนายที่ดีมีคนจำนวนมากที่มีข้อมูลที่ผลลัพธ์สุดท้ายบ่งบอกถึงภูมิปัญญาของฝูงชน
David Schwartz

4

คำถามสำคัญคือคุณจะกำหนดความน่าจะเป็นให้กับเหตุการณ์ที่ไม่ซ้ำกันอย่างไรคำตอบคือคุณพัฒนารูปแบบที่ไม่ซ้ำกันอีกต่อไป ฉันคิดว่าตัวอย่างที่ง่ายกว่าคือความน่าจะเป็นที่ประธานาธิบดีจะตายในที่ทำงานคืออะไร คุณอาจมองว่าประธานาธิบดีเป็นบุคคลที่มีอายุเท่าที่กำหนดในฐานะบุคคลที่มีอายุและเพศที่แน่นอน อื่น ๆ ... แต่ละรุ่นให้การทำนายที่แตกต่างกัน ... นิรนัยไม่มีโมเดลที่ถูกต้อง .. มันขึ้นอยู่กับนักสถิติที่จะเลือกรูปแบบที่เหมาะสมที่สุด


1
แม้ว่าฉันจะให้คำตอบที่ยาวกว่าบนเครื่องหมายถูก "ถูก" แต่ฉันก็ชอบสิ่งนี้เช่นกัน การย้ายคำถามไปสู่อัตราต่อรองของประธานาธิบดีกำลังจะตายในที่ทำงาน ขอบคุณทุกคนสำหรับการพิจารณาอย่างรอบคอบของคุณ!
pitosalas

1
มีกรอบ (สถิติแบบเบย์) สำหรับการกำหนดความน่าจะเป็น (ระดับความน่าเชื่อถือ) ให้กับสมมติฐานใด ๆ รวมถึงผลลัพธ์ของเหตุการณ์ที่ไม่ซ้ำกัน
innisfree

3

จากการสำรวจแสดงให้เห็นว่าการแข่งขันแน่นมาก 75% อาจหรืออาจไม่ถูกต้อง

คุณกำลังถามความหมายไม่ใช่พวกเขาคำนวณสิ่งนี้อย่างไร ความหมายก็คือ (ถ้าเราเพิกเฉยต่อใครอื่นนอกจากคลินตันและคู่ปรับตัวสำคัญของเธอ) ที่คุณจะต้องเดิมพัน$ 3 เพื่อรับผลตอบแทน$ 4 ถ้าเธอชนะ อีกทางหนึ่งการเดิมพัน$ 1 ของนักวิ่งคนอื่นจะคืนเงิน $ 4 หากเขาชนะ

คำตอบของฉันสร้างความแตกต่างเล็ก ๆ น้อย ๆ ระหว่างโอกาสที่แท้จริงสำหรับผู้สมัครที่จะชนะและสิ่งที่ผู้คน (นักพนันหรือโอกาส) คาดหวัง ฉันสงสัยว่าเมื่อคุณเห็นตัวเลขเช่นนี้เช่น 75% คุณจะเห็นตัวเลขผู้สร้างโอกาสเมื่อคุณเห็น 49 ถึง 48% คุณจะเห็นผลการสำรวจความคิดเห็น


2
และเนื่องจากผู้ถามถามเกี่ยวกับความหมายทางสถิติโปรดทราบว่าแม้ว่าสิ่งนี้มักจะไม่เกิดขึ้นในการเลือกตั้งคุณอาจจะสามารถทำนายผลลัพธ์ที่ "รัดกุม" ตัวอย่างเช่น 52/48 แต่ยังคงมีความมั่นใจ 75% ในผู้ชนะโดยไม่มีการอ้างอิง เพื่อสเวกัสสำหรับอัตราต่อรองของพวกเขา ตัวอย่างเช่นในการแข่งขันกีฬาโอลิมปิกรอบ 100m ชายรอบชิงชนะเลิศจะน้อยกว่า 4% แต่แบบจำลองทางสถิติของคุณอาจทำนายผู้ชนะได้ ทุกอย่างเกี่ยวกับช่วงความเชื่อมั่นใน 52/48 ซึ่งมีขนาดใหญ่พอเมื่อทำนายการเลือกตั้งว่าปกติไม่ได้แปลว่ามีโอกาส 75%
Steve Jessop

1
ฉันคิดว่า JoeTaxpayer นั้นมีประโยชน์มากในทางปฏิบัติ (ในความหมายทางปรัชญาของคำนั้น) มันเป็นการนำเสนอการตัดสินใจเชิงทฤษฎีที่ไม่แม่นยำค่อนข้าง มันเป็นวิธีการกำหนดราคาเดิมพัน parimutuel ลักษณะอื่น ๆ อาจเป็น "ภูมิปัญญาของฝูงชน" หรือ "ราคาตามตลาด" มันเน้นคำถามจริง ๆ ฉันจะทำอะไรกับข้อมูลนั้นได้ (สมมติว่าฉันเชื่อ)
DWIN

1
ฉันไม่ได้เห็นการกล่าวถึงวิทยาลัยเลือกตั้ง POTUS ได้รับการเลือกตั้งผ่านทางวิทยาลัยการเลือกตั้ง ดังนั้นหากคลินตันได้รับเพียง 51% ของ 51% ของวิทยาลัยการเลือกตั้งและไม่มีส่วนที่เหลือเลยด้วยคะแนนโหวตยอดนิยมเพียงประมาณ 26% เธอก็ชนะ ดังนั้นผลลัพธ์ของการสำรวจความคิดเห็นซึ่งโดยทั่วไปไม่ได้พิจารณาวิทยาลัยการเลือกตั้งจึงบางครั้งผิดไป
MikeP

2
@MikeP สำรวจความคิดเห็นไม่รายงานโอกาสในการชนะพวกเขารายงานผลสำรวจความคิดเห็น แบบจำลองที่รายงานโอกาสในการชนะการดึงข้อมูลจากการสำรวจในรัฐต่าง ๆ และนำวิทยาลัยการเลือกตั้งมาพิจารณาอย่างน้อยก็น่าเชื่อถือ
ฮอบส์

2

หากพวกเขาทำถูกต้องมีบางอย่างเกิดขึ้นประมาณสามในสี่ของเวลานั้นเมื่อพวกเขาบอกว่ามันมีโอกาส 75% ที่จะเกิดขึ้น (หรือโดยทั่วไปแนวคิดเดียวกันได้ปรับเปลี่ยนตามการคาดการณ์เปอร์เซ็นต์ทั้งหมด)

เป็นไปได้ที่จะกำหนดความหมายมากกว่านั้นขึ้นอยู่กับความคิดเห็นเชิงปรัชญาของเราและจำนวนที่เราเชื่อในแบบจำลอง แต่มุมมองเชิงปฏิบัตินี้เป็นสิ่งที่เป็นตัวหารร่วมที่ต่ำที่สุด - อย่างน้อยที่สุดก็ลองวิธีทางสถิติ มีผลมากกว่าโดยตรง) เพื่อให้การคาดการณ์เป็นไปตามมุมมองที่เป็นประโยชน์นี้


ไม่ความหมายคือญาณวิทยา / เบย์อย่างชัดเจนระดับความเชื่อ 75% ไม่มีใครจินตนาการถึงการทดลองหลอกซึ่งผลการเลือกตั้งเป็นตัวแปรสุ่ม
innisfree

@Innisfree: ถ้าครึ่งหนึ่งคุณมีระดับความเชื่อ 75% ในบางสิ่งบางอย่างมันผิดไปคุณต้องปรับวิธีการวัดความเชื่อของคุณ! ไม่จำเป็นต้องมีการทดลองจินตนาการที่จะมีส่วนร่วมเพียงแค่เป็นการวัดความเชื่อของคุณที่ได้รับการแปลเป็นความจริงในอดีต
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.