Brexit: สำคัญคือ“ ลา” อย่างมีนัยสำคัญทางสถิติหรือไม่ [ปิด]


12

ในบทความนี้เราถามคำถามเกี่ยวกับปรากฏการณ์ธรรมชาติที่เรียกว่ามนุษย์พยายามที่จะหาการตัดสินใจด้วยคะแนนเสียงนับ เหตุการณ์ที่เกิดขึ้นที่เฉพาะเจาะจงของปรากฏการณ์ธรรมชาติดังกล่าวว่าคำถามนี้เป็นเรื่องเกี่ยวกับกรณีของBrexit

หมายเหตุ:คำถามไม่ได้เกี่ยวกับการเมือง เป้าหมายคือการพยายามพูดคุยปรากฏการณ์ทางธรรมชาติดังกล่าวจากมุมมองทางสถิติตามการสังเกต

คำถามเฉพาะคือ:

  • คำถาม:อะไรคะแนนเสียง Brexit จะออกหมายถึง? เช่นนี้หมายความว่าประชาชนต้องการออกจากสหภาพยุโรปหรือไม่ หมายความว่าประชาชนไม่แน่ใจและต้องการเวลาในการคิดเพิ่มขึ้นหรือไม่ หรือมันเป็นอย่างอื่น?51.9%

ข้อสมมติฐานที่ 1:ไม่มีข้อผิดพลาดในกระบวนการลงคะแนน


14
ประชาธิปไตยไม่ได้เกี่ยวกับนัยสำคัญทางสถิติ ผลลัพธ์ 51.9% หมายความว่า 51.9% ของผู้โหวต, โหวต "ลา" นี่ไม่ใช่แบบสำรวจความคิดเห็น ผู้ที่ไม่ได้ลงคะแนน, โหวตโดย (ไม่) ใช้เท้า การตีความ 51.9% เนื่องจาก "สาธารณะไม่แน่ใจและต้องการเวลามากขึ้นในการคิด" เป็นเพียงการโกหกด้วยสถิติ Brexit เกิดขึ้นกับความน่าจะเป็น 1
ทิม

7
กระทู้นี้ถูกลิขิตมาเพื่อไม่เกี่ยวกับสถิติ, ดื้อรั้น, และอาจโต้เถียง มันไม่เหมาะสำหรับไซต์นี้ไม่ว่าไซต์นั้นจะได้รับความนิยมหรือไม่ เรามีห้องแชทที่เต็มไปด้วยผู้คนที่ยินดีที่จะมีส่วนร่วมในการสนทนาต่อไป: ลองดูสิ!
whuber

2
ฉันเชื่อว่าการสนทนาปัจจุบันเน้นไปที่สถิติและเป็นตัวอย่างที่ดีในการตีความผลการลงคะแนนเนื่องจากใช้กับการทดสอบทางสถิติ
Underminer

3
คุณพบปัญหาที่สำคัญ: ข้อผิดพลาดการวัดของตัวชี้วัดความคิดเห็นสาธารณะเช่นการสำรวจความคิดเห็น ฉันกลัวว่าแหล่งที่มาของข้อผิดพลาดไม่ใช่จากขนาดตัวอย่าง
Aksakal

4
IMHO นี่เป็นคำถามที่ไม่ใช่เชิงสถิติที่มีแผ่นไม้อัดบาง ๆ ของสถิติเพิ่มเข้ามาเพื่อปกปิดความจริงที่ว่า ในขณะที่ฉันอ่านมันสมมติฐาน "ไม่มีข้อผิดพลาดในกระบวนการลงคะแนน" กำจัดข้อควรพิจารณาทางสถิติทั้งหมดและจำเป็นต้องมีช่องทางการอภิปรายเกี่ยวกับสิ่งที่ "การลงคะแนน ... หมายถึง" ในระบอบประชาธิปไตย นั่นเป็นเรื่องของรัฐศาสตร์และปรัชญาไม่ใช่สถิติ
whuber

คำตอบ:


17

ผมเห็นด้วยกับ@Underminerว่ามีข้อผิดพลาดการสุ่มตัวอย่างไม่มี แต่ไม่ได้เพราะกลุ่มตัวอย่างที่มีขนาดใหญ่ แต่เป็นเพราะมีการสุ่มตัวอย่างไม่เกี่ยวข้องกับ ไม่มีใครถูกสุ่มตัวอย่างให้ลงคะแนน เห็นได้ชัดว่ามีบางส่วนเล็กน้อยของผู้ที่ต้องการลงคะแนน แต่ไม่สามารถ (เช่นมีอุบัติเหตุทางรถยนต์ในวันนี้) หรือผู้ที่ลงคะแนนไม่ถูกต้อง แต่นั่นเป็นเพียง "การสุ่มตัวอย่าง" ในที่นี้

ผลที่ได้คือแน่นอนไม่มีข้อผิดพลาดที่เกี่ยวข้องเนื่องจากประชากรทั้งหมดมีส่วนร่วมในการลงคะแนน (บางส่วนมีส่วนร่วมโดยไม่ได้มีส่วนร่วมในมัน) บางคนตัดสินใจลงคะแนน แต่บางคนก็ไม่ลง บางคนตัดสินใจลงคะแนนลา แต่บางคนก็ไม่ลง ประชาธิปไตยไม่ได้เกี่ยวกับนัยสำคัญทางสถิติ แต่เกี่ยวกับสิ่งที่เกิดขึ้นจริง การลงคะแนนไม่ได้มีไว้เพื่อเรียนรู้เกี่ยวกับความคิดเห็นของผู้คน แต่เพื่อทำการตัดสินใจ อันที่จริงคนที่บางครั้งไม่ได้ออกเสียงลงคะแนนตามสิ่งที่พวกเขาคิด แต่จะชัดแจ้งหรือบรรลุสิ่งที่ ตัวอย่างเช่นในการเลือกตั้งผู้คนอาจลงคะแนนไม่ให้ผู้สมัครที่พวกเขาต้องการ แต่สำหรับคนที่ต้องการอันดับสองหากพวกเขาคิดว่าเขามีโอกาสชนะมากขึ้น


พิจารณากรณีของพื้นที่สีเทาซึ่งประชากรผู้ออกเสียงลงคะแนนไม่แน่ใจในสิ่งที่ดีสำหรับพวกเขา ตัวอย่างเช่นกรณีที่มีผู้สมัคร 2 คนที่เกือบจะเท่ากัน ในกรณีเช่นนี้ฉันคิดว่าผู้ที่ลงคะแนนอาจแตกต่างอย่างไม่มีระบบเนื่องจากฉันคิดว่าการลงคะแนนของพวกเขาอาจมีการแจกแจงใกล้เคียงกัน เป้าหมายของฉันที่นี่ไม่ได้กำหนดประชาธิปไตยอีกครั้ง (หัวข้อทางการเมือง) แต่เพื่อดูว่าเราจะพูดอะไรเกี่ยวกับว่า Brexit เป็นพื้นที่สีเทาหรือไม่
มนุษย์ถ้ำ

2
@caveman ไม่ว่าพวกเขาจะแน่ใจหรือไม่สิ่งที่สำคัญคือวิธีการที่พวกเขาลงคะแนนตั้งแต่การลงคะแนนเป็นเรื่องเกี่ยวกับการลงคะแนนจริง แน่นอนว่าบางคนไม่มีความเห็นที่ชัดเจนโดยที่บางคนลงคะแนนและบางคนก็ไม่ได้ แต่สิ่งนี้ก็ไม่สำคัญเพราะสิ่งที่นับเป็นคะแนนจริงของผู้ลงคะแนน
ทิม

ถ้าฉันเข้าใจถูกต้องประเด็นของคุณเกี่ยวกับวิธีที่ประชาธิปไตยตีความการลงคะแนนเสียง ฉันเห็นด้วยกับคุณ. อย่างไรก็ตามฉันไม่ได้ตีความในลักษณะที่นักการเมืองทำ ฉันกำลังพยายามใช้ประชากรเพื่อระบุว่าการตัดสินใจดี, ไม่ดีหรือไม่ชัดเจน นี่เป็นการใช้การลงคะแนนแบบอื่น
มนุษย์ถ้ำ

2
@ คนถ้ำเปลี่ยนใจตลอดเวลานักจิตวิทยาเขียนเอกสารหลายพันเรื่องเกี่ยวกับเรื่องนี้ ... ใช่ 51.9% ไม่ได้หมายความว่า 51.9% ของ Brits แน่นอนว่าจะออกจากสหภาพยุโรป 100% ผู้คนยังไม่แน่ใจเกี่ยวกับการเปรียบเทียบความยาวของเส้น ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...
ทิม

1
@Aksakal ฉันจะไม่แสดงความคิดเห็นว่าใครมีสิทธิ์ลงคะแนนและใครไม่ ฉันจะไม่แสดงความคิดเห็นเกี่ยวกับความยากลำบากในการรับข้อมูลประจำตัวที่จำเป็น นั่นคือการเมืองและไม่ใช่ในหัวข้อที่นี่ จากมุมมองทางสถิติผู้มีสิทธิเลือกตั้งแต่ละรายมีความเป็นไปได้ที่จะไม่ลงคะแนน ความน่าจะเป็นนี้อาจได้รับอิทธิพลจากปัจจัยบางอย่างที่อาจหรืออาจไม่เกี่ยวข้องกับการตั้งค่าของพวกเขา แต่ผู้มีสิทธิเลือกตั้งแต่ละคนเลือก (ไม่ใช่) เพื่อใช้สิทธินั้นขึ้นอยู่กับดุลยพินิจของเขา / เธอ
user3697176

9

51.9% เป็นอัตราร้อยละของผู้มีสิทธิเลือกตั้งที่ต้องการที่จะออกจาก เนื่องจากขนาดตัวอย่างใหญ่มาก (> 33 ล้าน) จึงไม่มีข้อผิดพลาดในการสุ่มตัวอย่างแบบสุ่ม

การทดสอบนัยสำคัญทางสถิติจะพยายามที่จะตรวจสอบว่ามีความแตกต่างในยังคงอยู่และลาสามารถอธิบายได้จากข้อผิดพลาดการสุ่มแบบคนเดียวและความแตกต่างอย่างแน่นอนจะมีนัยสำคัญ (ดู @ คำตอบของมนุษย์ถ้ำ)

ปัญหาเกี่ยวกับวิธีการนี้คือความสำคัญทางสถิติทำให้สมมติฐานที่แข็งแกร่งมากว่ากลุ่มตัวอย่างเป็นตัวแทนของประชากรทั้งหมด (ทั้งหมดของสหราชอาณาจักร) ไม่ใช่เฉพาะผู้ลงคะแนน

อัตราการไม่ตอบสนอง (อัตราที่ไม่ได้ลงคะแนน) มีความสำคัญอย่างมากในการพิจารณาว่ามากกว่าครึ่งหนึ่งของทั้งหมดในสหราชอาณาจักรต้องการ 'ออก' และยากที่จะวัด อคติที่ไม่ตอบสนองถูกสร้างขึ้นเมื่อกลุ่มย่อยที่มีโอกาสลงคะแนนเสียงน้อยกว่านั้นมีมุมมองที่แตกต่างกันอย่างเป็นระบบ ยกตัวอย่างเช่นจากการเลือกตั้ง - โพลมีความเป็นไปได้ที่จะลงคะแนนเสียงน้อยกว่าพันปี แต่มีแนวโน้มที่จะยังคงอยู่ซึ่งจะทำให้ผลลัพธ์ที่ได้เมื่อพยายามที่จะเป็นตัวแทนของประชากรของอังกฤษทุกอคติ

ด้วยเหตุนี้การทดสอบนัยสำคัญทางสถิติในความหมายดั้งเดิมจึงไม่เหมาะสมอย่างยิ่ง


สมมติฐาน: เราจำเป็นต้องกำหนดเงื่อนไขบางประการสำหรับสิ่งนี้เพื่อให้เข้าใจและหลีกเลี่ยงการอภิปรายทางการเมืองเกี่ยวกับสิ่งที่การลงคะแนนเสียงพยายามทำให้สำเร็จ นี่คือคำจำกัดความของฉัน:

ประชากร: ทุกคนที่อาศัยอยู่ในสหราชอาณาจักร

กรอบตัวอย่าง: ผู้มีสิทธิ์ลงคะแนนทุกคนสามารถลงคะแนนได้

ระเบียบวิธีการสุ่มตัวอย่าง: การตอบสนองโดยสมัครใจการลงคะแนนได้เข้าร่วมในการสำรวจ

ตัวอย่าง: บุคคลที่ลงคะแนนจริง

ในการตั้งค่านี้สัดส่วนตัวอย่างสามารถนำมาใช้ (เพื่อให้ดีขึ้นหรือแย่ลง) เพื่อประเมินเปอร์เซ็นต์ของคนทั้งหมดที่ยังคงอยู่ (หรือออก )


8

คุณถาม

คะแนน Brexit 51.9% หมายถึงอะไร

หมายถึง 51.9% ของผู้ลงคะแนนที่โหวตให้ออก

เช่นนี้หมายความว่าประชาชนต้องการออกจากสหภาพยุโรปหรือไม่ หมายความว่าประชาชนไม่แน่ใจและต้องการเวลาในการคิดเพิ่มขึ้นหรือไม่ หรือมันเป็นอย่างอื่น?

17421887161462971293135318

อาจเป็นไปได้ที่จะสร้างแบบสอบถามที่ตอบสนองต่อคำถามของคุณ สิ่งนี้ดูเหมือนจะไม่เกิดขึ้นในการลงประชามติเมื่อนำไปปฏิบัติ


1
คุณช่วยพูดคุยเกี่ยวกับความหมายของการลงคะแนนที่เกี่ยวข้องกับผู้ลงคะแนน (เช่นไม่ใช่ประชากรทั้งหมด) นอกเหนือจากข้อสรุปที่พื้นผิวซึ่งหมายความว่า " 51.9% โหวตออก "? ฉันสงสัยว่าขอบเขตของข้อมูลที่เราสามารถแยกออกมาจากสิ่งนี้คืออะไร
มนุษย์ถ้ำ

4
Caveman ความคิดเห็นนี้มากกว่าคำถามอื่น ๆ ที่แสดงให้เห็นว่าคำถามของคุณไม่ใช่เชิงสถิติ เนื่องจาก 51.9% (รวมกับจำนวนรวม) เป็นข้อมูลทั้งหมดที่เป็นหลักฐานเกี่ยวกับผู้มีสิทธิเลือกตั้งและไม่มีความไม่แน่นอน (เว้นแต่คุณต้องการท้าทายความถูกต้องของการนับซึ่งเป็นประเด็นแยกต่างหาก) การปฏิเสธคำตอบนี้จึงมีนัย คุณกำลังมองหาข้อสรุปที่ไม่ใช่เชิงสถิติ
whuber

จะเกิดอะไรขึ้นถ้าเราจำลอง Brexit ว่าเป็นปัญหาการจำแนกเลขฐานสองและพิจารณาผู้มีสิทธิเลือกตั้งเป็นค่าประมาณของตัวแยกประเภทที่เป็นสมาชิกของวงดนตรี ในโมเดลนี้เป้าหมายไม่ได้ระบุสิ่งที่ประชาชนส่วนใหญ่ต้องการ แต่เป้าหมายคือการระบุลักษณนามที่ดีที่สุดจากพื้นที่ของลักษณนาม จากนั้นเราสามารถใช้มาตรการบางอย่างเพื่อทดสอบความดีงามของวงลักษณนามลักษณนามของมนุษย์ผู้มีสิทธิเลือกตั้งดังกล่าว เช่นเราอาจใช้ความฉงนสนเท่ห์หรืออย่างอื่นที่เหมาะสมสำหรับงานการจำแนกประเภทไบนารีนี้ซึ่งไม่ทราบความจริงพื้นฐาน (เช่นเราไม่รู้ชัดเจนว่าการลานั้นดีกว่าที่เหลืออยู่)
มนุษย์ถ้ำ

@caveman: เนื่องจากความจริงพื้นฐานคือไม่ถูกต้อง (ไม่ทราบ) คุณจะใช้เมตริกแบบใดในการ "จำแนกลักษณนามที่ดีที่สุดจากพื้นที่ของลักษณนาม" ตัวชี้วัดใด ๆ ดังกล่าวจะเข้ารหัสอคติของนักวิเคราะห์ที่เลือกตัวชี้วัดยกเว้นตัวชี้วัด "ทำซ้ำผลลัพธ์ของการลงคะแนน" ซึ่งตัวชี้วัดใดที่คุณทราบคำตอบอยู่แล้ว: 51.9% / 48.1%
Eric Towers

@EricTowers ฉันเอานี้เพื่อ politics.stackexchange.com ที่ฉันพูดคุยเกี่ยวกับวิธีการที่แตกต่างกัน - politics.stackexchange.com/questions/11433/...
ถ้ำ

2

TL; DR

R=100051.9%51.9%

0

48.1%

0

ดังนั้นฉันสรุปได้ว่าการลงคะแนนเสียงของ Brexit ไม่ใช่ผลข้างเคียงที่มีเสียงดังของประชากรที่ไม่แน่ใจหรือสับสน ดูเหมือนจะมีเหตุผลที่เป็นระบบที่ทำให้พวกเขาออกจากสหภาพยุโรป

ฉันอัปโหลดรหัสจำลองที่นี่: https://github.com/Al-Caveman/Brexit

รายละเอียด

ให้ข้อสันนิษฐาน 1คำตอบที่เป็นไปได้ (หรือสมมติฐาน) คือ:

  • H0
  • H1

หมายเหตุ:เป็นไปไม่ได้ที่ประชาชนจะต้องการอยู่อย่างมั่นใจเพราะเราได้กำจัดข้อผิดพลาดในการลงคะแนน

H0H1

  • 51.9%
  • 151.9%

H1H0

ในการวัดความน่าจะเป็นนี้เราจำเป็นต้องทราบการกระจายตัวของประชากรอังกฤษที่ไม่แน่ใจในระบบการลงคะแนนแบบไบนารี่เช่น Brexit ดังนั้นขั้นตอนแรกของฉันคือนี่คือการจำลองการกระจายตัวนี้โดยทำตามสมมติฐานด้านล่าง:

  • ข้อสันนิษฐานที่ 2:ประชากรที่ประกอบด้วยบุคคลที่ไม่แน่ใจจะได้รับโอกาสลงคะแนนแบบสุ่ม คือทุกคำตอบที่เป็นไปได้มีโอกาสเท่าเทียมกันในการถูกเลือก

ในมุมมองของฉันสมมติฐานนี้มีความยุติธรรม / สมเหตุสมผล

นอกจากนี้เราจำลองการลาและการคงอยู่ของแคมเปญเป็นสองกระบวนการที่แตกต่างกันดังนี้:

  • PleaveOleave=[l1,l2,,ln]
  • PremainOremain=[r1,r2,,rn]

ที่อยู่:

  • n
  • i{1,2,,n}li,ri{0,1}01

ภายใต้ข้อ จำกัด ดังต่อไปนี้:

  • i{1,2,,n}liri1li=1ri=0ri=1li=0i{1,2,,n}

Oleave=[1,0,0]3

Oremain=[0,1,0]3

Oleave[3]=Oremain[3]=0

33,568,18451.9%10051.9=48.1%

  • n=33,568,184
  • 33,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

ดังนั้นเราจึงกำหนดอาร์เรย์เอาต์พุตดังนี้:

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0
  • i{17421887+1,17421887+2,,33568184}Oremain[i]=1
  • i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m ถูกกำหนดไว้

premain

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

ในคำอื่น ๆ :

  • pleave=0
  • premain=0

2
บางทีสิ่งที่สำคัญกว่าในกรณีนี้คืออัตราการไม่ตอบสนอง (เช่นบุคคลที่ไม่ลงคะแนน) ระยะขอบของข้อผิดพลาด (หรือการวัดนัยสำคัญทางสถิติ) จะพิจารณาข้อผิดพลาดตัวอย่างแบบสุ่มเท่านั้น อคติที่ไม่ตอบสนองจะไม่รวมอยู่ในสิ่งนี้และจะมีผลกระทบมากกว่าข้อผิดพลาดการสุ่มตัวอย่างแบบสุ่มด้วยแบบสำรวจที่มีขนาดตัวอย่างขนาดใหญ่
Underminer

46,499,53746,499,537(17421887+16146297)=12,931,353

3
ไม่มีวิธีที่น่าพอใจในการจัดการกับข้อมูลที่หายไปโดยไม่สุ่ม
Underminer

ผู้ที่ไม่ได้ลงคะแนนอาจประกอบด้วยบุคคลที่ไม่สนใจเรื่องการเมือง (เช่นไม่ไว้ใจอีกต่อไป) อีกวิธีหนึ่งคือผู้ที่ไม่มีสิทธิ์เลือกตั้งอาจเป็นผู้ที่ไม่แน่ใจ หรืออาจเป็นส่วนผสมของทั้งสอง จะเกิดอะไรขึ้นถ้าเราคิดว่า " ผู้ลงคะแนนทั้งหมดไม่แน่ใจ " นี่จะเป็นขอบเขตสูงสุดสำหรับการทดสอบว่าสถานการณ์ปัจจุบันเป็นที่สาธารณะรู้สึกว่า Brexit เป็นพื้นที่สีเทาหรือไม่
มนุษย์ถ้ำ

3
มีความสับสนเกี่ยวกับลักษณะและขอบเขตของสถิติที่นี่ คุณกำลังพยายามสร้างแบบจำลองกระบวนการลงคะแนนและวิธีการแจ้งกลไกและความถูกต้องของการกำกับดูแลและการตัดสินใจสาธารณะ นี้เป็นงานที่คุ้มค่ารัฐศาสตร์ ไม่ใช่สถิติ (แม้ว่าจะเกี่ยวข้องกับสถิติ)
gung - Reinstate Monica

1

คุณสามารถถามคำถามที่แตกต่างกันเล็กน้อย: สมมติว่า 50% ของประชากรที่มีขนาดใหญ่มากโหวตว่า "ใช่" และคุณถามตัวอย่างขนาด S แบบสุ่มความน่าจะเป็นที่ 51.9% ของตัวอย่างตอบว่า "ใช่" ขึ้นอยู่กับ ขนาดตัวอย่าง?

S1/2

S1/2(6.10.5/0.019)2


0

นี่เป็นอีกวิธีการหนึ่งที่ใช้วิธีการวิเคราะห์แทนการจำลอง

n0.5

51.9%17,421,887Oleave0.533,568,18417,421,887+10.533,568,184

17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

( คำนวณโดยWolframalpha )8.39663381928984×1010105024

และนี่คือความน่าจะเป็นของการมีของไม่แน่ใจประชากรคะแนนเสียงลา51.9%

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.