ผลการเลือกตั้งของสหรัฐอเมริกาปี 2016: เกิดอะไรขึ้นกับแบบจำลองการทำนาย?


108

ครั้งแรกมันคือBrexitตอนนี้การเลือกตั้งสหรัฐ การทำนายแบบจำลองจำนวนมากถูกปิดลงโดยมีระยะขอบกว้างและมีบทเรียนที่ต้องเรียนรู้ที่นี่หรือไม่? ดึกแค่สี่ทุ่ม PST เมื่อวานนี้ตลาดการเดิมพันยังคงเป็นที่นิยมของฮิลลารี 4 ต่อ 1

ฉันคิดว่าตลาดการเดิมพันด้วยเงินจริงในบรรทัดควรทำหน้าที่เป็นชุดของการทำนายที่มีทั้งหมด ดังนั้นจึงไม่ใช่เรื่องที่ไกลเกินกว่าที่จะบอกว่าแบบจำลองเหล่านี้ทำงานได้ไม่ดีนัก

ฉันเห็นหนึ่งคำอธิบายว่าผู้ลงคะแนนไม่เต็มใจที่จะระบุตัวเองว่าเป็นผู้สนับสนุนทรัมป์ แบบจำลองสามารถรวมเอฟเฟกต์แบบนั้นได้อย่างไร

คำอธิบายหนึ่งแมโครผมอ่านคือการเพิ่มขึ้นของประชานิยม คำถามคือโมเดลทางสถิติสามารถจับแนวโน้มมาโครได้อย่างไร

แบบจำลองการทำนายเหล่านี้ออกมามีน้ำหนักมากเกินไปกับข้อมูลจากการสำรวจและความเชื่อมั่นซึ่งไม่เพียงพอจากที่ประเทศกำลังยืนอยู่ในมุมมอง 100 ปี? ฉันกำลังพูดถึงความคิดเห็นของเพื่อน


9
วิธีประเมิน "ไม่เต็มใจระบุตัวตนของคุณในฐานะผู้สนับสนุนคนที่กล้าหาญ" ผลกระทบ: อาจจะเป็นกลุ่มโฟกัส นี่เป็นคำถามทางสังคมศาสตร์มากกว่าสถิติต่อหนึ่งคำถาม
kjetil b halvorsen

100
ทำไมแบบจำลองต้องผิดเพราะพวกเขาทำนายผลลัพธ์ที่ไม่ได้เกิดขึ้น? ฉันมีแบบจำลองที่บอกว่าคนตายอาจจะไม่แสดงหกคน แต่บางครั้งมันก็แสดงให้เห็นหกคน
dsaxton

4
ฉันไม่แน่ใจว่านางแบบเอนตัวไปทางด้านที่ผิดจริงหรือไม่ เราอ่านเอาต์พุตของโมเดลถูกต้องหรือไม่ ฉันเห็นด้วยกับความคิดเห็นของ dsaxton
Richard Hardy

7
บางความคิดที่ดีที่บล็อกของแอนดรู Gelman ของที่นี่
Richard Hardy

22
หากอัตราต่อรองเป็น 4: 1 ผลลัพธ์ที่พบได้น้อยลงก็ยังคงเกิดขึ้นบ่อยครั้ง นั่นคือตลาดการเดิมพันอาจจะพูดถูก
gung

คำตอบ:


57

ในระยะสั้นการเลือกตั้งไม่ได้ง่ายเสมอไป การเลือกตั้งครั้งนี้อาจจะยากที่สุด

ทุกครั้งที่เราพยายามทำการอนุมานเชิงสถิติคำถามพื้นฐานคือตัวอย่างของเรานั้นแสดงถึงประชากรที่น่าสนใจได้ดีหรือไม่ ข้อสันนิษฐานทั่วไปที่จำเป็นสำหรับการอนุมานทางสถิติหลายประเภทคือการให้กลุ่มตัวอย่างของเราเป็นกลุ่มตัวอย่างที่สุ่มจากกลุ่มประชากรที่น่าสนใจ (และบ่อยครั้งเราจำเป็นต้องมีกลุ่มตัวอย่างที่เป็นอิสระด้วย) หากสมมติฐานเหล่านี้ยังคงเป็นจริงเรามักจะมีมาตรการที่ดีของความไม่แน่นอนของเราขึ้นอยู่กับทฤษฎีทางสถิติ

แต่เราไม่ได้มีสมมติฐานเหล่านี้ถือเป็นจริงกับการสำรวจความคิดเห็น! เรามีตัวอย่างทั้งหมด0 รายการจากประชากรที่เราสนใจ: โหวตจริงในวันเลือกตั้ง ในกรณีนี้เราไม่สามารถทำการอนุมานที่ถูกต้องใด ๆ โดยไม่มีข้อสันนิษฐานเพิ่มเติมเกี่ยวกับข้อมูล หรืออย่างน้อยไม่สามารถทดสอบได้จนกว่าจะถึงวันเลือกตั้ง

พวกเรายอมแพ้และพูดว่า "50% -50%!" หรือไม่? โดยทั่วไปแล้วไม่มี เราสามารถลองทำสิ่งที่เราเชื่อว่าเป็นสมมติฐานที่สมเหตุสมผลเกี่ยวกับวิธีการลงคะแนนเสียง ตัวอย่างเช่นเราอาจต้องการเชื่อว่าการสำรวจความคิดเห็นเป็นการประมาณการโดยไม่ลำเอียงสำหรับการโหวตวันเลือกตั้งบวกเสียงชั่วคราวบางส่วนที่ไม่ลำเอียง (เช่นการพัฒนาความคิดเห็นสาธารณะเมื่อเวลาผ่านไป) ฉันไม่ใช่ผู้เชี่ยวชาญเกี่ยวกับวิธีการลงคะแนนเลือกตั้ง แต่ฉันเชื่อว่านี่เป็นรูปแบบของการใช้งาน 538 และในปี 2012 มันใช้งานได้ดีทีเดียว ดังนั้นสมมติฐานเหล่านั้นก็ค่อนข้างสมเหตุสมผล น่าเสียดายที่ไม่มีวิธีการที่แท้จริงในการประเมินสมมติฐานเหล่านั้นนอกการให้เหตุผลเชิงคุณภาพอย่างเคร่งครัด สำหรับการสนทนาเพิ่มเติมในหัวข้อที่คล้ายกันดูหัวข้อการหายไปที่ไม่ทำให้หลงลืม

ทฤษฎีของฉันสำหรับเหตุผลที่การสำรวจความคิดเห็นทำได้ไม่ดีในปี 2559: การสำรวจความคิดเห็นไม่ได้เป็นการประเมินที่เป็นกลางเกี่ยวกับพฤติกรรมของผู้ลงคะแนนเสียงเลือกตั้ง นั่นคือฉันจะเดาว่าผู้สนับสนุนทรัมป์ (และผู้สนับสนุน Brexit เช่นกัน) มีความไม่ไว้วางใจโพลมากกว่า โปรดจำไว้ว่านายทรัมป์ประณามการลงคะแนนอย่างแข็งขัน เช่นนี้ฉันคิดว่าผู้สนับสนุนทรัมป์มีโอกาสน้อยที่จะรายงานความตั้งใจในการออกเสียงลงคะแนนของพวกเขาต่อผู้สำรวจมากกว่าผู้สนับสนุนฝ่ายตรงข้าม ฉันจะคาดการณ์ว่าสิ่งนี้ทำให้เกิดอคติอย่างหนักที่ไม่คาดคิดในการสำรวจ

นักวิเคราะห์จะคิดได้อย่างไรเมื่อใช้ข้อมูลการสำรวจความคิดเห็น? จากข้อมูลการสำรวจความคิดเห็นเพียงอย่างเดียวไม่มีทางที่จะทำสิ่งนี้ในลักษณะเชิงปริมาณ ข้อมูลโพลไม่ได้บอกอะไรคุณเกี่ยวกับผู้ที่ไม่ได้เข้าร่วม อย่างไรก็ตามหนึ่งอาจสามารถปรับปรุงการสำรวจในลักษณะเชิงคุณภาพโดยการเลือกสมมติฐานที่สมเหตุสมผล (แต่ไม่สามารถทดสอบได้) เกี่ยวกับความสัมพันธ์ระหว่างข้อมูลการสำรวจกับพฤติกรรมการเลือกตั้ง นี่ไม่ใช่เรื่องเล็กน้อยและเป็นส่วนที่ยากอย่างแท้จริงในการเป็นนักสำรวจความคิดเห็นที่ดี (หมายเหตุ: ฉันไม่ใช่นักสำรวจความเห็น) โปรดทราบว่าผลลัพธ์นั้นน่าประหลาดใจอย่างมากต่อผู้เชี่ยวชาญเช่นกันดังนั้นจึงไม่มีสัญญาณที่ชัดเจนว่าข้อสันนิษฐานนั้นปิดฉากลงอย่างรุนแรงในครั้งนี้

การลงคะแนนเลือกตั้งอาจเป็นเรื่องยาก


1
@horaceT: พวกเขาจะรู้ได้อย่างไรว่ามีอคติจนกระทั่งพวกเขามีตัวอย่างจากประชากรที่น่าสนใจ หนึ่งของริ้วรอยที่นี่เป็นที่ในอดีตฉันเดาว่าปัญหานี้เป็นหนึ่งในเสียงแทนอคติ หากทั้งสองฝ่ายมีระดับการตอบสนองไม่เท่ากันค่าประมาณของคุณจะไม่เอนเอียงและมีเสียงดังมากขึ้นเล็กน้อย แต่เนื่องจากนายทรัมป์มีแคมเปญที่มีมุมมองเชิงลบอย่างมากต่อความครอบคลุมของสื่อและการสำรวจความคิดเห็นดังนั้นมากกว่าการเลือกตั้งครั้งก่อน ๆ นี่จะเป็นโพลเอฟเฟ็กต์ที่มี ...
Cliff AB

38
สำหรับสิ่งที่คุ้มค่าฉันยังคงไม่คิดว่า 538 ล้มเหลวจริงๆ มันให้โอกาส ~ 30% (?) กับการชนะของทรัมป์ซึ่งเป็นสิ่งที่ดีทีเดียว - มันหมายถึงทุกๆ 2-3 ครั้งที่คาดว่าจะถูกต้องและคาดว่าจะผิด 1 ครั้ง นั่นเป็นความไม่แน่นอนจำนวนมากเกินกว่าการสำรวจอื่น ๆ ดูเหมือนว่าจะยินดีที่จะยอมรับ
Mehrdad

3
เอฟเฟกต์นี้เป็นที่รู้จักกันดี: เรียกว่าเอฟเฟกต์แบรดลีย์ในสหรัฐอเมริกาและเอฟเฟ็กต์ Shy Tory ในสหราชอาณาจักร
Emilio Pisanty

15
538 (และสิ่งอื่น ๆ เช่น PEC ของ Sam Wang) ไม่ใช่การสำรวจความคิดเห็น แบบจำลองเหล่านี้สร้างขึ้นจากผลการสำรวจความคิดเห็น โมเดลทั้งหมดเหล่านี้เริ่มต้นด้วยข้อมูลเดียวกันโดยทั่วไป แต่ 538 คาดการณ์ความไม่แน่นอนในผลลัพธ์ได้มากขึ้นด้วยเหตุผลที่ Nate Silver กล่าวถึงการเลือกตั้งก่อนหน้านี้อย่างกว้างขวาง นี่หมายความว่าโอกาส 538 ของการชนะฮิลลารีต่ำกว่ามากแม้ว่ามันจะใช้การสำรวจความคิดเห็นเดียวกัน ฉันยอมรับว่า 538 ไม่ล้มเหลว - จากการป้อนข้อมูลการชนะฮิลลารีที่มีความไม่แน่นอนมากมายดูเหมือนว่าจะเป็นการคาดการณ์ที่ดีที่สุดแม้จะอยู่ในยุคหลัง
ไก่

6
ฉันอ่านการทำนาย 538 ครั้งสุดท้ายในเช้าวันรุ่งขึ้นหลังจากการเลือกตั้งและใน Nate Silver ค่อนข้างชัดเจนระบุว่าข้อผิดพลาด 3% ของขอบจะอยู่ในช่วงปกติ - และถ้าคุณดูแผนภูมิข้อผิดพลาด 3% ในความโปรดปรานของทรัมป์มันเข้ากันได้ดีกับสิ่งที่เกิดขึ้นจริง
Xiong Chiamiov

35

มีแหล่งที่มาของข้อผิดพลาดในการสำรวจหลายแหล่ง:

  • คุณพบว่าบางคนเข้าถึงยาก

    สิ่งนี้ได้รับการแก้ไขโดยทำการวิเคราะห์ข้อมูลประชากรแล้วทำการแก้ไขอคติการสุ่มตัวอย่างของคุณ หากการวิเคราะห์ข้อมูลประชากรของคุณไม่ได้สะท้อนถึงสิ่งที่ทำให้ผู้คนเข้าถึงได้ยากการแก้ไขนี้จะไม่ซ่อมแซมความเสียหาย

  • คนโกหก

    คุณสามารถใช้อัตราทางประวัติศาสตร์ที่ผู้คนโกหกเพื่อสำรวจความคิดเห็นที่มีอิทธิพลต่อแบบจำลองของคุณ ตัวอย่างเช่นคนในอดีตระบุว่าพวกเขาจะลงคะแนนให้กับบุคคลที่ 3 มากกว่าที่พวกเขาทำในวันเลือกตั้ง การแก้ไขของคุณอาจผิดที่นี่

    การโกหกเหล่านี้อาจทำให้การแก้ไขอื่น ๆ ของคุณยุ่งเหยิง หากพวกเขาโกหกเกี่ยวกับการลงคะแนนเสียงในการเลือกตั้งครั้งล่าสุดพวกเขาอาจถูกนับว่าเป็นผู้มีสิทธิเลือกตั้งแม้ว่าพวกเขาจะไม่เป็นเช่นนั้น

  • เฉพาะคนที่ลงคะแนนท้ายการนับเท่านั้น

    บางคนสามารถรับการสนับสนุนได้มากมาย แต่ถ้าผู้สนับสนุนของพวกเขาไม่ปรากฏในวันเลือกตั้งก็จะไม่นับ นี่คือเหตุผลที่เราลงทะเบียนผู้มีสิทธิเลือกตั้งผู้มีสิทธิเลือกตั้งที่เป็นไปได้และรุ่นอื่น ๆ หากโมเดลเหล่านี้ผิดสิ่งต่าง ๆ จะไม่ทำงาน

  • เงินค่าใช้จ่ายการสำรวจ

    การสำรวจความคิดเห็นมีราคาแพงและหากคุณไม่คาดหวังว่าจะพลิกคุณอาจไม่ได้สำรวจความคิดเห็นบ่อยนัก สิ่งนี้อาจนำไปสู่ความประหลาดใจที่รัฐที่คุณสำรวจความคิดเห็น 3 สัปดาห์ก่อนการเลือกตั้งจะไม่มีลักษณะเช่นนั้นในวันเลือกตั้ง

  • ผู้คนเปลี่ยนใจ

    เมื่อเวลาผ่านไปหลายชั่วโมงชั่วโมงวันสัปดาห์หรือเดือนผู้คนต่างก็เปลี่ยนใจ การสำรวจเกี่ยวกับ "สิ่งที่คุณจะทำตอนนี้" ไม่ได้ช่วยอะไรมากหากพวกเขาเปลี่ยนใจก่อนที่จะนับ มีแบบจำลองที่เดาอัตราโดยประมาณที่ผู้คนเปลี่ยนใจจากการสำรวจทางประวัติศาสตร์

  • จับปูใส่กระด้ง

    หากทุกคนระบุว่าฮิลลารีเป็น +3 และคุณได้รับแบบสำรวจแสดงฮิลลารี +11 หรือโดนัลด์ +1 คุณอาจตั้งคำถาม คุณอาจทำอีกรอบและดูว่ามีความล้มเหลวในการวิเคราะห์หรือไม่ คุณอาจจะโยนมันออกไปและทำแบบสำรวจอื่น เมื่อคุณได้รับโพลสำรวจฮิลลารี +2 หรือ +4 คุณอาจไม่ทำเช่นนั้น ค่าผิดปกติจำนวนมากถึงแม้ว่าแบบจำลองทางสถิติบอกว่ามันเกิดขึ้นบางครั้งก็สามารถทำให้คุณ "ดูแย่"

    รูปแบบเส็งเคร็งโดยเฉพาะอย่างยิ่งนี้เกิดขึ้นในวันเลือกตั้งที่ทุกคนที่โพลสำรวจความคิดเห็นมาบรรจบกันอย่างน่าอัศจรรย์ในค่าเดียวกัน พวกเขาอาจจะมีการสำรวจความคิดเห็นจากภายนอก แต่ไม่มีใครอยากเป็นคนพูด (ฮิลลารี +11 วันก่อนการเลือกตั้งครั้งนี้) การผิดฝูงสัตว์จะทำให้คุณเจ็บปวดน้อยลง

  • คาดว่าจะเกิดข้อผิดพลาดในการสุ่มตัวอย่าง

    หากคุณมีผู้คน 1 ล้านคนและคุณขอให้คนสุ่ม 100 คนครึ่งหนึ่งพูดว่า "แอปเปิ้ล" และอีกครึ่งพูดว่า "ออเรนจ์" ข้อผิดพลาดที่คาดหวังจากการสุ่มตัวอย่างคือ +/- 10 หรือมากกว่านั้น เกิดขึ้น นี้บิตสุดท้ายคือสิ่งที่โพลบอกว่าพวกเขาขอบของข้อผิดพลาด แบบสำรวจไม่ค่อยอธิบายสิ่งที่ปัจจัยการแก้ไขข้างต้นสามารถนำเสนอเป็นข้อผิดพลาด


Nate Silver ที่ 538 เป็นหนึ่งในผู้รวบรวมโพลไม่กี่รายที่ใช้วิธีอนุรักษ์นิยม (ระมัดระวัง) ในการจัดการกับข้อผิดพลาดประเภทข้างต้น เขาคำนึงถึงความเป็นไปได้ของข้อผิดพลาดที่มีความสัมพันธ์อย่างเป็นระบบในแบบจำลองการลงคะแนน

ในขณะที่ผู้รวบรวมคนอื่นคาดการณ์โอกาส 90% + ที่ได้รับการเลือกตั้ง HC เนทซิลเวอร์กำลังระบุ 70% เนื่องจากการสำรวจอยู่ใน "ข้อผิดพลาดการเลือกตั้งปกติ" ของชัยชนะของโดนัลด์

นี่เป็นตัวชี้วัดทางประวัติศาสตร์ของข้อผิดพลาดของแบบจำลองซึ่งตรงข้ามกับข้อผิดพลาดการสุ่มตัวอย่างเชิงสถิติ เกิดอะไรขึ้นถ้าแบบจำลองและการแก้ไขตัวแบบผิด?


ผู้คนยังคงกระทืบตัวเลข แต่ผลการศึกษาเบื้องต้นชี้ให้เห็นว่าส่วนใหญ่เป็นแบบจำลองผลิตภัณฑ์ ผู้สนับสนุนของโดนัลด์ปรากฏตัวขึ้นในการเลือกตั้งในจำนวนที่มากขึ้นและผู้สนับสนุนฮิลลารีในจำนวนที่น้อยกว่าที่ระบุไว้ในแบบสำรวจความคิดเห็น (และแบบสำรวจความคิดเห็น!)

Latino โหวตให้โดนัลด์มากกว่าที่คาดไว้ คนผิวดำโหวตให้โดนัลด์มากกว่าที่คาดไว้ (ส่วนใหญ่ทั้งสองลงคะแนนให้ฮิลลารี) ผู้หญิงผิวขาวโหวตให้โดนัลด์มากกว่าที่คาดหวังไว้ (มากกว่านี้โหวตให้โดนัลมากกว่าฮิลลารีซึ่งไม่คาดหมาย)

ผลิตภัณฑ์ของผู้มีสิทธิเลือกตั้งอยู่ในระดับต่ำโดยทั่วไป พรรคเดโมแครตมีแนวโน้มที่จะชนะเมื่อมีผู้มีสิทธิเลือกตั้งสูงและพรรครีพับลิกันเมื่อต่ำ


1
ปัญหาเกี่ยวกับผลิตภัณฑ์ที่น่าสนใจคือการสำรวจความคิดเห็นมีอิทธิพลต่อผลิตภัณฑ์ มีรูปแบบผลิตภัณฑ์สำหรับสิ่งนั้นหรือไม่? มันควรจะเป็นไปได้ที่จะมีฟังก์ชั่นที่จะทำการสำรวจการคาดการณ์ของผลิตภัณฑ์และแก้ไขมันสำหรับทั้งสองฝ่ายตามมุมมองของผู้สมัคร ผู้สมัครที่อยู่ด้านหลังอาจไม่ได้รับผู้มีสิทธิ์ลงคะแนนพิเศษที่กังวลมากขึ้นหลังจากเห็นโพลอธิบายว่ากลุ่มเป้าหมายของพวกเขาน่ากลัว แต่หากผู้สมัครของคุณไปข้างหน้าคุณอาจไม่ทำงานหนักพอที่จะลงคะแนน ... ฟังก์ชั่นเชิงเส้น แต่มันควรจะวัดได้
BenPen

2
+1 จากฉันเพียงเพื่อพูดถึงการลงทุนในทิศทางเดียวกันและอธิบายได้ดี ในขณะที่ฉันตอบคำถามฉันสงสัยว่าฝูงสัตว์น่าจะเกิดขึ้นประมาณ 5 หรือ 3 วัน (จากการเลือกตั้ง 3 วัน) ตามกราฟ 538 ฉันคาดเดาว่าเราจะหาข้อมูลเพิ่มเติมเกี่ยวกับข้อผิดพลาดที่เกิดขึ้นจริงในวันต่อ ๆ ไป (คุณรู้ว่าคุณเป็นคนโง่เมื่อคุณรีเฟรชหน้าเว็บอย่างครึกครื้นเพื่อพิจารณาอนุพันธ์ที่สองของกราฟโค้งที่นั่น)
TED

ฉันไม่ทราบว่าคุณบัญชีอย่างไร แต่ฉันคิดว่ามีความอัปยศที่เกี่ยวข้องกับทรัมป์ที่จะทำให้ยากที่จะหาจำนวนการสนับสนุนที่แท้จริงของเขาอย่างถูกต้องและจะปรากฏในผลการเลือกตั้งจริงเท่านั้น ฉันชอบคิดว่ามันเป็นสติกเกอร์กันชนข้อสรุป: จอร์จดับเบิลยูบุชและโอบามาเป็นประธานาธิบดีทั้ง 2 เทอม แต่ในขณะที่สติกเกอร์กันชนโอบามาเป็นที่แพร่หลายและประดับประดาบนรถด้วยความภาคภูมิใจสติกเกอร์กันชนของบุช มีผู้สมัครบางคนที่การสนับสนุนแบบเปิดดึงความร้อนและกรดกำมะถันจากฝ่ายค้านมากเกินไปและการสนับสนุนนั้นต่ำมาก
Coburne

3
@coburne ไม่มีหลักฐานของสิ่งนั้นในพรรค ผู้สนับสนุนทรัมป์ที่ไม่อายเกี่ยวกับเรื่องนี้ สติกเกอร์กันชนของ Bush ซึ่งเป็นที่นิยมในพื้นที่ต่าง ๆ กว่าสติกเกอร์กันชนของ Obama
Yakk

@coburne - สิ่งที่คุณกำลังพูดถึงจะเรียกว่าแบรดลีย์ผล มีการถกเถียงกันอย่างมากว่ามันมีอยู่จริงหรือไม่ มีงานวิจัยชิ้นหนึ่งที่คาดว่าจะพบว่าพลังของมันนั้นแปรผันตามวาทศิลป์ที่ใช้ข้อหาทางเชื้อชาติในการรณรงค์ ฉันไม่คิดว่าจะมีการถกเถียงกันมากมายว่ามีการใช้สิ่งนี้มากมาย
TED

31

สิ่งนี้ถูกกล่าวถึงในความคิดเห็นเกี่ยวกับคำตอบที่ได้รับการยอมรับ (หมวกถึงเมห์ราด ) แต่ฉันคิดว่าควรจะเน้น 538 ไม่จริงนี้ค่อนข้างดีรอบนี้ *

538 เป็นตัวรวบรวมหน่วยเลือกตั้งที่ใช้โมเดลกับแต่ละรัฐเพื่อพยายามทำนายผู้ชนะ การวิ่งรอบสุดท้ายของพวกเขาทำให้ทรัมป์มีโอกาสชนะ 30% นั่นหมายความว่าถ้าคุณจัดการเลือกตั้งสามครั้งด้วยข้อมูลเช่นนี้คุณคาดหวังให้ทีมเรดชนะหนึ่งในนั้น นั่นไม่ใช่โอกาสเพียงเล็กน้อยเท่านั้น แน่นอนว่ามันใหญ่พอที่ฉันจะใช้ความระมัดระวัง (เช่น: วันศุกร์ก่อนที่ฉันจะขอวันพุธที่ 9 ในที่ทำงานโดยพิจารณาถึงความน่าจะเป็นที่ใกล้พอที่จะเป็นตอนดึก)

สิ่งหนึ่งที่ 538 จะบอกคุณถ้าคุณออกไปเที่ยวนั่นคือถ้าการสำรวจถูกปิดมีโอกาสที่ดีที่พวกเขาจะออกไปในทิศทางเดียวกัน นี่คือเหตุผลสองประการ

  • มีแนวโน้มที่ผู้มีสิทธิเลือกตั้งรุ่น โพลต้องปรับตามประเภทของผู้ลงคะแนนที่จะปรากฏในวันเลือกตั้ง เรามีแบบจำลองทางประวัติศาสตร์ แต่นี่ไม่ใช่คู่สมัครทั่วไปของคุณดังนั้นการทำนายโดยอิงจากข้อมูลในอดีตจะเป็นบิตของการเล่นลูกเต๋าชนิดหนึ่ง
  • การเลือกตั้งในช่วงปลายต้อน ไม่มีใครต้องการโพลที่ทำให้การเลือกตั้งแย่ที่สุด ดังนั้นในขณะที่พวกเขาไม่คิดว่าการเป็นคนสำคัญในช่วงกลางของการรณรงค์ในตอนท้ายโพลทั้งหมดมีแนวโน้มที่จะปรับแต่งตัวเองเพื่อให้พวกเขาพูดในสิ่งเดียวกัน นี้เป็นหนึ่งในสิ่งที่ถูกกล่าวหาว่าสำหรับการเลือกตั้งจะเป็นเพื่อการละเมิดอย่างร้ายแรงออกในการสูญเสียความประหลาดใจเอริคคันทอร์ในปี 2014 และเพื่อให้ได้ผลลัพธ์ที่น่าแปลกใจอย่างใกล้ชิดของ2014 เวอร์จิเนียวุฒิสภาการแข่งขันได้เป็นอย่างดี

* - 538 ได้โพสต์การวิเคราะห์ของตนเองแล้ว มันส่วนใหญ่ jibes กับสิ่งที่กล่าวข้างต้น แต่มีมูลค่าการอ่านถ้าคุณต้องการรายละเอียดเพิ่มเติม


ตอนนี้การเก็งกำไรส่วนตัว จริง ๆ แล้วฉันสงสัยถึงโอกาส% 538 สุดท้ายในช่วง 3 วันที่ผ่านมา เหตุผลกลับไปที่กระสุนนัดที่สองด้านบน มาดูประวัติความเป็นมาของแบบจำลองสำหรับการเลือกตั้งครั้งนี้ (จากเว็บไซต์ของพวกเขา)

ป้อนคำอธิบายรูปภาพที่นี่

(น่าเศร้าฉลากปิดบังมัน แต่หลังจากนี้โค้งก็เบี่ยงเบนอีกครั้งในช่วงสามวันที่ผ่านมามีโอกาสมากกว่า 70% สำหรับคลินตัน)

รูปแบบที่เราเห็นที่นี่เป็นความแตกต่างซ้ำแล้วตามด้วยการสลายตัวกลับไปสู่การเป็นผู้นำของทรัมป์ ฟองคลินตันล้วน แต่เกิดจากเหตุการณ์ต่างๆ ประการแรกคือการประชุม (โดยปกติจะมีสองสามวันล่าช้าหลังจากเหตุการณ์เพื่อให้เริ่มปรากฏในการเลือกตั้ง) ครั้งที่สองดูเหมือนจะถูกเตะออกจากการอภิปรายครั้งแรกน่าจะช่วยด้วยเทป TMZ จากนั้นก็มีจุดเปลี่ยนจุดที่สามที่ฉันทำเครื่องหมายไว้ในภาพ

มันเกิดขึ้นในวันที่ 5 พฤศจิกายน 3 วันก่อนการเลือกตั้ง เหตุการณ์ใดทำให้เกิดสิ่งนี้ สองสามวันก่อนหน้านั้นเป็นการลุกลามของอีเมลอีกครั้ง แต่นั่นก็ไม่น่าจะเป็นประโยชน์กับคลินตัน

คำอธิบายที่ดีที่สุดที่ฉันสามารถทำได้ในตอนนั้นคือการสำรวจความคิดเห็นของกลุ่ม มันเป็นเพียง 3 วันก่อนการเลือกตั้ง 2 วันจนกว่าจะถึงการเลือกตั้งครั้งสุดท้ายและการสำรวจความคิดเห็นจะเริ่มกังวลเกี่ยวกับผลลัพธ์สุดท้ายของพวกเขา "ภูมิปัญญาดั้งเดิม" การเลือกตั้งครั้งนี้ทั้งหมด (ตามรูปแบบการเดิมพัน) เป็นชัยชนะที่ง่ายของคลินตัน ดังนั้นจึงมีความเป็นไปได้ที่ชัดเจนว่านี่ไม่ใช่การเบี่ยงเบนที่แท้จริงเลย หากเป็นเช่นนั้นเส้นโค้งจริงตั้งแต่วันที่ 5 พ.ย. เป็นต้นไปน่าจะเป็นความต่อเนื่องของอันนี้ไปสู่การบรรจบกัน

มันจะใช้เวลานักคณิตศาสตร์ที่ดีกว่าฉันที่จะประเมินโค้งไปข้างหน้านี่โดยไม่จุดโรคติดเชื้อนี้ที่น่าสงสัยสุดท้าย แต่ eyeballing มันผมคิดว่า8 พฤศจิกายนจะได้รับที่อยู่ใกล้กับจุดครอสโอเวอร์ ด้านหน้าหรือด้านหลังขึ้นอยู่กับว่าส่วนโค้งนั้นจริงหรือไม่

ตอนนี้ฉันไม่สามารถบอกได้ว่านี่คือสิ่งที่เกิดขึ้น มีคำอธิบายที่เป็นไปได้อื่น ๆ อีกมาก (เช่น: ทรัมป์ทำให้ผู้มีสิทธิเลือกตั้งของเขาออกไปได้ดีกว่าที่คนสำรวจความคิดเห็นคาดหวังไว้) แต่มันเป็นทฤษฎีของฉันสำหรับสิ่งที่เกิดขึ้นในเวลานั้น


1
ฉันคิดว่าการผันการหยั่งเสียงแบบโพลแปลก ๆ นี้ในช่วงสองสามวันที่ผ่านมาน่าจะวิเคราะห์ได้ดีกว่า แต่ผู้สนับสนุนคลินตันมองเห็นสิ่งที่พวกเขาต้องการเห็นและผู้สนับสนุนทรัมป์มีความยาว หวังว่าใครบางคนจะทำมันตอนนี้
TED

ฉันคิดว่าวันสุดท้ายเป็นปกติเล็กน้อยเนื่องจากคำแถลง Comey ว่าอีเมลใหม่ไม่ได้เป็นสาเหตุของการสอบสวนทางอาญาที่ได้รับการต่ออายุ
Konrad Rudolph

@ KonradRudolph - นั่นคือคำอธิบายที่ฉันได้ยินมาในตอนนั้น ปัญหาคือคำแถลงที่เป็นปัญหาไม่ได้ออกมาจนถึงวันที่ 6 พฤศจิกายนและจุดผันสัญญาณการลงคะแนนที่น่าสงสัยเกิดขึ้นหนึ่งวันก่อนหน้านี้ (ดูเครื่องหมายในภาพด้านบน) นอกจากนี้เวลายังไม่ถูกต้องสำหรับการที่ดร็อปถูกอธิบายโดยสิ้นเชิงดังนั้นจึงไม่มีเหตุผลที่สมเหตุสมผลที่คำสั่ง "ไม่เป็นไร" ของเขาจะหยุดมัน (หันไปรอบ ๆ น้อยกว่า)
TED

2
ปัญหาของ 538 นั้นไม่ใช่โมเดลของพวกเขามากนักเนื่องจากคุณภาพของข้อมูลการลงคะแนนที่เข้ามา ข้อมูลชัดเจนว่านี่ไม่ใช่กรณีของการสุ่มตัวอย่างข้อผิดพลาด (ซึ่งค่อนข้างเล็กเมื่อคุณสำรวจโดยเฉลี่ยว่าแต่ละคนมีขนาดตัวอย่างที่เหมาะสม) washparkprophet.blogspot.com/2016/11/what-polls-got-wrong.htmlแต่ปัญหาคือการสุ่มตัวอย่างแบบลำเอียงในการสำรวจความคิดเห็นของผู้มีส่วนได้ส่วนเสียหรือระบบไม่ซื่อสัตย์จากผู้ตอบแบบสอบถามโพล (หรือการไม่อนุมัติทางสังคมของทรัมป์) หรือ ทั้งสอง แต่ 538 ได้รับความรุ่งโรจน์สำหรับการรับรู้ในรูปแบบของพวกเขาที่สำรวจในรัฐต่าง ๆ ไม่เป็นอิสระ
ohwilleke

@ohwilleke - ถูกต้อง ในฐานะที่เป็นหนึ่งในคำตอบอื่น ๆ กล่าวว่า GIGO นั่นคือสิ่งที่ฉันคิดว่าน่าจะเกิดขึ้นกับจุดโรคติดเชื้อแปลก ๆ ที่ไม่สามารถอธิบายได้ คำถามคือที่มาของ "ขยะ" ในการสำรวจความคิดเห็น
TED

17

ครั้งแรกมันคือ Brexit ตอนนี้การเลือกตั้งสหรัฐ

ไม่ใช่ครั้งแรกจริง ๆ เช่นการเลือกตั้งประธานาธิบดีฝรั่งเศสปี 2545 "นำไปสู่การอภิปรายอย่างจริงจังเกี่ยวกับเทคนิคการลงคะแนนเลือกตั้ง"

ดังนั้นจึงไม่ใช่เรื่องที่ไกลเกินกว่าที่จะบอกว่าแบบจำลองเหล่านี้ทำงานได้ไม่ดีนัก

ขยะในขยะออก

ฉันเห็นคำอธิบายอย่างหนึ่งว่าผู้ลงคะแนนไม่เต็มใจที่จะระบุตัวเองว่าเป็นผู้สนับสนุนคนที่กล้าหาญ แบบจำลองสามารถรวมเอฟเฟกต์แบบนั้นได้อย่างไร

ดูอคติการตอบสนองและโดยเฉพาะอคติความปรารถนาทางสังคม ที่น่าสนใจอื่น ๆ อ่าน: เงียบส่วนใหญ่และมีผลแบรดลีย์


2
แน่นอนว่าขยะในถังขยะหมดแล้ว แต่คนเรารู้ได้อย่างไรว่าผู้ทำนายเป็นขยะและทำ "การเลือกตัวแปร" เพื่อขับรถของพวกเขา?
horaceT

6
@horaceT อย่างที่คุณเห็นนี่เป็นเรื่องยากมากและบางครั้งก็เป็นไปไม่ได้ FiveThirtyEight.comมีวิธีการที่เหมาะสมมากและโมเดลที่มีคุณภาพสูงโดยใช้ข้อมูลที่หลากหลายและการแก้ไขสำหรับหลายอคติ วันก่อนการเลือกตั้งจะให้โอกาส 71.4% ที่ฮิลารีคลินตันจะชนะ ...
ทิม

1
@horaceT ฉันจะมุ่งเน้นไปที่การรวบรวมข้อมูลเนื่องจากดูเหมือนว่าจะเป็นปัญหา หน้าอคติทางสังคมนั้นมีแนวคิดที่จะปรับปรุง
Franck Dernoncourt

1
@haceT ยิ่งกว่านั้นถ้าเกือบทุกสระพูดว่าคลินตันเป็นคนบ้าเท่านั้นที่จะเถียงว่าพวกเขาทุกคนผิด ... มันคงยากมากที่จะพิสูจน์รูปแบบดังกล่าว
ทิม

1
ฉันอยากรู้ว่าการทำนายผลของการลงคะแนนเสียงเลือกตั้งนั้นมีความถูกต้องเพียงใด (เช่นอิงจากข้อมูลประชากร) ฉันสามารถจินตนาการได้ว่าถ้ามีการสำรวจจำนวนมากที่คาดการณ์ว่า "การเป็นผู้นำที่สำคัญ" การยับยั้งผลิตภัณฑ์อาจถูกระงับ (เช่นคล้ายกับผลจากการสังเกตการณ์ )
GeoMatt22

12

แบบสำรวจความคิดเห็น USC / LA Times มีตัวเลขที่แม่นยำ พวกเขาคาดการณ์ว่าทรัมป์จะเป็นผู้นำ ดูการสำรวจของ USC / LA Times เห็นว่าการสำรวจอื่น ๆ พลาด: คลื่นของการสนับสนุนของทรัมป์

http://www.latimes.com/politics/la-na-pol-usc-latimes-poll-20161108-story.html

ป้อนคำอธิบายรูปภาพที่นี่

พวกเขามีตัวเลขที่แม่นยำสำหรับปี 2012 เช่นกัน

คุณอาจต้องการตรวจทาน: http://graphics.latimes.com/usc-presidential-poll-dashboard/

และนิวยอร์กไทม์สบ่นเรื่องน้ำหนักของพวกเขา http://www.nytimes.com/2016/10/13/upshot/how-one-19-year-old-illinois-man-is-distorting-national-polling-averages HTML

คำตอบของ LA Times: http://www.latimes.com/politics/la-na-pol-daybreak-poll-questions-20161013-snap-story.html


26
แบบสำรวจนี้มีทรัมป์ที่ชนะคะแนนความนิยม 3.2% แต่ดูเหมือนว่าคลินตันจะชนะ 0.1% ดังนั้นฉันไม่เห็นวิธีที่คุณสามารถพูดได้ว่าพวกเขามีตัวเลขที่ถูกต้อง
Winston Ewert

3
เพียงแค่ทราบเล็กน้อย - คุณคาดหวังว่าสถิติใด ๆจะอยู่ในระยะน้อยกว่า 3.2% ของหน้าต่างข้อผิดพลาดหรือไม่?
AnoE

9
ปัญหาเกี่ยวกับการสำรวจความคิดเห็นนี้เป็นตัวอย่างคือ 1) การสำรวจความคิดเห็นในสิ่งที่ผิด คะแนนความนิยมมีความสัมพันธ์กับการชนะฝ่ายประธาน แต่นั่นไม่ใช่วิธีการตัดสินใจ 2) มันมีท็อปไลน์ผิด คลินตันชนะในสิ่งที่วัดไม่ใช่ทรัมป์ 3) มันถูกปิดด้วยคะแนน 3ish ที่เหมือนกันส่วนใหญ่ของการสำรวจอื่น ๆ เป็นเพียงในทิศทางที่แตกต่างกัน
TED

5
... จริง ๆ แล้วดูเหมือนว่าคลินตันอาจจะเสร็จสิ้นก่อนที่ทรัมป์จะได้คะแนนความนิยมซึ่งหมายความว่าแบบสำรวจนี้ถูกปิดโดย 4 ไม่ใช่ 3 ดังนั้นในทางทฤษฎีแล้วโพลที่คล้ายกันซึ่งเธอชนะด้วย 3 คะแนน มีความแม่นยำมากกว่าสองเท่า (ปิดโดยเพียง 2 คะแนนมากกว่า 4)
TED

8
แบบสำรวจของ LA Times นั้นถูกต้องโดยอุบัติเหตุ : รถยกที่ถ่วงน้ำหนักอายุ 19 ปีลงคะแนนเสียงชนบทสีขาวที่มีน้ำหนักต่ำกว่าเกณฑ์
ทำเครื่องหมาย

11

ไม่มีการอ้างสิทธิ์ในที่สูงที่นี่ ฉันทำงานในสาขา (การติดตามและประเมินผล) ที่เต็มไปด้วย pseudo-science เหมือนกับวิทยาศาสตร์สังคมอื่น ๆ ที่คุณสามารถตั้งชื่อได้

แต่นี่คือข้อตกลงอุตสาหกรรมการสำรวจควรจะอยู่ใน 'วิกฤต' ในวันนี้เพราะมันมีการคาดการณ์การเลือกตั้งของสหรัฐผิดไปมากสังคมศาสตร์โดยทั่วไปมีการจำลองแบบ 'วิกฤติ' และย้อนกลับไปในปลายปี 2000 เรามีวิกฤตการเงินโลก ผู้ปฏิบัติงานบางคนเชื่อว่าอนุพันธ์ย่อยจำนองซับไพรม์เป็นรูปแบบที่ถูกต้องของข้อมูลทางการเงิน (ถ้าเราให้พวกเขาได้รับประโยชน์จากข้อสงสัย ... )

และเราทุกคนก็ผิดพลาดโดยไม่คำนึงถึง ทุกวันฉันเห็นคำถามที่น่าสงสัยที่สุดของผู้สร้างที่ใช้เป็นวิธีการรวบรวมข้อมูลและในที่สุดก็ใช้เป็นข้อมูล นักวิจัยน้อยมากดูเหมือนจะตระหนักว่าพวกเขาจำเป็นต้องมีกรอบความคิดสำหรับการสร้างดังกล่าวก่อนที่พวกเขาจะหวังว่าจะเข้าใจผลลัพธ์ของพวกเขา ราวกับว่าเราได้ดูแนวทางการวิจัยตลาดและตัดสินใจที่จะยอมรับความผิดพลาดที่เลวร้ายที่สุดของพวกเขาด้วยการเพิ่มตัวเลขเล็กน้อยที่ด้านข้าง

เราต้องการได้รับการพิจารณาว่าเป็น 'นักวิทยาศาสตร์' แต่ความยากลำบากนั้นยากเกินกว่าที่จะถูกรบกวนดังนั้นเราจึงรวบรวมข้อมูลขยะและอธิษฐานต่อเทพเจ้าแห่งสถิติโลกิเพื่อให้ได้มาซึ่งความจริงของ GIGO

แต่ในขณะที่ Mr Feynman อ้างถึงอย่างหนัก:

“ ไม่ว่าทฤษฎีของคุณจะสวยงามแค่ไหนไม่ว่าคุณจะฉลาดแค่ไหน ถ้ามันไม่เห็นด้วยกับการทดลองมันผิด”

มีวิธีที่ดีกว่าในการจัดการข้อมูลเชิงคุณภาพที่เรามักติดอยู่ แต่พวกเขาใช้เวลาทำงานเพิ่มขึ้นอีกเล็กน้อยและผู้สร้างที่ดีเหล่านี้มักจะง่ายต่อการป้อนเข้าสู่ SPSS ความสะดวกสบายดูเหมือนว่าจะเป็นศาสตร์แห่งความกล้าหาญทุกครั้ง (ไม่มีการเล่นสำนวน)

กล่าวโดยย่อถ้าเราไม่เริ่มจริงจังเกี่ยวกับคุณภาพของข้อมูลดิบฉันคิดว่าเรากำลังเสียเวลาและเงินของทุกคนรวมถึงของเราเองด้วย ดังนั้นใครก็ตามที่ต้องการร่วมมือใน 'ความคิดริเริ่มคุณภาพข้อมูล' ที่เกี่ยวข้องกับวิธีการทางสังคมศาสตร์ (ใช่มีหนังสือเกี่ยวกับสิ่งต่าง ๆ มากมาย แต่ดูเหมือนไม่มีใครสนใจแหล่งที่มาหลังจากการสอบ)

ใครก็ตามที่มีแรงดึงดูดทางวิชาการมากที่สุดจะเป็นผู้นำ! (ไม่ใช่ฉัน)

เพียงเพื่อให้ชัดเจนเกี่ยวกับคำตอบของฉันที่นี่: ฉันเห็นปัญหาพื้นฐานที่ร้ายแรงด้วยประเภทข้อมูลดิบ 'ที่ถูกประดิษฐ์' บ่อยครั้งที่ฉันอยากจะแนะนำความต้องการเริ่มต้นตั้งแต่ต้น ดังนั้นก่อนที่เราจะกังวลเกี่ยวกับการสุ่มตัวอย่างหรือการทดสอบใดที่จะรันบนข้อมูลเราจำเป็นต้องดูความถูกต้อง / ข้อ จำกัด ของประเภทข้อมูลที่เรารวบรวมเกี่ยวกับตัวแบบที่เรากำลังเสนอ มิฉะนั้นรูปแบบการทำนายโดยรวมจะถูกกำหนดอย่างไม่สมบูรณ์


2
ไกลแล้วฉันแน่ใจว่าคุณช่วยยกตัวอย่างนักวิจัยที่น่าสงสัยได้ไหม
horaceT

4
ฉันไม่เห็นด้วยกับประเด็นของคุณมากมาย แต่ฉันต้องการชี้ให้เห็นว่าในกรณีของการสำรวจฉันคิดว่าผู้สำรวจความคิดเห็นทุกคนตระหนักถึงข้อ จำกัด อันเนื่องมาจากคุณภาพของข้อมูล แต่ไม่มีตัวเลือกใด ๆ ในการปรับปรุง (ดูคำตอบของฉัน) ดูเหมือนว่าคำตอบของคุณจะแนะนำว่าการสำรวจความคิดเห็นต้องการผลักดันคำตอบใด ๆไม่ใช่ใส่ใจเกี่ยวกับคุณภาพของข้อมูล ผมคิดว่า pollster ดูแลมากเกี่ยวกับข้อมูลที่มีคุณภาพ แต่ยังตระหนักดีว่าการที่ดีที่สุดที่พวกเขาได้รับมีข้อบกพร่องที่อาจเกิดขึ้นอย่างจริงจัง คุณยอมแพ้ ("50% -50%!") หรือพยายามสร้างบางสิ่งที่อาจสมเหตุสมผลหรือไม่
หน้าผา AB

การตอบสนองต่อความคิดเห็นของฉันอาจยาวไปหน่อยดังนั้นให้เพิ่มเป็นคำตอบใหม่
colin

9

การสำรวจความคิดเห็นมีแนวโน้มที่จะเกิดข้อผิดพลาด 5% ที่คุณไม่สามารถกำจัดได้จริง ๆ เพราะไม่ใช่ข้อผิดพลาดแบบสุ่ม แต่มีอคติ แม้ว่าคุณจะเฉลี่ยในการสำรวจจำนวนมาก แต่ก็ไม่ได้ดีขึ้นมาก สิ่งนี้เกี่ยวข้องกับกลุ่มผู้มีสิทธิเลือกตั้งที่ไม่ถูกต้องไม่มีการระดมพลไม่สามารถไปลงคะแนนเสียงในวันทำงานไม่เต็มใจที่จะตอบไม่เต็มใจที่จะตอบถูกต้องตัดสินใจนาทีสุดท้ายเอง ... เพราะอคตินี้มีแนวโน้มที่จะ "สัมพันธ์" ในการสำรวจคุณไม่สามารถกำจัดมันได้ด้วยการสำรวจเพิ่มเติม คุณไม่สามารถกำจัดมันด้วยขนาดตัวอย่างที่ใหญ่ขึ้น และคุณดูเหมือนจะไม่สามารถทำนายอคตินี้ได้เพราะมันเปลี่ยนแปลงเร็วเกินไป (และเราเลือกประธานาธิบดีน้อยเกินไป)

เนื่องจากหลักการผู้ชนะที่โง่ - ทั้งหมด - ยังคงอยู่ในเกือบทุกรัฐข้อผิดพลาด 5% สามารถทำให้เกิดผลลัพธ์ที่แตกต่างกันมาก: สมมติว่าการสำรวจคาดการณ์เสมอ 49-51 แต่ผลลัพธ์ที่แท้จริงคือ 51-49 (ดังนั้นข้อผิดพลาดของ เพียง 2%) ผลลัพธ์จะปิด 100%; เพราะผู้ชนะ - ใช้ - มัน - ทั้งหมด

หากคุณดูที่แต่ละรัฐผลลัพธ์ส่วนใหญ่จะอยู่ในระยะขอบผิดพลาดที่คาดการณ์ไว้!

อาจดีที่สุดที่คุณสามารถทำได้คือตัวอย่างอคตินี้ (+ -5%), ใช้สุดขั้วผู้ชนะใช้เวลาทั้งหมดจากนั้นรวมผลลัพธ์ นี่อาจคล้ายกับสิ่งที่ 538 ทำ และ 30% ของตัวอย่าง Donald Trump ชนะ ...


9
ฉันเรียกสิ่งนี้ว่า "หลักการคนบ้า" ของการสำรวจ: ในคำถามแบบสำรวจใด ๆ 5% ของผู้ตอบแบบสอบถามทั้งหมดจะให้คำตอบที่บ้า เช่นเดียวกับหลักการเชิงประจักษ์ใด ๆ ที่มีข้อยกเว้น แต่มันยืนขึ้นได้ดีมานานหลายทศวรรษในการช่วยให้ผลการสำรวจความคิดเห็น
whuber

1
ถ้ามันเป็นเพียงคำตอบที่ "บ้า" ปัญหาคือมันไม่เป็นระบบ "สุ่มบ้า" คุณสามารถพิจารณาการเลือกตั้งแบบสำรวจความคิดเห็นแบบไบนารี่และ "คำตอบบ้า" ที่คุณคาดหวังในแบบไบนารี่คืออะไร? แต่เห็นได้ชัดว่าผู้คนจำนวนมากจงใจ (?) ให้คำตอบที่ผิดหรือตัดสินใจแตกต่างกันเมื่อจริง ๆ ในบูธหรือไม่ไปเลือกตั้ง ...
Anony-Mousse

3
@ Anony-Mousse ไม่ว่าจะแม่นยำหรือไม่ก็ตามฉันไม่เห็นว่าการเรียกชื่อเด็กและเยาวชนนั้นเกี่ยวข้องกับการวิเคราะห์ทางสถิติอย่างไร
Jared Smith

โอ้มันเป็นเรื่องที่หาค่ามิได้ ในบางวันคุณต้องหัวเราะมากกว่าที่จะกังวลว่าทำไมผลการทำนายจึงไม่ถูกต้อง
Anony-Mousse

ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
gung

7

400,000

ในท้ายที่สุดมันเปิดเผยความล้มเหลวของการวิเคราะห์เชิงตัวเลขเพื่อชดเชยการขาดความรู้ในเรื่อง ผู้คนต่างก็ละอายใจที่จะยอมรับผู้สมัครที่ชนะอย่างชัดเจนด้วยเหตุผลที่ชัดเจน

แบบจำลองคอมพิวเตอร์ที่เลวร้ายที่สุดอาจเข้าใกล้ผลลัพธ์ได้มากขึ้นหากมีใครสนใจที่จะทำการสำรวจแบบตัวต่อตัวโดยการเคาะประตู นี่คือตัวอย่าง: กลุ่มทราฟัลการ์ (ไม่มีส่วนเกี่ยวข้องหรือความรู้ใด ๆ นอกจากสิ่งต่อไปนี้) ทรัมป์เป็นผู้นำใน PA, FL, MI, GA, UT และ NV (สถานะหลังนี้เป็นสีน้ำเงินในที่สุด) หนึ่งวันก่อนการเลือกตั้ง เวทมนตร์คืออะไร?

การรวมกันของผู้ตอบแบบสำรวจทั้งแบบทดสอบการลงคะแนนแบบมาตรฐานและแบบทดสอบการลงคะแนนแบบ [sic] ที่เพื่อนบ้านของผู้ตอบแบบสำรวจยืน สิ่งนี้กล่าวถึงอคติพื้นฐานของการลงคะแนนเสียงเลือกตั้งแบบดั้งเดิมซึ่งผู้ตอบแบบสอบถามไม่เป็นความจริงอย่างสมบูรณ์เกี่ยวกับตำแหน่งของพวกเขาเกี่ยวกับผู้สมัครที่มีความขัดแย้งสูง

เทคโนโลยีต่ำที่น่ารักรวมถึงการขาดการตรวจสอบการสะกดคำแสดงให้เห็นเป็นจำนวนมากเกี่ยวกับธรรมชาติของมนุษย์ นี่คือความแตกต่างใน PA :

ป้อนคำอธิบายรูปภาพที่นี่

ประวัติศาสตร์เพนซิลเวเนีย - ไกลจากการถูกมองว่าเป็นฟางเส้นสุดท้ายในความพ่ายแพ้ของประชาธิปไตยเพียงไม่กี่ชั่วโมงก่อนที่จะปิดการรับรู้นี้เวลา 1:40 น. เมื่อวันที่ 9 พฤศจิกายน 2016:

ป้อนคำอธิบายรูปภาพที่นี่


2
การถามเกี่ยวกับความตั้งใจในการลงคะแนนเสียงของเพื่อนบ้านนั้นยอดเยี่ยมมาก - บางครั้งฉันก็ใช้กลอุบายที่ชาญฉลาดซึ่งบางครั้งใช้ในสถิติซึ่งอนุญาตให้ทำการแก้ไข (อย่างน้อยก็ระดับ) อย่างน้อยสำหรับความลำเอียงที่สิ้นหวัง ขอบคุณที่เขียนเกี่ยวกับเรื่องนี้น่าสนใจมาก!
DeltaIV

5

หนึ่งในเหตุผลของการสำรวจความคิดเห็นที่ไม่ถูกต้องในการเลือกตั้งสหรัฐนอกจากคนบางคนด้วยเหตุผลใดก็ตามที่ไม่ได้พูดความจริงก็คือผลของ "ผู้ชนะจะได้ผลทั้งหมด" ทำให้การคาดการณ์ง่ายขึ้น ความแตกต่าง 1% ในหนึ่งรัฐสามารถนำไปสู่การเปลี่ยนแปลงที่สมบูรณ์ของรัฐและมีอิทธิพลต่อผลลัพธ์ทั้งหมดอย่างมาก ฮิลลารีมีผู้ลงคะแนนมากขึ้นเช่นเดียวกับอัลกอร์ vs บุช

การลงประชามติของ Brexit ไม่ใช่การเลือกตั้งตามปกติดังนั้นจึงยากที่จะคาดการณ์ (ไม่มีข้อมูลทางประวัติศาสตร์ที่ดีและทุกคนเป็นเหมือนผู้มีสิทธิเลือกตั้งครั้งแรกในเรื่องนี้) คนที่ลงคะแนนให้พรรคเดียวกันมาหลายสิบปีทำนายการทรงตัว


2
การสังเกตที่ดีมาก มีสถานะที่ชัดเจนสำหรับแต่ละด้านและสถานะการแกว่ง ในขณะที่จำนวนของพวกเขาอยู่ในระดับต่ำผลกระทบต่อการเปลี่ยนแปลงเล็กน้อยมีจำนวนคะแนนเสียง มันเป็นรูปแบบการลงคะแนนที่ซับซ้อนมากในอดีตในสหรัฐอเมริกา
Trilarion

4

(เพียงแค่ตอบ bit นี้เนื่องจากคำตอบอื่น ๆ ดูเหมือนจะครอบคลุมทุกอย่างอื่น)

ดึกแค่สี่ทุ่ม PST เมื่อวานนี้ตลาดการเดิมพันยังคงเป็นที่นิยมของฮิลลารี 4 ต่อ 1 ฉันคิดว่าตลาดการเดิมพันด้วยเงินจริงในบรรทัดควรทำหน้าที่เป็นชุดของแบบจำลองการทำนายทั้งหมดที่มีอยู่

ไม่ใช่ ... แต่โดยอ้อมใช่

ตลาดการเดิมพันได้รับการออกแบบเพื่อให้ผู้รับพนันสามารถทำกำไรได้ไม่ว่าจะเกิดอะไรขึ้น เช่นพูดว่าอัตราต่อรองปัจจุบันที่อ้างถึงคือ 1-4 ในฮิลารีและ 3-1 สำหรับทรัมป์ หากผู้เล่น10 คนถัดไปทั้งหมดเดิมพัน$ 10 บนฮิลลารีการเดิมพันที่$ 100 จะเท่ากับ$ 25 หากฮิลารีชนะ ดังนั้นพวกเขาจึงลดฮิลารีลงเหลือ 1-5 และเพิ่มทรัมป์เป็น 4-1 ตอนนี้ผู้คนมากขึ้นเดิมพันกับทรัมป์และคืนค่าสมดุล นั่นคือขึ้นอยู่กับว่าผู้คนเดิมพันอย่างไรไม่ใช่ผู้เชี่ยวชาญหรือรุ่นทำนายผล

แต่แน่นอนว่าลูกค้าของเจ้ามือรับแทงม้ามองไปที่การสำรวจความคิดเห็นเหล่านั้นและฟังเกจิเหล่านั้น พวกเขาได้ยินมาว่าฮิลารีอยู่ข้างหน้า 3% ซึ่งเป็นใบรับรองที่จะชนะและตัดสินใจว่าจะทำเงินให้ได้$ 10 คือการเดิมพัน$ 40

เกจิและการสำรวจทางอ้อมกำลังขยับราคา

(บางคนสังเกตเห็นว่าเพื่อน ๆ ทุกคนในที่ทำงานกำลังจะลงคะแนนเสียงให้ทรัมป์ดังนั้นจึงควรเดิมพันกับเขาคนอื่น ๆ สังเกตว่าโพสต์ของเพื่อนใน Facebook ทั้งหมดเป็นโปรฮิลลารีดังนั้นจึงควรเดิมพันกับเธอ ในวิธีนั้น)


2

ไม่น่าแปลกใจที่ความพยายามเหล่านี้ล้มเหลวเมื่อคุณพิจารณาความแตกต่างระหว่างข้อมูลที่แบบจำลองมีการเข้าถึงและข้อมูลใดที่ขับเคลื่อนพฤติกรรมที่บูธการสำรวจ ฉันคาดเดา แต่รุ่นอาจคำนึงถึง:

  • ความหลากหลายของผลการเลือกตั้งล่วงหน้า
  • การเอียงของสถานะในอดีต (สีน้ำเงิน / แดง)
  • ผลลัพธ์ทางประวัติศาสตร์ของการเลือกตั้งครั้งก่อนด้วยกระแสโน้มเอียง / การคาดการณ์ของรัฐในปัจจุบัน

แต่การเลือกตั้งล่วงหน้านั้นไม่น่าเชื่อถือ (เราเคยเห็นความล้มเหลวอย่างต่อเนื่องในอดีต) รัฐสามารถพลิกกลับและมีวงจรการเลือกตั้งไม่เพียงพอในประวัติศาสตร์ของเราที่จะพิจารณาสถานการณ์ที่หลากหลายและสามารถทำได้ .

ภาวะแทรกซ้อนก็คือการรวมกันของคะแนนความนิยมกับวิทยาลัยการเลือกตั้ง อย่างที่เราเห็นในการเลือกตั้งครั้งนี้การโหวตที่ได้รับความนิยมอาจอยู่ใกล้ภายในรัฐ แต่เมื่อชนะการโหวตแล้วการโหวตทั้งหมดจะถูกส่งไปยังผู้สมัครหนึ่งคนซึ่งเป็นสาเหตุที่ทำให้แผนที่มีสีแดงมาก


1

แบบสำรวจความคิดเห็นไม่ได้พิจารณาว่าเสรีนิยมจำนวนมากอาจเปลี่ยนจากจอห์นสันเป็นทรัมป์เมื่อมาถึงการลงคะแนนจริง รัฐที่ชนะโดยมีกำไรเพียงเล็กน้อยนั้นขึ้นอยู่กับเปอร์เซ็นต์ของคะแนนเสียงที่จอห์นสันได้รับ PA (ซึ่งผลักดันให้ทรัมป์ผ่าน 270 ในคืนวันเลือกตั้ง) มอบเพียง 2% ให้แก่จอห์นสัน NH (ซึ่งไปที่ Clinton) ให้ 4% + แก่ Johnson จอห์นสันลงคะแนนไว้ที่ 4% -5% ในวันก่อนการเลือกตั้งและเขาได้ประมาณ 3% ในวันเลือกตั้ง

ดังนั้นทำไมพวกเสรีนิยมจึงเปลี่ยนมาทำงานในวันเลือกตั้ง? ไม่มีใครคิดว่าประเด็นสำคัญสำหรับผู้ลงคะแนนเสรีนิยมคืออะไร พวกเขามีแนวโน้มที่จะตีความรัฐธรรมนูญตามตัวอักษรอย่างแท้จริง คนส่วนใหญ่ที่ลงคะแนนให้คลินตันไม่คิดว่าการเพิกเฉยต่อกฎหมายของเธอนั้นเป็นเรื่องที่มีความสำคัญสูงพอที่จะพิจารณา แน่นอนไม่สูงกว่าทุกสิ่งที่พวกเขาไม่ชอบเกี่ยวกับทรัมป์

ไม่ว่าปัญหาทางกฎหมายของเธอจะสำคัญหรือไม่ต่อผู้อื่นพวกเขาก็จะมีความสำคัญต่อเสรีนิยม พวกเขาจะให้ความสำคัญกับการไม่ให้ใครก็ตามที่มองว่าการปฏิบัติตามกฎหมายเป็นสิ่งสำคัญที่สุด ดังนั้นสำหรับพวกเขาจำนวนมากการทำให้คลินตันพ้นจากตำแหน่งจะกลายเป็นลำดับความสำคัญที่สูงกว่าการกล่าวว่าปรัชญาเสรีนิยมเป็นปรัชญาทางการเมืองที่เป็นไปได้

หลายคนอาจไม่ชอบทรัมป์ แต่ถ้าพวกเขาคิดว่าเขาจะเคารพหลักนิติธรรมมากกว่าคลินตันการปฏิบัตินิยมจะได้รับชัยชนะเหนือหลักการสำหรับพวกเขาจำนวนมากและทำให้พวกเขาเปลี่ยนการโหวตเมื่อมัน ถึงเวลาที่จะลงคะแนนจริง


NH มีผู้คนทั้งหมดจากโครงการรัฐอิสระที่อาศัยอยู่ที่นั่น ปาร์ตี้เสรีและผู้สนับสนุนที่กำลังเฟื่องฟู
จอห์น

@John, NH Libertarians ติดอยู่กับ Johnson (4%) ทรัมป์สูญเสียสถานะ 1%
Dmitry Rubanovich

ฉันเข้าใจ. ฉันพยายามอธิบายว่าพรรคเสรีนิยมเข้มแข็งในนิวแฮมป์เชียร์
จอห์น

@John แต่มันไม่ใช่แค่ NH มินนิโซตา: จอห์นสัน 4%, ทรัมป์แพ้ 2%; NV (เป็นเรื่องยากกว่าที่จะทำ แต่ก็ยังมีแนวโน้ม): จอห์นสัน 3.5%, ทรัมป์หายไป 2%; เมน: จอห์นสัน 5%, ทรัมป์แพ้ 3%; โคโลราโดจอห์นสัน 5% ทรัมป์สูญเสีย 3%
Dmitry Rubanovich

ในการสำรวจถามเกี่ยวกับการเปลี่ยนเป็นไปได้โหวตและการคาดการณ์คำนึงถึง คุณมีข้อมูลใด ๆ ที่แสดงให้เห็นว่าก่อนการเลือกตั้งมีข้อมูลใด ๆ ที่ไม่ได้นำมาพิจารณาโดยการคาดการณ์หรือนี่เป็นการคาดเดาที่บริสุทธิ์หรือไม่?
ทิม

1

โพลไม่ใช่แนวโน้มทางประวัติศาสตร์ ชาวเบย์จะสอบถามเกี่ยวกับแนวโน้มทางประวัติศาสตร์ ตั้งแต่อับราฮัมลินคอล์นมีพรรครีพับลิกันและพรรคประชาธิปัตย์ที่ดำรงตำแหน่งประธานาธิบดี แนวโน้มของพรรคเปลี่ยน 16 ครั้งตั้งแต่นั้นมาจากวิกิพีเดียมีฟังก์ชันมวลรวมดังต่อไปนี้

ป้อนคำอธิบายรูปภาพที่นี่

x

สิ่งที่ทำให้นักข่าวพรรคประชาธิปัตย์และผู้สำรวจความคิดเห็นคิดว่าอัตราต่อรองเป็นไปเพื่อประโยชน์ของการชนะเสรีนิยมบางทีอาจเป็นความคิดที่ปรารถนา พฤติกรรมที่สามารถคาดการณ์ได้ภายในขอบเขต แต่ในกรณีนี้พรรคเดโมแครตหวังว่าคนจะไม่ลงคะแนนสำหรับการเปลี่ยนแปลงและจากมุมมองทางประวัติศาสตร์ดูเหมือนว่ามีแนวโน้มว่าจะมีมากกว่าหนึ่ง


0

ฉันคิดว่าผลลัพธ์ของการสำรวจความคิดเห็นมีการคาดการณ์ในระดับที่ประชาชนสมมติว่าข้อมูลประชากรของผู้ลงคะแนนเสียงจะคล้ายกับข้อมูลประชากรของผู้สำรวจความคิดเห็นและจะเป็นตัวแทนที่ดีของประชากรทั้งหมด ตัวอย่างเช่นหาก 7 ใน 10 ของชนกลุ่มน้อยสนับสนุนฮิลลารีในโพลและหากชนกลุ่มน้อยนั้นเป็นตัวแทน 30% ของประชากรสหรัฐการสำรวจความคิดเห็นส่วนใหญ่ถือว่า 30% ของผู้ลงคะแนนจะถูกแทนด้วยเสียงข้างน้อยนั้นและแปลเป็น 21% สำหรับ ฮิลลารี ในความเป็นจริงผู้ชายผิวขาวชนชั้นกลางถึงบนเป็นตัวแทนที่ดีกว่าในหมู่ผู้มีสิทธิเลือกตั้ง น้อยกว่า 50% ของผู้มีสิทธิ์ลงคะแนนและสิ่งนี้ไม่ได้แปลเป็น 50% จากเพศทุกเชื้อชาติ ฯลฯ

หรือแบบสำรวจสันนิษฐานว่าสมบูรณ์แบบการสุ่มและตามแบบจำลองของพวกเขา แต่ในความเป็นจริงแล้วข้อมูลผู้มีสิทธิเลือกตั้งถูกเอนเอียงไปทางเพศชายวัยกลางถึงชั้นสูง

หรือการสำรวจไม่ได้สันนิษฐานว่าสมบูรณ์แบบสุ่ม แต่พารามิเตอร์การคาดการณ์ของพวกเขาต่ำกว่าความต่างของประชากรผู้มีสิทธิเลือกตั้ง

การทางพิเศษแห่งประเทศไทย: โพลของการเลือกตั้งสองครั้งก่อนหน้านั้นทำได้ดีกว่าเนื่องจากความสนใจที่เพิ่มขึ้นในการลงคะแนนโดยกลุ่มที่ไม่ได้เป็นตัวแทนที่ดี


เท่าที่ฉันทราบการสำรวจทั้งหมดจะใช้การคาดการณ์ของพวกเขาใน ฉันไม่สามารถจินตนาการการสำรวจความคิดเห็นที่ถือว่าอายุ 20 ปีมีโอกาสเดียวที่จะลงคะแนนเมื่ออายุ 70 ​​ปี ศูนย์กลางดูเหมือนว่าปัญหาจะเกิดขึ้นมากแค่ไหนที่มีคนโหวต?
dimpol

การบัญชีสำหรับข้อมูลประชากรเป็นส่วนที่ง่ายที่สุด คุณเพิ่งชั่งน้ำหนักประชากรตัวอย่างของคุณกับประชากรจริง การบัญชีสำหรับผู้มีสิทธิเลือกตั้งหันออกและอคติที่กล่าวถึงในคำตอบอื่น ๆ เป็นเรื่องยากมาก
Graipher

มีความหลากหลายในวิธีการที่ผู้โพลแก้ไขปัญหาเหล่านี้ การปรับสมดุลทางประชากรศาสตร์หรือการปรับสมดุลบางอย่างขึ้นอยู่กับการเป็นพันธมิตร แต่เนื่องจากมีการเปลี่ยนแปลงในแบบจำลองที่ใช้ค่าเฉลี่ยการสำรวจผลลัพธ์ที่ได้ควรมีความแข็งแกร่งต่อปัญหาโดยเฉพาะอย่างยิ่งกับวิธีการหนึ่งในการทำเช่นนี้ซึ่งไม่ได้ถูกใช้ร่วมกันโดยการสำรวจอื่น ๆ โดยเฉพาะอย่างยิ่งหลังจากการควบคุม การดำเนินการสำรวจ ปัญหาในผลลัพธ์โพลโดยเฉลี่ยนั้นมาจากวิธีการหรือผลกระทบที่ใช้ร่วมกันไม่ใช่วิธีการเฉพาะสำหรับแต่ละโพล
ohwilleke

0

HoraceT และ CliffAB (ขออภัยนานเกินไปสำหรับความคิดเห็น) ฉันกลัวว่าฉันมีตัวอย่างตลอดชีวิตซึ่งสอนฉันด้วยว่าฉันต้องระวังคำอธิบายของพวกเขาอย่างระมัดระวังหากฉันต้องการหลีกเลี่ยงผู้คนที่กระทำผิด ดังนั้นในขณะที่ฉันไม่ต้องการปล่อยตัวคุณฉันขอความอดทนของคุณ ไปที่นี่:

ในการเริ่มต้นด้วยตัวอย่างสุดขั้วฉันเคยเห็นคำถามสำรวจที่เสนอให้ถามเกษตรกรหมู่บ้านที่ไม่มีการศึกษา (เอเชียตะวันออกเฉียงใต้) เพื่อประเมิน 'อัตราผลตอบแทนทางเศรษฐกิจ' ของพวกเขา ออกจากตัวเลือกการตอบกลับไปตอนนี้เราหวังว่าทุกคนจะเห็นว่านี่เป็นเรื่องโง่ที่ต้องทำ แต่อธิบายอย่างสม่ำเสมอว่าทำไมมันถึงโง่ไม่ใช่เรื่องง่าย ใช่เราสามารถพูดได้ว่ามันโง่เพราะผู้ตอบไม่เข้าใจคำถามและเพียงแค่เลิกเป็นปัญหาความหมาย แต่นี่ไม่ดีพอในบริบทการวิจัย ความจริงที่ว่าคำถามนี้เคยเสนอแนะหมายความว่านักวิจัยมีความแปรปรวนโดยธรรมชาติในสิ่งที่พวกเขาคิดว่า 'โง่' เพื่อแก้ไขปัญหานี้อย่างเป็นกลางมากขึ้นเราต้องถอยกลับและประกาศกรอบที่เกี่ยวข้องเพื่อการตัดสินใจเกี่ยวกับสิ่งต่าง ๆ อย่างโปร่งใส มีตัวเลือกมากมายเช่น

สมมุติว่าเรามีข้อมูลพื้นฐานสองประเภทที่เราสามารถใช้ในการวิเคราะห์: เชิงคุณภาพและเชิงปริมาณ และทั้งสองนั้นมีความสัมพันธ์กันโดยกระบวนการเปลี่ยนแปลงเช่นข้อมูลเชิงปริมาณทั้งหมดเริ่มต้นจากข้อมูลเชิงคุณภาพ แต่ได้ผ่านขั้นตอนต่อไปนี้

  1. การตั้งค่าการประชุม (เช่นเราทุกคนตัดสินใจว่า [โดยไม่คำนึงถึงวิธีการที่เรารับรู้เป็นรายบุคคล] ว่าเราทุกคนจะเรียกสีของท้องฟ้าเปิดกลางวัน "ฟ้า")
  2. การจัดประเภท (เช่นเราประเมินทุกสิ่งในห้องโดยการประชุมนี้และแยกรายการทั้งหมดออกเป็นหมวดหมู่ 'สีน้ำเงิน' หรือ 'ไม่ใช่สีฟ้า')
  3. นับ (เรานับ / ตรวจจับ 'ปริมาณ' ของสิ่งสีน้ำเงินในห้อง)

โปรดทราบว่า (ภายใต้รุ่นนี้) โดยไม่มีขั้นตอนที่ 1 ไม่มีสิ่งที่มีคุณภาพและถ้าคุณไม่ได้เริ่มต้นด้วยขั้นตอนที่ 1 คุณจะไม่สามารถสร้างปริมาณที่มีความหมายได้

เมื่อระบุไว้ทั้งหมดนี้ก็ดูชัดเจน แต่เป็นชุดแรกของหลักการที่ (ฉันพบ) มักถูกมองข้ามมากที่สุดและส่งผลให้ 'Garbage-In'

ดังนั้น 'ความโง่เขลา' ในตัวอย่างข้างต้นจึงกลายเป็นคำจำกัดความที่ชัดเจนอย่างชัดเจนว่าเป็นความล้มเหลวในการกำหนดแบบแผนร่วมกันระหว่างนักวิจัยและผู้ตอบแบบสอบถาม แน่นอนว่านี่เป็นตัวอย่างที่ดี แต่ความผิดพลาดที่ลึกซึ้งยิ่งกว่านั้นก็สามารถสร้างขยะได้อย่างเท่าเทียมกัน อีกตัวอย่างหนึ่งที่ฉันเห็นคือการสำรวจของเกษตรกรในโซมาเลียที่ถามว่า“ การเปลี่ยนแปลงสภาพภูมิอากาศส่งผลกระทบต่อการดำรงชีวิตของคุณอย่างไร?” อีกทางเลือกหนึ่งในการตอบสนองกันในขณะนี้ฉันขอแนะนำว่า สหรัฐอเมริกาจะเป็นความล้มเหลวที่ร้ายแรงในการใช้การประชุมร่วมกันระหว่างนักวิจัยและผู้ตอบแบบสอบถาม (กล่าวคือสิ่งที่ถูกวัดว่า 'การเปลี่ยนแปลงสภาพภูมิอากาศ')

ทีนี้มาดูตัวเลือกการตอบกลับกัน ด้วยการอนุญาตให้ผู้ตอบตอบการตอบสนองด้วยตนเองจากชุดของตัวเลือกหลายตัวเลือกหรือโครงสร้างที่คล้ายกันคุณกำลังผลักดันปัญหา 'การประชุม' นี้ในแง่มุมของการตั้งคำถามนี้เช่นกัน สิ่งนี้อาจใช้ได้ถ้าเรายึดถืออนุสัญญา 'สากล' อย่างมีประสิทธิภาพในหมวดการตอบสนอง (เช่นคำถาม: คุณอยู่เมืองใดในหมวดการตอบสนอง: รายชื่อเมืองทั้งหมดในพื้นที่วิจัย [บวก 'ไม่อยู่ในพื้นที่นี้']) อย่างไรก็ตามนักวิจัยหลายคนดูเหมือนจะภูมิใจในความละเอียดอ่อนของคำถามและหมวดหมู่การตอบสนองเพื่อตอบสนองความต้องการของพวกเขา ในการสำรวจเดียวกันกับคำถาม 'อัตราผลตอบแทนทางเศรษฐกิจ' ปรากฏขึ้นนักวิจัยยังได้ถามผู้ตอบแบบสอบถาม (ชาวบ้านที่ยากจน) เพื่อให้ภาคเศรษฐกิจที่พวกเขาสนับสนุน: ด้วยหมวดการตอบสนองของ 'การผลิต', 'บริการ' 'การผลิต' และ 'การตลาด' ปัญหาการประชุมเชิงคุณภาพอีกครั้งเกิดขึ้นที่นี่อย่างชัดเจน อย่างไรก็ตามเนื่องจากเขาได้ทำคำตอบที่ไม่เหมือนกันซึ่งผู้ตอบแบบสอบถามสามารถเลือกได้เพียงทางเลือกเดียวเท่านั้น (เพราะ“ ง่ายกว่าที่จะป้อนเข้าสู่ SPSS ด้วยวิธีนี้”) และเกษตรกรในหมู่บ้านมักผลิตพืชผลขายแรงงานผลิตหัตถกรรม ตลาดท้องถิ่นของตัวเองนักวิจัยเฉพาะนี้ไม่เพียง แต่มีปัญหาในการประชุมกับผู้ตอบแบบสอบถามเท่านั้น

นี่คือเหตุผลที่บอร์สต์เก่าอย่างฉันมักจะแนะนำวิธีการทำงานที่เข้มข้นมากขึ้นในการประยุกต์ใช้การเข้ารหัสกับข้อมูลหลังการรวบรวมเพราะอย่างน้อยคุณก็สามารถฝึกอบรมโคเดอร์ได้อย่างเพียงพอในการประชุมที่จัดขึ้นโดยนักวิจัย คำแนะนำในการสำรวจ 'เป็นเกมของ mug - เพียง แต่เชื่อใจฉันในเกมนี้) โปรดทราบด้วยว่าหากคุณยอมรับ 'โมเดลข้อมูล' ข้างต้น (ซึ่งอีกครั้งฉันไม่ได้อ้างว่าคุณต้องทำ) ก็แสดงให้เห็นว่าทำไมเครื่องชั่งตอบรับเสมือนจริงมีชื่อเสียงไม่ดี มันไม่ได้เป็นเพียงปัญหาทางคณิตศาสตร์ขั้นพื้นฐานภายใต้การประชุมของสตีเวน (เช่นคุณต้องกำหนดต้นกำเนิดที่มีความหมายแม้สำหรับเลขลำดับคุณไม่สามารถเพิ่มและหาค่าเฉลี่ยพวกมัน ฯลฯ ฯลฯ ) มันก็ยังเป็นสิ่งที่พวกเขาไม่เคยได้รับการประกาศอย่างโปร่งใสและมีเหตุผลกระบวนการเปลี่ยนแปลงที่สอดคล้องกับเหตุผลที่จะจำนวนของ 'ปริมาณ' (เช่นรุ่นขยายของรูปแบบที่ใช้ข้างต้นที่ยังครอบคลุมรุ่น 'ปริมาณปริมาณ' [- ไม่ยาก ทำ]). อย่างไรก็ตามหากไม่เป็นไปตามข้อกำหนดของการเป็นข้อมูลเชิงคุณภาพหรือเชิงปริมาณผู้วิจัยก็อ้างว่าได้ค้นพบข้อมูลชนิดใหม่นอกกรอบการทำงานดังนั้นความรับผิดชอบของพวกเขาก็คือการอธิบายแนวคิดพื้นฐานพื้นฐานอย่างสมบูรณ์ ( ie กำหนดกรอบงานใหม่อย่างโปร่งใส)

ในที่สุดเรามาดูปัญหาการสุ่มตัวอย่าง (และฉันคิดว่านี่สอดคล้องกับคำตอบอื่น ๆ ที่นี่แล้ว) ตัวอย่างเช่นหากนักวิจัยต้องการใช้แบบแผนของสิ่งที่ถือเป็นการลงคะแนนเสียงแบบ 'เสรีนิยม' พวกเขาต้องแน่ใจว่าข้อมูลทางประชากรศาสตร์ที่พวกเขาใช้ในการเลือกระบอบการสุ่มตัวอย่างนั้นสอดคล้องกับอนุสัญญานี้ ระดับนี้มักจะง่ายที่สุดในการระบุและจัดการกับเนื่องจากส่วนใหญ่อยู่ในการควบคุมนักวิจัยและส่วนใหญ่มักจะเป็นประเภทของการประชุมเชิงคุณภาพสันนิษฐานที่มีการประกาศอย่างโปร่งใสในการวิจัย นี่คือสาเหตุที่เป็นระดับที่มักจะกล่าวถึงหรือวิพากษ์วิจารณ์ในขณะที่ปัญหาพื้นฐานมากขึ้นไปไม่ได้รับการแก้ไข

ดังนั้นในขณะที่เจ้าหน้าที่ตำรวจติดคำถามเช่น 'คุณวางแผนที่จะลงคะแนน ณ เวลานี้' เราอาจจะยังโอเค แต่หลายคนต้องการได้รับ 'นักเล่น' มากกว่านี้ ...

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.