ทำไม / ควร (?) การสุ่มตัวอย่างเชิงสถิติทำงานเพื่อการเมือง (เช่น Gallup)


14

โพลออกมี (พูดกัลล์อัพ) ตัวอย่างผู้คนจำนวนน้อยอย่างไร้เหตุผลเมื่อเทียบกับขนาดของประชากร (เช่นอาจเป็นพันคนจากหลายร้อยล้าน)

ตอนนี้ให้ฉันสุ่มตัวอย่างประชากรเป็นวิธีสำหรับการประเมินสถิติของประชากรทำให้รู้สึกเมื่อคุณมีเหตุผลที่ดีที่จะเชื่อว่ากลุ่มตัวอย่างเป็นตัวแทนของประชากร (หรือในทำนองเดียวกันของตัวอย่างอื่น ๆ )

ตัวอย่างเช่นการสุ่มตัวอย่างทำให้เข้าใจได้ง่ายสำหรับการศึกษาทางการแพทย์เพราะเรารู้ว่านิรนัยที่มนุษย์ทุกคนมีจีโนมค่อนข้างคล้ายคลึงกันและปัจจัยนี้ทำให้ร่างกายของพวกเขามีพฤติกรรมคล้ายกัน
โปรดทราบว่านี่ไม่ใช่การมีเพศสัมพันธ์แบบหลวม ๆ - จีโนมเป็นปัจจัยกำหนดที่แข็งแกร่งมาก

อย่างไรก็ตามฉันไม่เข้าใจว่าอะไรคือเหตุผลที่ใช้ขนาดตัวอย่างต่ำสำหรับสิ่งต่างๆเช่นการสำรวจทางการเมือง

ฉันสามารถซื้อได้ว่าอาจจะ 80-90% ของผู้คนในพื้นที่ใกล้เคียงที่ได้รับคะแนนเสียงคล้ายกันสำหรับประธานาธิบดี (เนื่องจากภูมิหลังทางสังคมและเศรษฐกิจ / การศึกษาที่คล้ายกัน) แต่สิ่งนี้ดูเหมือนว่าแทบจะไม่ได้พิสูจน์ตัวอย่างที่มีจำนวนต่ำ มีตัวอักษรไม่มีเหตุผลที่น่าสนใจ (อย่างน้อยให้ฉัน) ทำไมผู้มีสิทธิเลือกตั้ง 1,000 สุ่มควรประพฤติเช่น 200 ล้านผู้มีสิทธิเลือกตั้งอื่น ๆ

สำหรับฉันคุณต้องการอย่างน้อยต้องชอบ (พูด) 100 ×จำนวนนั้น ทำไม? ฉันสามารถคิดถึงเหตุผลมากมายเช่น:

  1. มี ~ 22,000 อันมีเพียงแค่ในรัฐแคลิฟอร์เนีย ผู้คนเติบโตขึ้นอย่างแตกต่างกันในภูมิหลังทางเศรษฐกิจและการศึกษาของพวกเขาที่โพลขนาด 1,000 คนดูเหมือนจะหัวเราะเยาะ คุณจะสรุปบริเวณทั้งหมดโดยมี <1 คนโดยเฉลี่ยได้อย่างไร

  2. โดยทั่วไปผู้คนไม่สามารถเปลี่ยนแปลงการตอบสนองต่อยาของร่างกาย แต่พวกเขาสามารถเปลี่ยนความคิดเห็นเกี่ยวกับการเมืองเพียงแค่คิดถึงมัน วิธีที่ฉันเห็นมันไม่มีปัจจัยบังคับใดที่คล้ายกับ DNA ในการแพทย์เมื่อคุณต้องรับมือกับการเมือง ที่ดีที่สุดฉันคิดว่าควรมีความสัมพันธ์ขนาดเล็ก

แต่อย่างใดโพลเช่นนี้ดูเหมือนจะ ... ทำงานอย่างไร หรืออย่างน้อยคนก็คิดว่าพวกเขาทำ?
แต่ทำไมพวกเขาควร? บางทีฉันแค่พื้นฐานไม่เข้าใจการสุ่มตัวอย่าง ? มีคนอธิบายได้ไหม
ฉันไม่สามารถทำโพลใด ๆ ที่ฉันเห็นอย่างจริงจัง แต่ฉันรู้สึกว่าฉันอยู่คนเดียวมากหรือน้อยในเรื่องนี้ ...


4
"เห็นได้ชัดว่าการสุ่มตัวอย่างที่เหมาะสมสำหรับการศึกษาทางการแพทย์เพราะเรารู้เบื้องต้นที่มนุษย์ทุกคนมีจีโนมที่คล้ายกันมาก" ผมไม่ได้มีพื้นหลังแพทย์ แต่ทำจริงๆแตกต่างดีเอ็นเอของเราน้อยกว่ามุมมองทางการเมืองของเราหรือไม่ ถ้าเป็นเช่นนั้นทำไมมันยากมากที่จะศึกษาพันธุศาสตร์และทำไมเราถึงไม่เข้าใจอย่างถ่องแท้? ฉันจะเดิมพันว่าถ้าคุณเลือกคนสองคนจากนั้นพวกเขาก็มีแนวโน้มที่จะมีมุมมองทางการเมืองที่เหมือนกันดังนั้น DNA เดียวกัน
ทิม

3
@Tim: "ฉันจะเดิมพันว่าถ้าคุณใช้คนสองคนสุ่มแล้วพวกเขาจะมีแนวโน้มที่จะมีมุมมองทางการเมืองที่เหมือนกันแล้ว DNA เดียวกัน" คุณต้องการเดิมพันเท่าใด google.com/search?q=dna+similarity+between+humans
541686

2
แต่ไม่ได้เป็นความแตกต่างที่ 0.5% สิ่งที่สำคัญที่สุดเมื่อคุณทำการเปรียบเทียบดังกล่าวหรือไม่ นอกจากนี้เรายังแบ่งยีน 60% ให้กับแมลงวันด้วยดังนั้นฉันคิดว่าเราสามารถสุ่มตัวอย่างมนุษย์และแมลงวันแลกเปลี่ยนได้เพื่อการวิจัยทางการแพทย์? เปรียบเทียบ: ในปี 2008 โอบามาได้รับคะแนน 53% ในการเลือกตั้งประธานาธิบดีสหรัฐ นอกจากนี้ผมขอยืนยันว่าเมื่อค้นคว้าช่วยชีวิต แต่อาจเป็นอันตรายยาเสพติดที่คุณควรจะเพิ่มเติมความระมัดระวังในการสุ่มตัวอย่างจากนั้นเมื่อทำวิจัยเกี่ยวกับการตั้งค่าสำหรับการใช้สบู่ที่ผลิตโดย บริษัท VS B หรือสำหรับสระว่ายน้ำความคิดเห็น
ทิม

2
@ user2338816: "มันน่าเชื่อถือเพราะมันถูกต้องในอดีต" ไม่เหมือนกับคณิตศาสตร์และวิทยาศาสตร์มากกว่า ฉันยินดีที่จะซื้ออย่างสมบูรณ์ในพื้นที่ทางวิทยาศาสตร์ (เพราะเป็นวิธีที่วิทยาศาสตร์ม้วน) แต่ไม่ได้อยู่ในบริเวณทางคณิตศาสตร์ (ตามหลักฐาน)
user541686

1
ฉันจะเรียกร้อง (ระมัดระวัง) อ้างว่าการเลือกตั้งทำงานเพื่อการเลือกตั้ง ฉันจำไม่ได้ว่าการเลือกตั้งแม้จะใกล้เคียงกับผลลัพธ์ที่แท้จริงของการเลือกตั้งที่ฉันมา มีหลายปัจจัยมากเกินไปที่คุณไม่สามารถอธิบายได้ - ตัวอย่างเช่นด้วยการเข้าร่วมของเรา ~ 60% คุณเกือบจะมีโอกาสลองชิมคนที่ไม่ได้ลงคะแนนมากกว่าคนที่ไม่ได้ลงคะแนน การมีส่วนร่วมในแบบสำรวจนั้นใช้ความพยายามน้อยกว่าการลงคะแนนและบางครั้งคุณก็จะได้รับเงินด้วย บางฝ่ายมีผู้เข้าร่วมมากกว่าพรรคอื่น ๆ (เช่นพรรคคอมมิวนิสต์) คุณต้องอ้างอิงส่วนเบี่ยงเบนเช่นเดียวกับ "ผลลัพธ์" ในการสุ่มตัวอย่างใด ๆ
Luaan

คำตอบ:


13

ดูเหมือนว่าคุณกำลังจินตนาการรูปแบบการสุ่มตัวอย่างที่ง่ายมาก

รูปแบบที่ง่ายที่สุดสำหรับการสุ่มตัวอย่างที่เรียกว่าเหมาะเจาะง่ายสุ่ม คุณเลือกกลุ่มย่อยของประชากร (เช่นโดยการกดหมายเลขโทรศัพท์โดยการสุ่ม) และถามคนที่ตอบว่าพวกเขาโหวตอย่างไร ถ้า 487 บอกว่าคลินตัน 463 คนบอกว่าทรัมป์และที่เหลือให้คำตอบที่แปลกประหลาด บริษัท หน่วยเลือกตั้งจะรายงานว่า 49% ของผู้ลงคะแนนเลือกคลินตันในขณะที่ 46% ชอบทรัมป์ อย่างไรก็ตาม บริษัท หน่วยเลือกตั้งทำมากกว่านี้ ตัวอย่างสุ่มอย่างง่ายให้น้ำหนักเท่ากันทุกจุดข้อมูล อย่างไรก็ตามสมมติว่ากลุ่มตัวอย่างของคุณมีผู้ชาย 600 คนและผู้หญิง 400 คนซึ่งไม่ได้เป็นตัวแทนของประชากรโดยรวม หากผู้ชายเป็นกลุ่มพึ่งพากันทางเดียวในขณะที่ผู้หญิงพิงกันสิ่งนี้จะทำให้คุณมีอคติ อย่างไรก็ตามเนื่องจากเรามีสถิติด้านประชากรศาสตร์ที่ดีคุณจึงสามารถลดน้ำหนักได้ *คำตอบโดยการนับการตอบสนองของผู้หญิงอีกเล็กน้อยและผู้ชายก็จะน้อยลงดังนั้นการตอบสนองแบบถ่วงน้ำหนักจึงหมายถึงประชากรที่ดีขึ้น องค์กรการเลือกตั้งมีรูปแบบการชั่งน้ำหนักที่ซับซ้อนมากขึ้นซึ่งสามารถสร้างตัวอย่างที่ไม่ใช่ตัวแทนได้

แนวคิดของการถ่วงน้ำหนักการตอบสนองตัวอย่างอยู่บนพื้นฐานทางสถิติที่ค่อนข้างแน่นหนา แต่มีความยืดหยุ่นในการเลือกสิ่งที่ปัจจัยนำไปสู่น้ำหนัก การสำรวจความคิดเห็นส่วนใหญ่มีน้ำหนักตัวโดยพิจารณาจากปัจจัยด้านประชากรศาสตร์เช่นเพศอายุและเชื้อชาติ เมื่อพิจารณาถึงสิ่งนี้คุณอาจคิดว่าควรมีการระบุตัวตนของพรรค (ประชาธิปัตย์รีพับลิกันและอื่น ๆ ) แต่ปรากฎว่าบริษัท โพลล์ส่วนใหญ่ไม่ได้ใช้ในน้ำหนักของพวกเขา: พรรค (ตัวเอง) - การระบุตัวตน ในลักษณะที่ทำให้มีประโยชน์น้อยลง

ชุดโพลจำนวนมากยังรายงานผลลัพธ์ของพวกเขาใน ในสิ่งเหล่านี้ผู้ตอบแบบสอบถามจะถูกเลือกหรือให้น้ำหนักตามความเป็นไปได้ที่พวกเขาจะได้รับการสำรวจ รุ่นนี้ไม่ต้องสงสัยเลยว่าขับเคลื่อนด้วยข้อมูล แต่ตัวเลือกปัจจัยที่แม่นยำช่วยให้มีความยืดหยุ่น ตัวอย่างเช่นการมีปฏิสัมพันธ์ระหว่างผู้สมัครกับการแข่งขันของผู้มีสิทธิเลือกตั้ง (หรือเพศ) นั้นไม่สมเหตุสมผลแม้แต่ในปี 2008 หรือ 2016 แต่ฉันสงสัยว่าพวกเขามีพลังในการทำนายในตอนนี้

ในทางทฤษฎีคุณสามารถรวมทุกสิ่งเป็นปัจจัยกำหนดน้ำหนัก: การเลือกดนตรีสีตา ฯลฯ อย่างไรก็ตามปัจจัยด้านประชากรศาสตร์เป็นตัวเลือกยอดนิยมสำหรับปัจจัยถ่วงน้ำหนักเนื่องจาก:

  • สังเกตุพวกมันมีความสัมพันธ์ที่ดีกับพฤติกรรมของผู้มีสิทธิเลือกตั้ง เห็นได้ชัดว่าไม่มีกฎเหล็กหุ้มที่คนขาว 'บังคับ' ให้เป็นรีพับลิกัน แต่ในช่วงห้าสิบปีที่ผ่านมาพวกเขามีแนวโน้มที่จะ
    • ค่าของประชากรเป็นที่รู้จักกันดี (เช่นจากการสำรวจสำมะโนประชากรหรือ Vital Records)

อย่างไรก็ตามการสำรวจความคิดเห็นยังเห็นข่าวแบบเดียวกันกับที่คนอื่นทำและสามารถปรับตัวแปรน้ำหนักได้หากจำเป็น

นอกจากนี้ยังมี "ปัจจัยเหลวไหล" ซึ่งบางครั้งมีการเรียกใช้เพื่ออธิบายผลการสำรวจความคิดเห็น ตัวอย่างเช่นบางครั้งผู้ตอบแบบสอบถามลังเลที่จะให้คำตอบที่ "ไม่พึงประสงค์ต่อสังคม" แบรดลีย์ผล posits ว่าผู้มีสิทธิเลือกตั้งสีขาวบางครั้งมองข้ามการสนับสนุนของพวกเขาสำหรับผู้สมัครขาวทำงานกับชนกลุ่มน้อยเพื่อหลีกเลี่ยงการปรากฏชนชั้น มันถูกตั้งชื่อตามทอมแบรดลีย์ผู้สมัครผู้ว่าการรัฐแอฟริกัน - อเมริกันที่หวุดหวิดการเลือกตั้งแม้จะนำไปสู่การเลือกตั้ง

ในที่สุดคุณก็ถูกต้องสมบูรณ์ว่าการกระทำอย่างมากในการถามความเห็นของใครบางคนสามารถเปลี่ยนแปลงได้ บริษัท สำรวจความคิดเห็นพยายามเขียนคำถามด้วยวิธีที่เป็นกลาง เพื่อหลีกเลี่ยงปัญหาเกี่ยวกับลำดับการตอบกลับที่เป็นไปได้ชื่อของผู้สมัครอาจถูกระบุไว้ในลำดับแบบสุ่ม คำถามหลายรุ่นบางครั้งก็มีการทดสอบซึ่งกันและกัน เอฟเฟ็กต์นี้ยังสามารถถูกเอารัดเอาเปรียบสำหรับจุดจบสามานย์ในแบบสำรวจความคิดเห็นซึ่งผู้สัมภาษณ์ไม่ได้สนใจในการรวบรวมคำตอบ แต่มีอิทธิพลต่อพวกเขา ตัวอย่างเช่นโพลสำรวจอาจจะถามว่า "คุณจะลงคะแนนให้ [ผู้สมัคร A] แม้ว่าจะมีรายงานว่าเขาเป็นเด็กลวงตาหรือไม่"


* คุณอาจกำหนดเป้าหมายที่ชัดเจนสำหรับตัวอย่างของคุณเช่นรวมถึงผู้ชาย 500 คนและผู้หญิง 500 คน สิ่งนี้เรียกว่าการสุ่มตัวอย่างแบบแบ่งชั้น (stratified sampling)ประชากรจะแบ่งเป็นชั้น ๆ และแต่ละกลุ่มจะสุ่มตัวอย่าง ในทางปฏิบัติสิ่งนี้ไม่ได้ทำเพื่อโพลบ่อยนักเพราะคุณจะต้องแบ่งกลุ่มเป็นกลุ่มที่ละเอียดถี่ถ้วน (เช่นผู้ชายที่มีการศึกษาระดับวิทยาลัยระหว่าง 18-24 ในเมืองเท็กซัส)


2
ฉันเข้าใจว่าพวกเขาไม่ได้สุ่มตัวอย่างแบบง่าย ๆ แต่คำถามของฉันเกี่ยวกับว่าสิ่งที่พวกเขากำลังทำนั้นดีเพียงเพราะมันเกิดขึ้นว่าสมมติฐานของพวกเขาถูกต้อง (เช่นมีเหตุผล แต่เป็นลางสังหรณ์ใจ) หรือว่าสมมติฐานนั้นเป็นสถิติหรือไม่ แก้ตัวได้ ดูความคิดเห็นของฉันในคำตอบอื่น ๆที่นี่
user541686

3
ฉันคิดว่าทั้งคู่ การชั่งน้ำหนักตัวอย่างเป็นสิ่งที่ถูกต้องทางสถิติที่ต้องทำ แต่มี .... ความยืดหยุ่นในการตัดสินใจเลือกปัจจัยที่จะเข้าสู่น้ำหนัก ตัวอย่างเช่นเชื้อชาติเพศและการศึกษาล้วน แต่มีประโยชน์ แต่กลับกลายเป็นว่าบัตรประจำตัวของบุคคลนั้นไม่ได้เป็นเช่นนั้น (เช่นtheguardian.com/commentisfree/2012/sep/27/ ...... ) อาจเป็นเพราะมันเชื่อมโยงกับผู้สมัครของผู้มีสิทธิเลือกตั้ง ทางเลือก.
Matt Krause

1
ในทำนองเดียวกันน้ำหนักบางครั้งรวมถึงการประเมินว่าผู้ตอบแบบสอบถามมีแนวโน้มที่จะลงคะแนนได้อย่างไร: คนหนุ่มสาวส่งเสียงดังมาก แต่ไม่ปรากฏขึ้นเสมอไป ผู้สูงอายุไม่ค่อยเข้าร่วมการชุมนุม แต่กลับกลายเป็นอย่างน่าเชื่อถือในการเลือกตั้ง อาจประมาณจากข้อมูลในอดีต (บางครั้งผู้ลงคะแนนเสียงจะเปิดเผยต่อสาธารณะ) แต่ฉันสามารถจินตนาการได้ว่าสถานที่บางแห่งได้ปรับให้เป็นแอฟริกัน - อเมริกันในปี 2551 และสำหรับผู้หญิงในปี 2559
Matt Krause

ขอบคุณ! อาจดีที่จะพูดถึงว่า "ความยืดหยุ่น" ในคำตอบของคุณด้วยเช่นกัน :) +1
user541686

10

มีทฤษฎีทางคณิตศาสตร์ที่เรียกว่า "กฎจำนวนมาก" ลองนึกภาพว่าคุณต้องการกำหนดความน่าจะเป็นที่เหรียญจะขึ้นมา "ประชากร" ของการโยนเหรียญนั้นไม่มีที่สิ้นสุด - ใหญ่กว่าคนมากกว่า 300,000,000 คนในสหรัฐอเมริกา แต่ตามกฏหมายจำนวนมากการโยนเหรียญมากขึ้นจะทำให้การประมาณการของคุณแม่นยำยิ่งขึ้น

แบบสำรวจความคิดเห็นในอุดมคติ:ในแบบสำรวจความคิดเห็นในอุดมคติผู้สำรวจจะสุ่มเลือกชื่อจากการสำรวจสำมะโนประชากรของสหรัฐพวกเขาจะทราบว่าคนเหล่านั้นอาศัยอยู่ที่ไหนจากนั้นพวกเขาก็จะไปและเคาะประตู หากบุคคลนั้นกล่าวว่าพวกเขากำลังวางแผนในการลงคะแนนผู้สำรวจความคิดเห็นจะถามว่าพวกเขากำลังลงคะแนนใครและบันทึกคำตอบของพวกเขา การลงคะแนนเลือกตั้งเช่นนี้คือการรับประกันทางคณิตศาสตร์ในการทำงานและจำนวนเงินที่ผิดพลาดในการวัดของคุณสำหรับระดับความเชื่อมั่นใดก็ตามสามารถคำนวณได้อย่างง่ายดาย

นี่คือความหมายของข้อผิดพลาด:สมมติว่าจากการสำรวจของคุณคุณมีโอกาส 52% ที่ผู้สมัครน่ากลัว McPerfect กำลังจะชนะโดยมีข้อผิดพลาด 3% พร้อมความมั่นใจ 98% ซึ่งหมายความว่าคุณสามารถมั่นใจ 98% ว่าส่วนที่แท้จริงของผู้มีสิทธิเลือกตั้งที่ชอบผู้สมัคร Awesome McPerfect อยู่ระหว่าง 49% ถึง 55%

หมายเหตุเกี่ยวกับข้อผิดพลาดและความมั่นใจสำหรับขนาดตัวอย่างที่กำหนดยิ่งคุณมั่นใจมากเท่าใดความผิดพลาดของคุณก็จะยิ่งมากขึ้น คิดเกี่ยวกับมัน - คุณ 100% มั่นใจว่าสัดส่วนจริงที่สนับสนุน canditate น่ากลัวอยู่ระหว่าง 0% และ 100% (ข้อผิดพลาดมากที่สุด) และคุณมั่นใจ 0% ว่าสัดส่วนจริงที่สนับสนุน canditate น่ากลัวคือว่า 52.0932840985028390984308% (ข้อผิดพลาดเป็นศูนย์) ความมั่นใจมากขึ้นหมายถึงข้อผิดพลาดเพิ่มเติมความมั่นใจน้อยลงหมายถึงข้อผิดพลาดน้อยลง อย่างไรก็ตามความสัมพันธ์ระหว่างความเชื่อมั่นและข้อผิดพลาดไม่ได้เป็นเส้นตรง! (ดู: https://en.wikipedia.org/wiki/Confidence_interval )

โพลในโลกแห่งความเป็นจริง:เนื่องจากมีค่าใช้จ่ายสูงในการสำรวจเฮลิคอปเตอร์ไปยังทุกส่วนของประเทศเพื่อเคาะประตูคนที่สุ่ม พิจารณาเงินทุนนี้), การสำรวจความคิดเห็นในโลกแห่งความจริงมีความซับซ้อนมากขึ้น ให้ดูกลยุทธ์ทั่วไปข้อใดข้อหนึ่ง - เรียกผู้มีสิทธิเลือกตั้งแบบสุ่มและถามพวกเขาว่าพวกเขาต้องการให้ใคร มันเป็นกลยุทธ์ที่ดี แต่มีข้อผิดพลาดที่รู้ดีอยู่บ้าง:

  1. ผู้คนมักเลือกที่จะไม่รับโทรศัพท์และตอบสนองต่อการสำรวจความคิดเห็น (เช่นฉัน)
  2. กลุ่มประชากรบางกลุ่มมีแนวโน้มที่จะมีโทรศัพท์บ้าน (เช่นผู้มีสิทธิ์ลงคะแนนเก่า)
  3. กลุ่มประชากรบางกลุ่มมีแนวโน้มที่จะตอบสนองต่อการสำรวจความคิดเห็น (เช่นผู้มีสิทธิ์เลือกตั้งที่มีอายุมากกว่า)

เนื่องจากกลุ่มประชากรต่างกันลงคะแนนด้วยวิธีที่แตกต่างกันผู้ลงคะแนนจึงต้องพยายามอย่างเต็มที่เพื่อควบคุมความแตกต่างของข้อมูลดิบของพวกเขา (ขึ้นอยู่กับว่าใครตัดสินใจรับโทรศัพท์) และผลลัพธ์ของการเลือกตั้งจริง ตัวอย่างเช่นหากผู้คน 10% ที่หยิบโทรศัพท์ขึ้นมาเป็นคนเชื้อสายสเปน แต่ผู้ลงคะแนนในการเลือกตั้งครั้งสุดท้ายเป็นชาวสเปน 30% พวกเขาจะให้น้ำหนักผู้ลงคะแนนแบบโหวตของเขาถึงสามเท่าในแบบสำรวจ หาก 50% ของผู้ตอบรับโทรศัพท์นั้นมีอายุมากกว่า 60 ปี แต่มีเพียง 30% ของผู้ลงคะแนนในการเลือกตั้งครั้งล่าสุดที่มีอายุมากกว่า 60 ปีพวกเขาจะให้น้ำหนักน้อยลงสำหรับผู้มีสิทธิเลือกตั้งที่ตอบกลับ มันไม่สมบูรณ์แบบ แต่สามารถนำไปสู่การคาดการณ์ที่น่าประทับใจ (Nate Silver ทำนายผลในแต่ละรัฐ 50 แห่งในการเลือกตั้งปี 2012 โดยใช้สถิติ

คำเตือนที่ชาญฉลาด:ผู้สำรวจความคิดเห็นทำการคาดคะเนที่ดีที่สุดที่พวกเขาสามารถทำได้โดยพิจารณาจากสิ่งต่าง ๆ ที่เกิดขึ้นในอดีต โดยทั่วไปแล้วสิ่งต่าง ๆ ก็เริ่มเหมือนเดิมในอดีตหรืออย่างน้อยการเปลี่ยนแปลงก็ช้าพอที่เมื่อเร็ว ๆ นี้ที่ผ่านมา (ซึ่งพวกเขามุ่งเน้นมากที่สุด) จะคล้ายกับปัจจุบัน อย่างไรก็ตามบางครั้งมีการเปลี่ยนแปลงอย่างรวดเร็วในเขตเลือกตั้งและสิ่งที่ผิดไป บางทีผู้มีสิทธิเลือกตั้งของทรัมป์มีโอกาสน้อยกว่าผู้มีสิทธิเลือกตั้งโดยเฉลี่ยของคุณเล็กน้อยในการรับโทรศัพท์และการให้น้ำหนักตามข้อมูลประชากรไม่ได้เป็นสาเหตุนั้น หรือบางทีคนหนุ่มสาว (ผู้สนับสนุนฮิลลารีอย่างท่วมท้น) นั้นมีมากขึ้นไม่น่าจะรับโทรศัพท์กว่ารุ่นที่คาดการณ์ไว้และรุ่นที่รับสายโทรศัพท์นั้นมีแนวโน้มที่จะเป็นสาธารณรัฐมากกว่า หรือบางทีอาจเป็นสิ่งที่ตรงกันข้ามกันจริง - เราไม่รู้ สิ่งต่าง ๆ เช่นนั้นคือตัวแปรซ่อนเร้นที่ไม่ปรากฏในข้อมูลประชากรที่รวบรวมโดยทั่วไป

เราจะรู้ว่าถ้าเราส่งโพลเตอร์ไปเคาะประตูแบบสุ่ม (อะแฮ่มจำนวนล้านล้านที่อ่านนี่) ตั้งแต่นั้นมาเราจะไม่ต้องชั่งน้ำหนักสิ่งของตามข้อมูลประชากร แต่จนกระทั่งถึงตอนนั้น


3
ฉันขอขอบคุณคำตอบ แต่มันค่อนข้างง่ายเมื่อเทียบกับคำถามที่ฉันพยายามถามและพื้นหลังของฉัน (ไม่แน่ใจว่าคุณสังเกตเห็นหรือไม่ แต่ฉันไม่ได้ใหม่กับพื้นฐานของความน่าจะเป็น / สถิติ) ฉันไม่คิดว่าคำตอบสำหรับคำถามของฉันที่นี่เป็นพื้นฐานสำหรับคุณ ตัวอย่างเช่น: ข้อสันนิษฐานสำหรับกฎดั้งเดิมของคนจำนวนมากคือเรามีตัวแปรสุ่มที่มีการแจกแจงที่เหมือนกัน ... แต่ฉันล้มเหลวที่จะเห็นเหตุผลสำหรับมันในบริบททางการเมือง: ทำไมการกระจายคุณควรลงคะแนนเสียง เดียวที่ทุกคน ?
user541686

นอกจากนี้ฉันยังไม่แน่ใจด้วยซ้ำว่ากฎของคนจำนวนมากแสดงให้เห็นถึงสิ่งที่คุณพยายามที่จะพิสูจน์แม้ว่าสมมติฐานจะเป็นที่พอใจ คำถามเกี่ยวกับขนาดตัวอย่างที่กฎหมายจำนวนมากไม่ได้กล่าวถึง (อย่างน้อยก็ไม่ใช่ในแบบที่คุณแนะนำ); เราต้องการแนวคิดเกี่ยวกับความแปรปรวนหรืออัตราการลู่เข้าที่นี่ไม่ใช่แค่การลู่เข้าของค่าเฉลี่ยที่ไม่มีที่สิ้นสุด บางทีคุณอาจจะเรียกทฤษฎีบทขีด จำกัด กลางแทนกฎจำนวนมาก? (แม้ว่าโปรดดูความคิดเห็นก่อนหน้าของฉันตั้งแต่นี้อาจเป็น moot.)
user541686

2
การแจกแจงจะไม่นำไปใช้กับการลงคะแนนแบบบุคคล คะแนนโหวตส่วนบุคคลไม่ได้สุ่ม พวกเขากำลังนำไปใช้กับพฤติกรรมการลงคะแนนของประชากรโดยรวม มันเหมือนกับการวาดลูกบอลสีจากโกศ - แต่ละลูกถูกกำหนดให้เป็นสีแดงหรือสีน้ำเงิน แต่คุณสามารถมีความน่าจะเป็นในการวาดแต่ละสีและเพื่อให้คุณสามารถสร้างการแจกแจงสำหรับโอกาสในการวาดสีของลูกบอลตามตัวอย่าง ของลูกบอลในโกศ
J. Antonio Perez

1
ให้มองสิ่งอื่นนอกเหนือจากการเมืองกับผู้คน ไอศครีมที่ชื่นชอบของใครบางคนขึ้นอยู่กับหลาย ๆ สิ่งตามมุมมองทางการเมือง มันอาจขึ้นอยู่กับความชอบของเพื่อน ๆ ความทรงจำในวัยเด็กของพวกเขาประสบการณ์ที่ดีหรือไม่ดีที่ร้านไอศกรีม บางทีพวกเขาอาจชอบรสชาติหนึ่งเพราะพวกเขาได้รับในวันแรกกับภรรยาหรือสามีของพวกเขา บางทีพวกเขาอาจไม่ชอบรสชาติเพราะมันทำให้พวกเขานึกถึงอดีต แต่ถ้าฉันทำแบบสำรวจความคิดเห็นของผู้คนในอเมริกาคุณจะไม่เห็นด้วยหรือไม่ว่าฉันสามารถตัดสินรสชาติไอศกรีมยอดนิยมในอเมริกาได้?
J. Antonio Perez

1
"ตัวแปรสุ่ม" คือบุคคลที่ถูกเลือกโดยนักสำรวจความคิดเห็นที่จะถูกถามถึงการตั้งค่าของพวกเขา การตั้งค่าของแต่ละบุคคลไม่ได้สุ่ม บุคคลที่สำรวจความคิดเห็นเลือกแบบสุ่ม
J. Antonio Perez

7

ประการแรกนี่คือนอกเหนือจากประเด็นหลักของคุณ แต่มันก็คุ้มค่าที่จะกล่าวถึง ในการทดลองทางการแพทย์คุณอาจมี 1,000 คนที่ทำการทดสอบยาซึ่งสามารถมอบให้กับคนที่ป่วย 10,000 คนต่อปี คุณอาจมองว่าและคิดว่า "นั่นคือการทดสอบบน 10% ของประชากร" ในความเป็นจริงประชากรไม่ได้ 10,000 คนผู้ป่วยในอนาคตทั้งหมดดังนั้นขนาดของประชากรที่ไม่มีที่สิ้นสุด 1,000 คนไม่ใหญ่มากเมื่อเทียบกับผู้ใช้ยาที่ไม่มีที่สิ้นสุด แต่การศึกษาประเภทนี้ทำงาน ไม่สำคัญว่าคุณจะทดสอบ 10%, 1% หรือ 0.1% ของประชากร สิ่งที่สำคัญคือขนาดที่แน่นอนของตัวอย่างไม่ใช่ขนาดที่ใหญ่เมื่อเทียบกับประชากร

ถัดไปประเด็นหลักของคุณคือมีตัวแปรที่รบกวนมากมายซึ่งมีอิทธิพลต่อการลงคะแนนของผู้คน คุณกำลังรักษาเขต 22,000 แห่งของแคลิฟอร์เนียเช่นตัวแปร 22,000 ตัว แต่จริงๆแล้วพวกเขาเป็นเพียงตัวแปรตัวหนึ่ง (รายได้และการศึกษาอย่างที่คุณพูดถึง) คุณไม่ต้องการตัวอย่างตัวแทนจากทุกอำเภอคุณแค่ต้องการตัวอย่างมากพอที่จะครอบคลุมการเปลี่ยนแปลงเนื่องจากรายได้การศึกษาและอื่น ๆ

kknnσ2nkkσ2n

kn

แก้ไข:

สูตรข้างต้นได้สมมติว่าตัวแปรรบกวนแต่ละตัวมีความสำคัญเท่าเทียมกัน หากเราต้องการพิจารณาหลายร้อยสิ่งที่สามารถเพิ่มความแปรปรวนกับผลลัพธ์ได้สมมติฐานนี้ไม่ถูกต้อง (เช่นผู้ใช้ทวิตเตอร์สนับสนุนผู้สมัครมากกว่าหนึ่งคน แต่เรารู้ว่าการใช้ทวิตเตอร์นั้นไม่สำคัญเท่ากับเพศ)

σ20.9σ20.92σ2n=0σ20.9n=10σ2

n10σ2n0.9


ขอบคุณสำหรับคำตอบ! เกี่ยวกับจุดแรกฉันคิดว่ามันเป็นเรื่องจริง แต่ประเด็นของฉันคือว่ามันไม่สำคัญว่าขนาดของประชากรมนุษย์จะเป็นอย่างไรเนื่องจากคุณมีปัจจัยบังคับ (DNA ฯลฯ ) ที่จะทำให้ผลลัพธ์ค่อนข้างคล้ายกับ ตัวอย่างใด ๆ อย่างไรก็ตามสำหรับวิธีที่สอง: ฉันสามารถซื้อได้ว่าอาจมีตัวแปรบางอย่างในทางปฏิบัติ แต่วิธีเดียวที่จะพิสูจน์สมมติฐานทางคณิตศาสตร์และใช้ในภายหลังคือการสุ่มตัวอย่างผู้คนจำนวนมากก่อนและสาธิตให้เห็นใช่ไหม หากปราศจากข้อสรุปก็ไม่น่าจะมีความเข้มงวดหรือมีเหตุผลเชิงสถิติอีกต่อไป
user541686

เราได้ก่อตั้งขึ้นโดยการทดสอบว่าอายุเพศรายได้และปัจจัยอื่น ๆ เป็นปัจจัยสำคัญในรูปแบบการลงคะแนนของผู้คนและเราก็รู้เพียงแค่ความรู้ทั่วไป คุณพูดถูกว่าอาจมีปัจจัยเล็ก ๆ อีกหลายร้อยปัจจัยที่มีอิทธิพลต่อการลงคะแนนและในทางทฤษฎีพวกเขาสามารถรวมถึงสิ่งที่สำคัญ แต่ความรู้ทั่วไปของเราบอกเราว่าพวกเขาไม่สำคัญ เมื่อมาถึงจุดนี้แบบจำลองไม่ได้เป็นธรรมอย่างจริงจัง แต่ใครจะไปทดสอบปัจจัยเล็กน้อยเช่น "การเป็นผมบลอนด์ทำให้คนโหวตคลินตันหรือไม่การใส่วิกผมทำให้คนโหวตให้ทรัมป์?"
ฮิวจ์

"แต่ใครจะไปทดสอบปัจจัยรองเช่น [... ]" - แต่นั่นเป็นปัญหาที่นี่ ถ้าคำตอบคือ "เพราะมันดีที่สุดที่เราสามารถทำได้ / เพราะมันเกิดขึ้นกับการทำงาน / เพราะมันแพง / อย่างอื่น" นั่นเป็นคำตอบที่ดีมากสำหรับคำถามที่ว่า "ทำไมพวกเขาถึงไม่ลงคะแนน 100,000 คน? "แต่มันไม่ใช่คำตอบที่แท้จริงของ" คน 1,000 คนจะมีเหตุผลทางสถิติได้อย่างไร " นั่นเป็นเหตุผลที่ฉันถามเรื่องนี้ใน Stats.SE เมื่อเทียบกับ Polit.SE ... ฉันไม่สนว่ากลุ่มตัวอย่างจะทำไม่ได้จริงหรือไม่ คำถามของฉันคือเหตุผลที่ผู้คนคิดว่าวิธีการปัจจุบันเป็นธรรมทางสถิติ
user541686

คู่แรกของประโยคในความคิดเห็นสุดท้ายดูเหมือนจะเป็นคำตอบที่สมเหตุสมผลถ้าคุณกำลังบอกว่าการศึกษาแบบนั้นได้ทำในวงกว้าง (ประมาณแสนคนถ้าไม่ใช่ล้านคน) และนั่นคือ รากฐานของสมมติฐานของเรา ถ้าเป็นเช่นนั้นฉันคิดว่าพวกเขาควรจะเพิ่มคำตอบของคุณเนื่องจากพวกเขาตอบคำถามของฉัน (นึกคิดด้วยการอ้างอิงบางอย่างถึงแม้ว่าฉันจะไม่จู้จี้จุกจิกเกินไปจริง ๆ เพราะมันเป็นบิตของสัมผัส )
user541686

คุณถูกต้องว่าการทดสอบปัจจัยย่อยนั้นไม่สามารถทำได้ แต่มีความเกี่ยวข้องทางคณิตศาสตร์ ฉันได้แก้ไขคำตอบของฉันเพื่อให้เหตุผลเกี่ยวกับสาเหตุที่เราไม่กังวลเกี่ยวกับปัจจัยเล็ก ๆ หลายร้อยที่มีอิทธิพลต่อผลลัพธ์ ฉันแน่ใจว่าคุณสามารถค้นหางานวิจัยที่ทำกับอิทธิพลของปัจจัยสำคัญ
ฮิวจ์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.