ทำไมมันถึงอ้างว่าตัวอย่างมักจะแม่นยำกว่าการสำรวจสำมะโนประชากร?


13

เมื่อเรียนรู้วิธีการสุ่มตัวอย่างฉันพบสองข้อความต่อไปนี้:

1) ข้อผิดพลาดการสุ่มตัวอย่างนำไปสู่ความแปรปรวนส่วนใหญ่ข้อผิดพลาดการสุ่มตัวอย่างจะทำให้เกิดอคติ

2) เนื่องจากข้อผิดพลาดที่ไม่ได้สุ่มตัวอย่างกลุ่มตัวอย่างจึงมักจะแม่นยำกว่า CENSUS

ฉันไม่ทราบว่าจะเข้าใจข้อความทั้งสองนี้ได้อย่างไร ตรรกะพื้นฐานในการรับสองข้อความนี้คืออะไร?


5
การสำรวจสำมะโนประชากรที่แท้จริงหรือพยายาม ?
พระคาร์ดินัล

คำตอบ:


16

ตัวอย่างอาจมีความแม่นยำมากกว่าการสำรวจสำมะโนประชากร (พยายาม) ถ้าความจริงของการออกกำลังกายเป็นสำมะโนประชากรเพิ่มอคติจากข้อผิดพลาดที่ไม่ใช่การสุ่มตัวอย่าง ยกตัวอย่างเช่นสิ่งนี้อาจเกิดขึ้นได้หากการสำรวจสำมะโนประชากรสร้างการรณรงค์ทางการเมืองที่ไม่เอื้ออำนวยซึ่งเรียกร้องการไม่ตอบสนอง ถ้าสิ่งนี้ไม่เกิดขึ้นฉันไม่สามารถเห็นได้ว่าทำไมตัวอย่างจึงคาดว่าจะมีข้อผิดพลาดน้อยกว่าการสำรวจสำมะโนประชากร และโดยความหมายมันจะมีข้อผิดพลาดการสุ่มตัวอย่างมากขึ้น ดังนั้นนอกเหนือจากสถานการณ์ที่ค่อนข้างผิดปกติฉันจะบอกว่าการสำรวจสำมะโนประชากรจะแม่นยำกว่าตัวอย่าง

พิจารณาแหล่งที่มาทั่วไปของข้อผิดพลาดการไม่สุ่มตัวอย่าง - การไม่ตอบสนองอย่างเป็นระบบเช่นโดยกลุ่มประชากรทางสังคมโดยเฉพาะ หากคนจากกลุ่ม X มีแนวโน้มที่จะปฏิเสธการสำรวจสำมะโนประชากรพวกเขาก็มีแนวโน้มที่จะปฏิเสธตัวอย่าง ถึงแม้จะมีการสุ่มตัวอย่าง poststratification น้ำหนักขึ้นตอบสนองของคนเหล่านั้นจากกลุ่ม X ที่คุณไม่ชักชวนที่จะตอบคำถามของคุณคุณยังมีปัญหาเพราะผู้ที่อาจจะมีส่วนมากของ X ที่มีโปรสำรวจ ไม่มีวิธีที่แท้จริงในการแก้ไขปัญหานี้นอกจากต้องระวังให้มากที่สุดเท่าที่จะทำได้ด้วยการออกแบบเครื่องมือและวิธีการจัดส่งของคุณ

ในการผ่านสิ่งนี้จะดึงดูดความสนใจไปยังปัญหาที่เป็นไปได้หนึ่งอย่างที่อาจทำให้การสำรวจสำมะโนประชากรที่พยายามทำมีความแม่นยำน้อยกว่าตัวอย่าง ตัวอย่างมีการถ่วงน้ำหนัก poststratification ให้กับประชากรเป็นประจำซึ่งช่วยบรรเทาปัญหาอคติจากปัญหาต่างๆเช่นในย่อหน้าข้างต้นของฉัน การสำรวจสำมะโนประชากรพยายามที่ไม่ได้รับผลตอบแทน 100% เป็นเพียงตัวอย่างขนาดใหญ่และในหลักการควรอยู่ภายใต้การประมวลผลเดียวกัน แต่เพราะมันถูกมองว่าเป็น "การสำรวจสำมะโนประชากร" (แทนที่จะพยายามสำรวจสำมะโนประชากร) เรื่องนี้อาจถูกทอดทิ้ง ดังนั้นการสำรวจสำมะโนประชากรอาจแม่นยำน้อยกว่าตัวอย่างน้ำหนักที่เหมาะสม แต่ในกรณีนี้ปัญหาคือเทคนิคการประมวลผลการวิเคราะห์ (หรือการละเว้น) ไม่ใช่สิ่งที่แท้จริงที่จะเป็นการสำรวจสำมะโนประชากร

การมีประสิทธิภาพเป็นอีกเรื่องหนึ่ง - ดังที่มิเชลกล่าวตัวอย่างที่ดำเนินการอย่างดีจะมีประสิทธิภาพมากกว่าการสำรวจสำมะโนประชากรและอาจมีความแม่นยำเพียงพอสำหรับการใช้งานจริง


1
+1 สิ่งนี้สะท้อนถึงความพยายามอย่างรอบคอบและให้ข้อมูลในการทำความเข้าใจคำถามและสิ่งที่กระตุ้นให้เกิด
whuber

ฉันคิดว่าความแตกต่างระหว่างตัวอย่างและการสำรวจสำมะโนประชากรไม่สมบูรณ์เป็นมากกว่าเพียงแค่แนวโน้มที่สูงขึ้นในการตอบสนองต่อน้ำหนักในตัวอย่าง ท้ายที่สุดตัวเลขน้ำหนักต้องมาจากที่ไหนสักแห่ง - การสำรวจสำมะโนประชากรหรือการสุ่มตัวอย่างที่มีคุณภาพสูงกว่า
Jonathan

ฉันจะเน้นถึงความสามารถในการลดอคติที่ไม่ตอบสนองในตัวอย่าง สำมะโนประชากรน้อยมากมีความสามารถในการติดตามอคติที่ไม่ตอบสนองได้อย่างมีประสิทธิภาพแม้แต่การสำรวจสำมะโนประชากรของสหรัฐฯ บางทีสิ่งเดียวที่ทำได้ดีก็คือการสำรวจความพึงพอใจของพนักงาน มันคุ้มค่ากว่าการไปตาม nonresponse ในแบบสำรวจตัวอย่าง
Jonathan

ในการสำรวจสำมะโนประชากรมันอาจจะเป็น (จะ) เพื่อค่าใช้จ่ายในการควบคุมคุณภาพการสัมภาษณ์แต่ละครั้ง / ... ! บ่อยครั้งที่คุณภาพของข้อมูลจะดีขึ้นในตัวอย่างมากกว่าในการสำรวจสำมะโนประชากร
kjetil b halvorsen

5

ฉันคิดว่ามีสถานการณ์จริงที่ตัวอย่างมีความแม่นยำมากกว่า ตัวอย่างเช่นเราได้ทำการศึกษาในเมืองในประเทศกำลังพัฒนาที่มีผู้คนจำนวนมากอาศัยอยู่ในสถานที่ที่ไม่ได้ลงทะเบียนและผู้คนที่เข้ามาและออกไปข้างนอกอย่างต่อเนื่องและขี้อายเกี่ยวกับการตอบสนอง การพยายามทำสำมะโนประชากรจริง ๆ จะต้องใช้ความพยายามของเฮอร์คูลีนและให้ทรัพยากรของเรามันจะต้องทำในช่วงสองสามเดือนเมื่อผู้คนจะมาและไป ด้วยตัวอย่างเราสามารถใช้เวลามากขึ้นเพื่อให้แน่ใจว่าเราได้รับการตอบสนองที่ใกล้เคียงที่สุดเท่าที่จะทำได้เพราะเราสามารถอธิบายสิ่งที่เราทำ - และเราสามารถทำได้ในกรอบเวลาที่สั้นกว่ามากซึ่งจะกำจัดปัญหา ของผู้คนที่เข้าและออกจากเมือง

ดังนั้นฉันคิดว่าคำตอบนั้นขึ้นอยู่กับโลจิสติกส์ของสิ่งที่คุณกำลังทำและแหล่งที่มาต่าง ๆ ของข้อผิดพลาดที่ไม่ใช่การสุ่มตัวอย่าง

ในความเป็นจริงแหล่งข้อมูลอื่นคือการสำรวจของเรามีความซับซ้อนและเราต้องฝึกอบรมผู้สัมภาษณ์และการค้นหาและให้เงินทุนกับผู้สัมภาษณ์ที่ฝึกหัดได้เพียงพอในประเทศนั้นจะยากมาก


5

เมื่อการสุ่มตัวอย่างมนุษย์สำหรับการสำรวจตัวอย่างมักประสบจากข้อผิดพลาดในการสุ่มตัวอย่าง (เราแค่ได้รับการประมาณ) และข้อผิดพลาดที่ไม่ใช่การสุ่มตัวอย่าง (เช่นคนที่ปฏิเสธที่จะตอบแบบสำรวจไม่ใช่การสุ่มตัวอย่างในกรอบตัวอย่างที่ต้องการ ไม่สามารถระบุประชากรได้อย่างแม่นยำเพื่อดึงตัวอย่าง) ทำอย่างถูกต้องด้วยอัตราการตอบสนองที่สูงตัวอย่างมีประสิทธิภาพมากกว่าการสำรวจสำมะโนประชากร แต่มันไม่ถูกต้องที่จะสมมติว่าไม่มีตัวอย่างใดมีข้อผิดพลาดที่ไม่ได้สุ่มตัวอย่าง


+1 ขอบคุณสำหรับคำตอบของคุณมิเชลและยินดีต้อนรับสู่ชุมชนของเรา!
whuber

1
สวัสดี whuber ยินดีที่ได้อยู่ที่นี่ ขอบคุณสำหรับการต้อนรับ :)
Michelle

1
@Michelle เพียงแก้ไขเล็กน้อย ข้อผิดพลาดในการสุ่มตัวอย่างเป็นข้อผิดพลาดที่เกิดจากการไม่เลือกประชากรทั้งหมดนั่นคือข้อผิดพลาดเนื่องจากการใช้ตัวอย่างเพื่ออนุมานลักษณะประชากร ข้อผิดพลาดที่ไม่ใช่การสุ่มตัวอย่างคือทุกอย่างรวมถึงการไม่ตอบสนองความล้มเหลวในการสร้างกรอบการสุ่มตัวอย่างที่เพียงพอข้อผิดพลาดในการวัดและอื่น ๆ
Brett

3

ฉันคิดว่าพวกเขาสำคัญคือคำตอบของ Peter Ellis: "พยายาม" เมื่อคุณสุ่มตัวอย่างอย่างถูกต้องคุณจะเหงื่อออกรายละเอียดของการไม่ตอบสนองคิดออกชั้นและค้นหาพวกเขาออก ฯลฯ เมื่อคุณตัดสินใจที่จะสำรวจสำมะโนประชากรมันง่ายที่จะเพิกเฉยต่อปัญหาเหล่านั้น ปัญหาคือคุณอาจไม่ได้รับทุกคน แต่คุณไม่ได้คิดว่าคุณไม่ได้รับจริง ๆ

นอกจากนี้ยังมีปัญหาทางสถิติกับกลุ่มตัวอย่างที่มีขนาดใหญ่มาก (เป็นสัดส่วนของประชากรตัวอย่าง) ฉันไม่ซับซ้อนพอที่จะเข้าใจพวกเขา แต่อย่างน้อยคุณก็มีปัญหากับการคำนวณผลต่าง (แพคเกจอย่าง R's surveyชดเชยสิ่งเหล่านี้ในการสำรวจย่อยและนั่นคือสิ่งที่ฉันได้เรียนรู้เกี่ยวกับสิ่งนี้เป็นครั้งแรก)

ในฐานะที่เป็นปัญหารองหากข้อผิดพลาดที่ไม่ใช่ตัวอย่างมีปัญหาเนื่องจากการควบคุมคุณภาพในขั้นตอนต่าง ๆ ในกระบวนการการมีข้อมูลมากขึ้น (การสำรวจสำมะโนประชากร) จะทำให้ยากยิ่งขึ้นที่จะมีระดับการควบคุมคุณภาพที่คุณจะมี ทรัพยากร) ในชุดข้อมูลขนาดเล็ก (ตัวอย่าง)

ลองนึกภาพถ้าคุณมีทรัพยากร (ด้านการเงินและบุคลากร) ที่สำนักสำรวจสำมะโนประชากรของสหรัฐใช้สำหรับการสำรวจสำมะโนประชากร แต่คุณทำแบบสำรวจผู้ใหญ่เพียง 1,000 คนเท่านั้น ฉันคิดว่าคุณมีการควบคุมคุณภาพที่ดีขึ้นมากและการวิเคราะห์ปัญหาที่เกี่ยวข้องและข้อมูลของตัวเองดีขึ้นมาก


2

ฉันคิดว่าเหตุผลการสุ่มตัวอย่างสามารถ (ไม่เป็น) ได้แม่นยำกว่าการสำรวจสำมะโนประชากรจริง ๆ แล้วมีองค์ประกอบหนึ่งที่เป็นผลมาจากลักษณะของการสำรวจสำมะโนประชากรเมื่อเทียบกับตัวอย่างและซึ่งอาจเป็นสาเหตุของการสำรวจสำมะโนประชากร ไม่ใช่การสุ่มตัวอย่างโดยนิยาม): ในการสำรวจสำมะโนประชากรจำนวนประชากรไม่เป็นที่รู้จัก ดังนั้นการลดหรือควบคุมอคติที่ไม่ตอบสนองจึงเป็นการยากกว่าการทำเช่นนั้นกับตัวอย่างขนาดที่รู้จัก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.