“ เสื้อยืดสีน้ำเงินทุกคน” เป็นตัวอย่างที่เป็นระบบหรือไม่?


17

ฉันกำลังสอนชั้นเรียนอินโทรและกำลังตรวจสอบประเภทของการสุ่มตัวอย่างรวมถึงการสุ่มอย่างเป็นระบบที่คุณสุ่มตัวอย่างบุคคล kth หรือวัตถุทุกคน

นักเรียนถามว่าการสุ่มตัวอย่างทุกคนที่มีลักษณะเฉพาะจะทำให้สิ่งเดียวกันสำเร็จหรือไม่

ตัวอย่างเช่นการสุ่มตัวอย่างเสื้อยืดสีน้ำเงินทุกคนจะมีการสุ่มอย่างเพียงพอและเพียงพอต่อการเป็นตัวแทนของประชากรทั้งหมดหรือไม่ อย่างน้อยถ้าคุณถามคำถามอื่นนอกเหนือจาก "คุณชอบใส่เสื้อยืดสีอะไร?" ความรู้สึกของฉันไม่ใช่ แต่ฉันสงสัยว่าใครที่นี่มีความคิดเกี่ยวกับเรื่องนี้


12
ไม่ถ้าคุณอาศัยอยู่ในเมืองกลาสโกว์ประเทศสก็อตแลนด์คนส่วนใหญ่ที่สวม "เสื้อยืดสีน้ำเงิน" น่าจะเป็นผู้สนับสนุนเรนเจอร์ คุณจะพลาดกับผู้สนับสนุนเซลติก ในกลาสโกว์ทีมฟุตบอลจะเป็นตัวแทนของศาสนา
csgillespie

1
@csgillespie ตัวอย่างที่ยอดเยี่ยม!
whuber

นอกจากนี้คุณอาจได้รับเด็กชายมากกว่าเด็กผู้หญิงเพราะในวัฒนธรรมตะวันตกสีฟ้าเกี่ยวข้องกับชาย
Roland Kofler

เสื้อยืดสีมีราคาแพงกว่าเสื้อยืดสีขาวและการออกแบบบางอย่างอาจไม่เหมาะกับทุกสี ดังนั้นแม้ว่ามันอาจดูไร้เดียงสาแม้ในหมู่ผู้สวมใส่เสื้อยืดคุณอาจเลือกคนที่ร่ำรวยกว่าหรือผู้บริโภคที่ถูกห่ามมากขึ้นหรือผู้ที่ชื่นชอบพรรคการเมืองใดพรรคหนึ่ง
Douglas Zare

นอกจากนี้ยังมีความสัมพันธ์ระหว่างอายุและการสวมใส่เสื้อยืดระหว่างพื้นหลังทางวัฒนธรรมและการสวมเสื้อยืดและอื่น ๆ
Glen_b -Reinstate Monica

คำตอบ:


22

คำตอบสำหรับคำถามของคุณโดยทั่วไปคือ "ไม่" การได้รับตัวอย่างแบบสุ่มจากประชากร (โดยเฉพาะอย่างยิ่งมนุษย์) นั้นยากมาก โดยเครื่องในลักษณะโดยเฉพาะอย่างยิ่งคุณโดยความหมายไม่ได้รับตัวอย่างที่สุ่ม สิ่งนี้มีความลำเอียงในการนำเสนอมากเพียงใด

เป็นตัวอย่างที่ไร้สาระเล็กน้อยคุณไม่ต้องการลองวิธีนี้พูดเกมฟุตบอลระหว่าง Bears และ Packers แม้ว่าประชากรของคุณจะเป็น "แฟนฟุตบอล" (แฟนหมีอาจมีลักษณะแตกต่างจากแฟนฟุตบอลคนอื่น ๆ แม้ว่าจำนวนที่คุณสนใจอาจดูไม่เกี่ยวข้องกับฟุตบอลโดยตรง)

มีตัวอย่างที่โด่งดังมากมายเกี่ยวกับอคติที่ซ่อนอยู่ซึ่งเป็นผลมาจากการได้รับตัวอย่างด้วยวิธีนี้ ตัวอย่างเช่นในการเลือกตั้งสหรัฐเมื่อไม่นานมานี้ซึ่งมีการสำรวจความคิดเห็นทางโทรศัพท์เป็นที่เชื่อกันว่าผู้คนมีโทรศัพท์มือถือเพียงอย่างเดียว เนื่องจากคนเหล่านี้มีแนวโน้มที่จะอายุน้อยกว่าผู้ที่มีโทรศัพท์บ้านด้วยดังนั้นจึงมีตัวอย่างลำเอียง นอกจากนี้คนหนุ่มสาวมีความเชื่อทางการเมืองที่แตกต่างกันมากกว่าประชากรที่มีอายุมากกว่า ดังนั้นนี่เป็นตัวอย่างง่ายๆของกรณีที่แม้ว่าตัวอย่างไม่ได้มีเงื่อนไขโดยเจตนาในลักษณะเฉพาะ แต่ก็ยังเกิดขึ้นในลักษณะนั้น และแม้ว่าการสำรวจความคิดเห็นนั้นไม่ได้ทำอะไรเลย ด้วยลักษณะการปรับเงื่อนไขเช่น (ไม่ว่าจะใช้หรือไม่ใช้โทรศัพท์พื้นฐาน) ผลกระทบของการปรับสภาพในการสรุปผลของการสำรวจความคิดเห็นมีความสำคัญทั้งในเชิงสถิติและในทางปฏิบัติ


6

ตราบใดที่การกระจายของลักษณะที่คุณใช้ในการเลือกหน่วยในตัวอย่างนั้นเป็นมุมฉากกับการกระจายของลักษณะของประชากรที่คุณต้องการประเมินคุณสามารถได้รับการประเมินจำนวนประชากรที่เป็นกลางโดยการเลือกการปรับสภาพ กลุ่มตัวอย่างที่ไม่ได้เป็นอย่างเคร่งครัดสุ่มกลุ่มตัวอย่าง แต่คนมักจะมองข้ามว่ากลุ่มตัวอย่างแบบสุ่มนั้นดีเพราะตัวแปรสุ่มที่ใช้ในการเลือกหน่วยตัวอย่างเป็น orthogonal ต่อการกระจายตัวของลักษณะประชากรไม่ใช่เพราะเป็นแบบสุ่ม

แค่คิดเกี่ยวกับการวาดภาพแบบสุ่มจาก Bernoulli ด้วย P (invlogit (x_i)) โดยที่ x_i ใน [-inf, inf] เป็นคุณสมบัติของหน่วย i ที่ Cov (x, y)! = 0 และ y คือลักษณะประชากรที่ หมายความว่าคุณต้องการประเมิน ตัวอย่างคือ "สุ่ม" ในแง่ที่ว่าคุณกำลังสุ่มก่อนที่จะเลือกเป็นตัวอย่าง แต่ตัวอย่างไม่ได้ให้ค่าประมาณที่เป็นกลางของค่าเฉลี่ยประชากรของ y

สิ่งที่คุณต้องการคือการเลือกปรับสภาพเป็นตัวอย่างในตัวแปรที่ดีเท่าที่กำหนดไว้แบบสุ่ม นั่นคือ orthogonal กับตัวแปรที่ปริมาณขึ้นอยู่กับความสนใจ การสุ่มเป็นสิ่งที่ดีเพราะมันรับประกันความ orthogonality ไม่ใช่เพราะการสุ่มตัวอย่างเอง


4
สิ่งนี้ถูกต้อง แต่คุณจะรู้ได้อย่างไรว่ามันเป็นมุมฉากเว้นแต่ว่าคุณมีกลุ่มตัวอย่างที่สุ่มอย่างแท้จริง?
Peter Flom - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.