การอนุมานทางสถิติเมื่อกลุ่มตัวอย่าง“ เป็น” ประชากร


47

ลองนึกภาพคุณต้องรายงานจำนวนผู้สมัครที่ทำแบบทดสอบรายปี ดูเหมือนว่าค่อนข้างยากที่จะอนุมาน% ของความสำเร็จที่สังเกตได้เช่นในประชากรที่กว้างขึ้นเนื่องจากความจำเพาะของประชากรเป้าหมาย ดังนั้นคุณอาจพิจารณาว่าข้อมูลเหล่านี้แสดงถึงประชากรทั้งหมด

ผลการทดสอบแสดงให้เห็นว่าสัดส่วนของเพศชายและเพศหญิงแตกต่างกันจริงหรือไม่? การทดสอบเปรียบเทียบสัดส่วนที่สังเกตและสัดส่วนทางทฤษฎีดูเหมือนว่าถูกต้องหรือไม่เนื่องจากคุณพิจารณาประชากรทั้งหมด (ไม่ใช่ตัวอย่าง)?

คำตอบ:


31

อาจมีความคิดเห็นที่แตกต่างกันในเรื่องนี้ แต่ฉันจะปฏิบัติต่อข้อมูลประชากรเป็นตัวอย่างและสมมติว่าเป็นประชากรสมมุติจากนั้นทำการอนุมานตามปกติ วิธีหนึ่งที่จะคิดเกี่ยวกับสิ่งนี้คือมีกระบวนการสร้างข้อมูลพื้นฐานที่รับผิดชอบในการรวบรวมข้อมูลการกระจาย "ประชากร"

ในกรณีเฉพาะของคุณสิ่งนี้อาจเหมาะสมกว่านี้อีกเนื่องจากคุณจะมีกลุ่มคนในอนาคต ถ้าอย่างนั้นประชากรของคุณก็คือกลุ่มที่จะทำการทดสอบในอนาคต ด้วยวิธีนี้คุณสามารถบัญชีรูปแบบตามเวลาหากคุณมีข้อมูลมานานกว่าหนึ่งปีหรือลองพิจารณาปัจจัยแฝงผ่านแบบจำลองข้อผิดพลาดของคุณ ในระยะสั้นคุณสามารถพัฒนาแบบจำลองที่สมบูรณ์ยิ่งขึ้นด้วยพลังการอธิบายที่มากขึ้น


4
เพิ่งเจอโพสต์นี้จาก A Gelman การวิเคราะห์ทางสถิติแตกต่างกันอย่างไรเมื่อทำการวิเคราะห์ประชากรทั้งหมดมากกว่าตัวอย่าง , j.mp/cZ1WSI จุดเริ่มต้นที่ดีเกี่ยวกับการแยกความคิดเห็นในแนวคิดของ "ประชากรพิเศษ"
chl

2
@chl: ที่น่าสนใจ - เตือนฉันว่า Gelman มีการอภิปรายของการอนุมานจำนวนประชากรสูงสุด / super ถูกเทียบเคียงกับผลกระทบคงที่ / สุ่มในกระดาษของเขาใน ANOVA [ stat.columbia.edu/~gelman/research/published/econanova3.pdf ]
ARS

+1 ฉันเพิ่งกลับมาที่นี่อีกครั้ง (ผ่าน Google) ฉันคิดว่าคำตอบของคุณคือจุดที่
เชน

25

ที่จริงแล้วถ้าคุณคิดบวกคุณมีประชากรทั้งหมดก็ไม่จำเป็นต้องมีสถิติ จากนั้นคุณจะรู้ได้อย่างชัดเจนว่าความแตกต่างนั้นใหญ่แค่ไหนและก็ไม่มีเหตุผลอะไรที่จะทดสอบอีกต่อไป ความผิดพลาดแบบคลาสสิกคือการใช้นัยสำคัญทางสถิติว่ามีนัยสำคัญ "ที่เกี่ยวข้อง" หากคุณสุ่มตัวอย่างประชากรความแตกต่างคือสิ่งที่มันเป็น

ในทางกลับกันถ้าคุณปรับสมมติฐานของคุณผู้สมัครจะถูกมองว่าเป็นตัวอย่างของผู้สมัครที่เป็นไปได้ซึ่งจะช่วยให้การทดสอบทางสถิติ ในกรณีนี้คุณจะทดสอบโดยทั่วไปว่าเพศชายและเพศหญิงแตกต่างกันในการทดสอบที่มือ

ดังที่ได้กล่าวไว้คุณสามารถใช้การทดสอบหลายปีและเพิ่มเวลาเป็นปัจจัยสุ่ม แต่ถ้าความสนใจของคุณเป็นจริงในความแตกต่างระหว่างผู้สมัครเหล่านี้ในการทดสอบนี้โดยเฉพาะคุณไม่สามารถใช้การวางหลักเกณฑ์ทั่วไปและการทดสอบไม่มีสติ


15

การอนุมานเชิงสถิติเป็นการสอนในบริบทของตัวอย่างความน่าจะเป็นและลักษณะของข้อผิดพลาดการสุ่มตัวอย่าง รุ่นนี้เป็นพื้นฐานสำหรับการทดสอบความสำคัญ อย่างไรก็ตามมีวิธีการอื่น ๆ ในการจำลองแบบการออกจากระบบอย่างบังเอิญและปรากฎว่าการทดสอบแบบอิงพารามิเตอร์ (การสุ่มตัวอย่าง) ของเรามีแนวโน้มที่จะเป็นการประมาณทางเลือกที่ดีของทางเลือกเหล่านี้

การทดสอบพารามิเตอร์ของสมมติฐานขึ้นอยู่กับทฤษฎีการสุ่มตัวอย่างเพื่อสร้างประมาณการของข้อผิดพลาดที่อาจเกิดขึ้น หากตัวอย่างขนาดที่กำหนดมาจากประชากรความรู้เกี่ยวกับธรรมชาติของการสุ่มตัวอย่างทำให้การทดสอบและช่วงความมั่นใจมีความหมาย ด้วยประชากรทฤษฎีการสุ่มตัวอย่างไม่เกี่ยวข้องเลยและการทดสอบนั้นไม่มีความหมายในความหมายดั้งเดิม การอนุมานไม่มีประโยชน์ไม่มีอะไรจะอนุมานได้มีเพียงสิ่ง ... พารามิเตอร์เอง

บางคนได้รับสิ่งนี้โดยดึงดูดประชากรที่มีจำนวนประชากรสูงที่สุดซึ่งการสำรวจสำมะโนประชากรในปัจจุบันแสดงให้เห็น ฉันพบว่าสิ่งเหล่านี้ไม่น่าเชื่อ - การทดสอบพารามิเตอร์นั้นมาจากการสุ่มตัวอย่างความน่าจะเป็นและคุณลักษณะของมัน ประชากรในเวลาที่กำหนดอาจเป็นตัวอย่างของประชากรขนาดใหญ่ในช่วงเวลาและสถานที่ อย่างไรก็ตามฉันไม่เห็นวิธีใด ๆ ที่จะโต้แย้งได้ว่านี่เป็นตัวอย่างแบบสุ่ม (หรือโดยทั่วไปในรูปแบบใด ๆ ของความน่าจะเป็น) หากไม่มีตัวอย่างความน่าจะเป็นทฤษฎีการสุ่มตัวอย่างและตรรกะการทดสอบแบบดั้งเดิมก็ใช้ไม่ได้ คุณอาจทดสอบบนพื้นฐานของตัวอย่างความสะดวกสบายเช่นกัน

เห็นได้ชัดว่าในการยอมรับการทดสอบเมื่อใช้ประชากรเราจำเป็นต้องแจกจ่ายพื้นฐานของการทดสอบเหล่านั้นในขั้นตอนการสุ่มตัวอย่าง วิธีหนึ่งในการทำเช่นนี้คือการรู้จักการเชื่อมต่ออย่างใกล้ชิดระหว่างการทดสอบตัวอย่างเชิงทฤษฎีของเราเช่น t, Z และ F - และขั้นตอนการสุ่ม การทดสอบแบบสุ่มขึ้นอยู่กับตัวอย่างในมือ ถ้าฉันรวบรวมข้อมูลเกี่ยวกับรายได้ของชายและหญิงรูปแบบความน่าจะเป็นและพื้นฐานสำหรับการประมาณการข้อผิดพลาดของเราคือการจัดสรรแบบสุ่มซ้ำของค่าข้อมูลจริง ฉันสามารถเปรียบเทียบความแตกต่างที่สังเกตได้ระหว่างกลุ่มกับการแจกแจงโดยใช้การสุ่มนี้ (เราทำสิ่งนี้ตลอดเวลาในการทดลองโดยวิธีการที่การสุ่มตัวอย่างจากแบบจำลองประชากรไม่ค่อยเหมาะสม)

ตอนนี้ปรากฎว่าการทดสอบตัวอย่าง - ทฤษฎีมักจะเป็นการประมาณที่ดีของการทดสอบการสุ่ม ในที่สุดฉันคิดว่าการทดสอบจากประชากรนั้นมีประโยชน์และมีความหมายภายในกรอบนี้และสามารถช่วยแยกแยะระบบจากการแปรผันของโอกาสเช่นเดียวกับการทดสอบตามตัวอย่าง ตรรกะที่ใช้เพื่อให้มีความแตกต่างกันเล็กน้อย แต่ก็ไม่ได้ส่งผลกระทบต่อความหมายในทางปฏิบัติและการใช้การทดสอบมากนัก แน่นอนว่าอาจเป็นการดีกว่าที่จะใช้การทดสอบการสุ่มและการเปลี่ยนรูปโดยตรงเนื่องจากพวกเขาสามารถใช้งานได้ง่ายด้วยพลังการประมวลผลที่ทันสมัยของเรา


3
+1 สำหรับการสนทนาที่สมเหตุสมผล แม้ว่าบางจุด เครื่องจักรอนุมานไม่พร้อมใช้งานสำหรับการวิเคราะห์ประชากร แต่ในกรณีการสร้างแบบจำลองหลายผมถามว่าใครเคยมีข้อมูลประชากรจะเริ่มต้นด้วย - มักจะเป็นไปไม่ได้ยากมากที่จะกระตุ้นหลุม ดังนั้นจึงไม่ใช่เรื่องน่าดึงดูดสำหรับประชากรระดับสูงเนื่องจากเป็นวิธีในการปรับใช้การอนุมาน แทนที่จะเป็น "ประชากรขั้นสูง" วิธีที่ดีกว่าคือการสมมติว่ากระบวนการสร้างข้อมูลให้ผลตัวอย่างเช่นการทดสอบปีต่อปี นั่นคือสิ่งที่องค์ประกอบสุ่มเกิดขึ้น
ARS

2
ฉันไม่คิดว่าจะมีข้อขัดแย้งใด ๆ ที่นี่ยกเว้นการขาดเครื่องจักรเชิงอนุมานสำหรับการวิเคราะห์ประชากร การทดสอบแบบสุ่มนั้นใช้กับประชากรและสามารถทดสอบได้อย่างสมเหตุสมผลว่ากระบวนการสร้างข้อมูลนั้นน่าจะเกิดจากกระบวนการสร้างแบบสุ่มกับกระบวนการสร้างอย่างเป็นระบบหรือไม่ พวกเขาไม่ได้สุ่มตัวอย่างแบบสุ่มและเป็นการทดสอบโดยตรงของโอกาสและการเปลี่ยนแปลงที่เป็นระบบ การทดสอบแบบดั้งเดิมของเรานั้นค่อนข้างดีสำหรับพวกเขา
Brett

นั่นเป็นเรื่องจริงอีกครั้ง: "ขาดเครื่องจักรเชิงอนุมาน" ถ้อยคำที่ประมาทในส่วนของฉันโดยเฉพาะอย่างยิ่งเมื่อฉันชอบจุดที่คุณทำเกี่ยวกับการทดสอบการสุ่มในคำตอบของคุณ
ARS

ขอโทษ ฉันมีปัญหาในการทำความเข้าใจว่าฉันจะคำนวณพีชคณิตได้อย่างไรและข้อสรุปใดที่ฉันจะทำได้สำหรับพวกเขา
pbneau

การบูตสแตรปไม่ใช่ทางเลือกที่ถูกต้องหรือไม่? การบูตสแตรปล้มเหลวในการแก้ไขความจำเป็นในการตั้งสมมติฐานข้อใดข้อหนึ่งเหล่านี้อย่างไร
Chernoff

3

สมมติว่าผลลัพธ์ระบุว่าผู้สมัครแตกต่างกันไปตามเพศ ตัวอย่างเช่นสัดส่วนของผู้ที่เสร็จสิ้นการทดสอบมีดังนี้: หญิง 40% และชาย 60% เพื่อแนะนำชัดเจน 40% แตกต่างจาก 60% ตอนนี้สิ่งสำคัญคือการตัดสินใจ: 1) ประชากรที่คุณสนใจ; 2) การสังเกตของคุณเกี่ยวข้องกับจำนวนประชากรที่น่าสนใจอย่างไร นี่คือรายละเอียดบางอย่างเกี่ยวกับปัญหาทั้งสองนี้:

  1. หากประชากรที่คุณสนใจเป็นเพียงผู้สมัครที่คุณสังเกตเห็น (เช่นผู้สมัคร 100 คนที่สมัครเข้ามหาวิทยาลัยในปี 2559) คุณไม่จำเป็นต้องรายงานการทดสอบนัยสำคัญทางสถิติ นี่เป็นเพราะประชากรที่คุณสนใจนั้นถูกสุ่มตัวอย่างอย่างสมบูรณ์ ... สิ่งที่คุณสนใจคือผู้สมัคร 100 คนที่คุณมีข้อมูลที่สมบูรณ์ นั่นคือ 60% คือหยุดเต็มแตกต่างจาก 40% คำถามแบบนี้คำตอบคือมีความแตกต่างทางเพศในประชากร 100 คนที่ใช้กับโปรแกรมหรือไม่ นี่เป็นคำถามที่อธิบายและคำตอบคือใช่

  2. อย่างไรก็ตามคำถามสำคัญหลายข้อเกี่ยวกับสิ่งที่จะเกิดขึ้นในการตั้งค่าที่แตกต่างกัน นั่นคือนักวิจัยหลายคนต้องการหาแนวโน้มเกี่ยวกับอดีตที่จะช่วยเราทำนาย (และวางแผน) อนาคต ตัวอย่างคำถามในเรื่องนี้คือการทดสอบในอนาคตของผู้สมัครมีแนวโน้มว่าจะแตกต่างกันไปตามเพศหรือไม่ จำนวนประชากรที่น่าสนใจนั้นกว้างกว่าในสถานการณ์ # 1 ข้างต้น ณ จุดนี้คำถามสำคัญที่ต้องถามคือ: ข้อมูลที่คุณสังเกตเห็นมีแนวโน้มว่าจะเป็นตัวแทนของแนวโน้มในอนาคตหรือไม่ นี่เป็นคำถามรองและขึ้นอยู่กับข้อมูลที่ได้รับจากผู้โพสต์ดั้งเดิมคำตอบคือ: เราไม่รู้

โดยสรุปสถิติที่คุณรายงานนั้นขึ้นอยู่กับประเภทของคำถามที่คุณต้องการตอบ

การคิดเกี่ยวกับการออกแบบการวิจัยขั้นพื้นฐานอาจมีประโยชน์มากที่สุด (ลองที่นี่: http://www.socialresearchmethods.net/kb/design.php ) การคิดถึงเรื่องประชากรยิ่งยวดอาจช่วยได้หากคุณต้องการข้อมูลขั้นสูงเพิ่มเติม (นี่คือบทความที่อาจช่วยได้: http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 )


2

หากคุณพิจารณาว่าอะไรที่คุณกำลังวัดว่าเป็นกระบวนการแบบสุ่มใช่การทดสอบทางสถิตินั้นเกี่ยวข้อง ยกตัวอย่างเช่นพลิกเหรียญ 10 ครั้งเพื่อดูว่ามันยุติธรรมหรือไม่ คุณได้ 6 หัวและ 4 ก้อย - คุณสรุปอะไร?


1
ฉันไม่เข้าใจจริงๆว่าข้อสรุปที่คุณได้รับเกี่ยวกับการโยนเหรียญเกี่ยวข้องกับคำถามที่ถามหรือไม่ บางทีคุณอาจขยายจุดเล็กน้อยไปหน่อย? การทดสอบทางสถิติดูเหมือนจะเกี่ยวข้องกับขอบเขตที่พวกเขาช่วยในการอนุมานผลลัพธ์ที่สังเกตกับประชากรขนาดใหญ่ไม่ว่าจะเป็นการอ้างอิงหรือประชากรทั่วไป คำถามที่นี่ดูเหมือนจะ: จากตัวอย่างที่อยู่ใกล้กับประชากรของผู้ทดสอบในช่วงเวลาที่กำหนด (ที่นี่หนึ่งปี), การอนุมานคลาสสิกเป็นวิธีที่เหมาะสมในการตัดสินใจเกี่ยวกับความแตกต่างที่เป็นไปได้ในระดับบุคคล?
chl

1
@chl ใช่ แต่ดูเหมือนว่า OP จะพยายามสรุปความน่าจะเป็นพื้นฐานของความสำเร็จ การทดสอบเปรียบเทียบสัดส่วนที่สังเกตได้กับการแจกแจงเชิงทฤษฎีเพื่อพิจารณาว่ามีความแตกต่างสำหรับระดับความเชื่อมั่นที่กำหนดหรือไม่ คุณกำลังทดสอบรูปแบบสุ่มใด ๆ ไม่ใช่แค่สุ่มตัวอย่างข้อผิดพลาดแบบสุ่ม
James
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.