ความแตกต่างระหว่างประชากรกับกลุ่มตัวอย่างคืออะไร?


38

ความแตกต่างระหว่างประชากรกับกลุ่มตัวอย่างคืออะไร? มีตัวแปรและสถิติทั่วไปใดบ้างที่ใช้สำหรับแต่ละตัวและเกี่ยวข้องกันอย่างไร


คำตอบ:


36

ประชากรคือกลุ่มของหน่วยงานที่อยู่ระหว่างการศึกษา ตัวอย่างเช่นความสูงเฉลี่ยของผู้ชาย นี่คือประชากรสมมุติฐานเพราะมันรวมถึงผู้ชายทุกคนที่มีชีวิตอยู่มีชีวิตอยู่และจะมีชีวิตอยู่ในอนาคต ฉันชอบตัวอย่างนี้เพราะมันเป็นจุดที่เราในฐานะนักวิเคราะห์เลือกบ้านที่เราต้องการศึกษา โดยทั่วไปแล้วมันเป็นไปไม่ได้ที่จะสำรวจ / วัดประชากรทั้งหมดเพราะไม่ใช่ว่าสมาชิกทุกคนจะสังเกตได้ (เช่นผู้ชายที่จะมีอยู่ในอนาคต) หากเป็นไปได้ที่จะแจกแจงจำนวนประชากรทั้งหมดมันมักจะมีค่าใช้จ่ายสูงและจะใช้เวลามาก ในตัวอย่างข้างต้นเรามีประชากร "ผู้ชาย" และพารามิเตอร์ที่น่าสนใจความสูงของพวกเขา

แต่เราสามารถรับเซตย่อยของประชากรกลุ่มนี้ที่เรียกว่าตัวอย่างและใช้ตัวอย่างนี้เพื่อวาดการอนุมานเกี่ยวกับประชากรที่อยู่ภายใต้การศึกษาโดยมีเงื่อนไขบางประการ ดังนั้นเราสามารถวัดความสูงเฉลี่ยของผู้ชายในตัวอย่างของประชากรที่เราเรียกว่าสถิติและใช้สิ่งนี้เพื่อวาดการอนุมานเกี่ยวกับพารามิเตอร์ที่น่าสนใจในประชากร มันเป็นการอนุมานเพราะจะมีความไม่แน่นอนและความไม่ถูกต้องบางอย่างที่เกี่ยวข้องในการสรุปผลเกี่ยวกับประชากรตามตัวอย่าง สิ่งนี้ควรชัดเจน - เรามีสมาชิกในกลุ่มตัวอย่างน้อยกว่าประชากรของเราดังนั้นเราจึงสูญเสียข้อมูลบางอย่าง

มีหลายวิธีในการเลือกตัวอย่างและการศึกษาสิ่งนี้เรียกว่าทฤษฎีการสุ่มตัวอย่าง วิธีการที่ใช้กันทั่วไปเรียกว่า Simple Random Sampling (SRS) ใน SRS สมาชิกแต่ละคนของประชากรมีความน่าจะเป็นเท่ากับที่จะรวมอยู่ในตัวอย่างดังนั้นคำว่า "สุ่ม" มีวิธีการสุ่มตัวอย่างอื่น ๆ อีกมากมายเช่นการสุ่มแบ่งชั้นแบบสุ่มการสุ่มตัวอย่างแบบคลัสเตอร์ ฯลฯ ซึ่งทั้งหมดมีข้อดีและข้อเสีย

สิ่งสำคัญคือต้องจำไว้ว่าตัวอย่างที่เราดึงมาจากประชากรนั้นเป็นเพียงตัวอย่างเดียวจากกลุ่มตัวอย่างที่มีศักยภาพจำนวนมาก หากนักวิจัยสิบคนกำลังศึกษาประชากรเดียวกันวาดตัวอย่างของพวกเขาเองพวกเขาอาจได้คำตอบที่แตกต่างกัน กลับไปที่ตัวอย่างก่อนหน้าของเรานักวิจัยสิบคนแต่ละคนอาจมีความสูงเฉลี่ยของผู้ชายที่แตกต่างกันเช่นสถิติในคำถาม (ความสูงเฉลี่ย) แตกต่างกันไปตัวอย่าง - มีการแจกแจงที่เรียกว่าการกระจายตัวอย่าง เราสามารถใช้การกระจายตัวนี้เพื่อทำความเข้าใจกับความไม่แน่นอนในการประมาณค่าพารามิเตอร์ประชากรของเรา

การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างเป็นที่รู้จักกันว่าเป็นการแจกแจงแบบปกติที่มีค่าเบี่ยงเบนมาตรฐานเท่ากับค่าเบี่ยงเบนมาตรฐานตัวอย่างหารด้วยขนาดตัวอย่าง เพราะนี้ได้อย่างง่ายดายอาจจะสับสนกับค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างที่ร่วมกันมากขึ้นที่จะเรียกค่าเบี่ยงเบนมาตรฐานของการกระจายการสุ่มตัวอย่างข้อผิดพลาดมาตรฐาน


7
มันไม่มีประโยชน์อะไรหรือเปล่าที่การใช้ "คนทุกคน" ในฐานะของประชากร? ผมหมายถึงมีไม่ได้ฉันทามติเป็นวิธีเก่าที่ Homo sapiensเป็นหรือไม่ว่าตุ๊ด neanderthalensisเป็นสายพันธุ์ที่แยกให้อยู่คนเดียวไม่ว่าจะเป็นเพศของหินเครื่องมือใช้habilis ตุ๊ดนับเป็น "ผู้ชาย" ปัญหาเดียวกันนี้คงต้องเจอกับเราในอนาคตเช่นกัน
naught101

ในวรรคสุดท้ายผมคิดว่ามีความเป็นผู้เยาว์เล็กน้อยมือและมันควรอ่าน ... "เท่ากับค่าเบี่ยงเบนมาตรฐานตัวอย่างหารด้วย[ราก]ขนาดตัวอย่าง" ในการอ้างอิงถึงข้อผิดพลาดมาตรฐาน
Antoni Parellada

13

ประชากรคือชุดทั้งหมดของค่าหรือบุคคลที่คุณสนใจตัวอย่างเป็นส่วนย่อยของประชากรและเป็นชุดของค่าที่คุณใช้จริงในการประเมินของคุณ

ตัวอย่างเช่นถ้าคุณต้องการทราบความสูงเฉลี่ยของชาวจีนนั่นคือประชากรของคุณนั่นคือประชากรของจีน นี่คือตัวเลขค่อนข้างมากและคุณจะไม่สามารถรับข้อมูลสำหรับทุกคนที่นั่น ดังนั้นคุณวาดตัวอย่างนั่นคือคุณจะได้รับการสังเกตหรือความสูงของบางคนในประเทศจีน (กลุ่มย่อยของประชากรตัวอย่าง) และทำการอนุมานตามนั้น


คำตอบที่ดี. ฉันคิดว่าคุณควรดำเนินการต่อไปในสิ่งที่คุณหมายถึงโดย "อนุมานของคุณตามนั้น" นั่นเป็นส่วนที่สองของคำถามของฉัน
Baltimark

mmm ... ฉันไม่เข้าใจว่าคุณหมายถึงอะไรโดยตัวแปรทั่วไปและสถิติ ... โอ้คุณหมายถึงชอบคุณใช้การกระจาย z ถ้าคุณมีความแปรปรวนประชากรและการกระจายตัว t ถ้าคุณมีความแปรปรวนตัวอย่าง และขนาดตัวอย่างเล็ก? บางสิ่งบางอย่างตามสายเหล่านั้น?
Vivi

สิ่งที่ฉันได้รับคือค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานคือพารามิเตอร์ที่เกี่ยวข้องกับประชากร แต่พวกเขาประมาณโดยค่าเฉลี่ยตัวอย่าง ((1 / N) * \ sum (x_i)) และค่าเบี่ยงเบนมาตรฐานตัวอย่าง ((1 / ( N-1)) * \ sum (x_i - x ^ bar) ^ 2)
Baltimark

8

ประชากรคือทุกสิ่งในกลุ่มการศึกษา ตัวอย่างเช่นหากคุณกำลังศึกษาราคาหุ้นของ Apple มันเป็นราคาหุ้นในอดีตปัจจุบันและแม้แต่ในอนาคต หรือถ้าคุณทำโรงงานไข่มันคือไข่ทั้งหมดที่ผลิตโดยโรงงาน

คุณไม่จำเป็นต้องมีตัวอย่างเสมอไปและทำการทดสอบทางสถิติ หากประชากรของคุณเป็นครอบครัวที่อยู่อาศัยของคุณคุณไม่จำเป็นต้องสุ่มตัวอย่างเนื่องจากประชากรมีขนาดเล็ก

การสุ่มตัวอย่างเป็นที่นิยมด้วยเหตุผลหลายประการ:

  • มันถูกกว่าการสำรวจสำมะโนประชากร (สุ่มตัวอย่างประชากรทั้งหมด)
  • คุณไม่มีสิทธิ์เข้าถึงข้อมูลในอนาคตดังนั้นจะต้องลองตัวอย่างที่ผ่านมา
  • คุณต้องทำลายบางรายการโดยการทดสอบพวกเขาและไม่ต้องการที่จะทำลายพวกเขาทั้งหมด (พูดไข่)

2

เมื่อเราคิดถึงคำว่า "ประชากร" เรามักนึกถึงคนในเมืองภูมิภาครัฐหรือประเทศของเราและลักษณะเฉพาะของพวกเขาเช่นเพศอายุสถานภาพการสมรสสมาชิกชาติพันธุ์ศาสนาและอื่น ๆ ในสถิติคำว่า "ประชากร" มีความหมายแตกต่างกันเล็กน้อย "ประชากร" ในสถิติรวมถึงสมาชิกทุกคนของกลุ่มที่กำหนดว่าเรากำลังศึกษาหรือรวบรวมข้อมูลสำหรับการตัดสินใจที่ขับเคลื่อนด้วยข้อมูล

ส่วนหนึ่งของประชากรเรียกว่าตัวอย่าง มันเป็นสัดส่วนของประชากรส่วนหนึ่งของมันส่วนหนึ่งของมันและลักษณะทั้งหมดของมัน ตัวอย่างคือกลุ่มที่ถูกวาดทางวิทยาศาสตร์ที่มีคุณสมบัติเหมือนประชากรจริง ๆ - ถ้ามันถูกสุ่มแบบสุ่ม (นี่อาจเป็นเรื่องยากสำหรับคุณที่จะเชื่อ แต่มันเป็นเรื่องจริง!)

ตัวอย่างที่สุ่มจับต้องมีสองลักษณะ:

* ทุกคนมีโอกาสเท่าเทียมกันในการเลือกตัวอย่างของคุณ และ,

* การเลือกบุคคลหนึ่งเป็นอิสระจากการเลือกบุคคลอื่น

สิ่งที่ยอดเยี่ยมเกี่ยวกับกลุ่มตัวอย่างแบบสุ่มคือคุณสามารถพูดคุยกับประชากรที่คุณสนใจดังนั้นถ้าคุณสุ่มตัวอย่าง 500 ครัวเรือนในชุมชนของคุณคุณสามารถพูดคุยกับ 50,000 ครัวเรือนที่อาศัยอยู่ที่นั่น หากคุณตรงกับลักษณะทางประชากรบางส่วนของ 500 กับ 50,000 คุณจะเห็นว่าพวกมันคล้ายกันอย่างน่าประหลาดใจ


2
นี่เป็นพื้นฐานที่ถูกต้องหากตีความอย่างถูกต้อง ฉันกังวลว่าผู้อ่านบางคนอาจเข้าใจผิดคิดว่าตัวอย่างแบบง่าย ๆ ที่มีการแทนที่ (ซึ่งเป็นตัวอย่างแบบสุ่มที่คุณอธิบายมีชนิดอื่น) ทำซ้ำลักษณะทั้งหมดของประชากรอย่างถูกต้อง ในความเป็นจริงพวกเขาไม่ค่อยทำ จุดของการสุ่มตัวอย่างคือความแตกต่างระหว่างลักษณะของกลุ่มตัวอย่างและลักษณะของประชากรนั้นอาจเกิดจากกระบวนการคัดเลือกแบบสุ่ม
whuber

0

ประชากรรวมองค์ประกอบทั้งหมดจากชุดข้อมูล ตัวอย่างประกอบด้วยการสังเกตอย่างน้อยหนึ่งครั้งจากประชากร BOA, A. (2012, 17)


2
เมื่อองค์ประกอบทั้งหมดของ "ชุดข้อมูล" ถูกพิจารณาเป็นประชากรชุดข้อมูลนั้นจะถูกเรียกว่าการสำรวจสำมะโนประชากรของประชากร ชุดข้อมูลน้อยมากเป็นสำมะโน
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.