ความแตกต่างระหว่าง N และ N-1 ในการคำนวณความแปรปรวนของประชากรคืออะไร?


50

ฉันไม่เข้าใจว่าทำไมถึงมีNและN-1ขณะคำนวณความแปรปรวนของประชากร เวลาที่เราใช้Nและเมื่อไหร่ที่เราจะใช้N-1?

ป้อนคำอธิบายรูปภาพที่นี่
คลิกที่นี่สำหรับรุ่นที่ใหญ่กว่า

มันบอกว่าเมื่อประชากรมีขนาดใหญ่มากไม่มีความแตกต่างระหว่าง N และ N-1 แต่ไม่ได้บอกว่าทำไมถึงมี N-1 ตั้งแต่แรก

แก้ไข: โปรดอย่าสับสนnและn-1ใช้ในการประมาณ

แก้ไข 2: ฉันไม่ได้พูดถึงการประมาณประชากร


5
คุณสามารถหาคำตอบที่นั่นstats.stackexchange.com/questions/16008/... โดยทั่วไปคุณควรใช้ N-1 เมื่อคุณประมาณค่าความแปรปรวนและ N เมื่อคุณคำนวณมันอย่างแน่นอน
ocram

@ocram เท่าที่ฉันรู้เมื่อเราประมาณค่าความแปรปรวนที่เราใช้ n หรือ n-1
ilhan

หากคุณต้องการให้ตัวประมาณของคุณเป็นกลางคุณควรใช้ n-1 โปรดทราบว่าเมื่อ n มีขนาดใหญ่สิ่งนี้ไม่สำคัญ
ocram

2
N1N11/Ny
StasK

2
นี่ไม่ได้เพิ่มคำตอบอื่น ๆ จริงๆ ตัวหารที่แตกต่างกันนั้นให้คำตอบที่ต่างกันหรือแม้แต่ความแตกต่างที่ลดลงกับ N ก็ไม่เป็นปัญหา คำถามคือเมื่อใดและทำไมต้องใช้ตัวหาร
Nick Cox

คำตอบ:


26

Nn(N1)/N=1(1/N)12/N117/Nexp(1/N)

(n1)/nn11/N

NN

NN1NNn


24

แทนที่จะเข้าสู่วิชาคณิตศาสตร์ฉันจะพยายามทำให้เป็นคำธรรมดา หากคุณมีประชากรทั้งหมดในการกำจัดความแปรปรวน ( ความแปรปรวนของประชากร ) จะถูกคำนวณด้วยตัวNส่วน ในทำนองเดียวกันหากคุณมีเพียงตัวอย่างและต้องการคำนวณความแปรปรวนของตัวอย่างนี้คุณต้องใช้ตัวส่วนN(n ตัวอย่างในกรณีนี้) ในทั้งสองกรณีโปรดทราบว่าคุณไม่ได้ประเมินอะไรเลย: ค่าเฉลี่ยที่คุณวัดได้คือค่าเฉลี่ยจริงและความแปรปรวนที่คุณคำนวณจากค่าเฉลี่ยนั้นเป็นค่าความแปรปรวนที่แท้จริง

ตอนนี้คุณมีเพียงตัวอย่างและต้องการสรุปเกี่ยวกับค่าเฉลี่ยและความแปรปรวนที่ไม่รู้จักในประชากร ในคำอื่น ๆ ที่คุณต้องการประมาณการ คุณใช้ค่าเฉลี่ยตัวอย่างของคุณสำหรับการประมาณค่าเฉลี่ยประชากร (เพราะตัวอย่างของคุณคือตัวแทน), ตกลง เพื่อให้ได้ค่าประมาณความแปรปรวนประชากรคุณต้องแกล้งทำเป็นว่าค่าเฉลี่ยนั้นเป็นค่าเฉลี่ยประชากรจริง ๆ และดังนั้นจึงไม่ได้ขึ้นอยู่กับกลุ่มตัวอย่างของคุณอีกต่อไปตั้งแต่เมื่อคุณคำนวณมัน หากต้องการ "แสดง" ว่าตอนนี้คุณได้รับการแก้ไขแล้วคุณจะจองหนึ่งการสังเกตจากตัวอย่างของคุณเพื่อ "สนับสนุน" ค่าเฉลี่ย: ไม่ว่าตัวอย่างของคุณจะเกิดอะไรขึ้นการสังเกตที่สงวนไว้เพียงครั้งเดียว ได้รับและที่เชื่อว่าไม่สำคัญต่อการสุ่มตัวอย่างฉุกเฉิน หนึ่งการสังเกตที่สงวนไว้คือ "-1"N-1 ในการคำนวณค่าความแปรปรวน

ลองนึกภาพว่าคุณรู้ค่าเฉลี่ยประชากรจริง ๆ แต่ต้องการประมาณความแปรปรวนจากกลุ่มตัวอย่าง จากนั้นคุณจะแทนที่ค่าเฉลี่ยจริงลงในสูตรสำหรับความแปรปรวนและใช้ตัวส่วนN: ไม่จำเป็นต้องมี "-1" ที่นี่เนื่องจากคุณรู้ค่าเฉลี่ยจริงคุณไม่ได้ประมาณค่าจากตัวอย่างเดียวกันนี้


แต่คำถามของฉันไม่มีส่วนเกี่ยวข้องกับการประมาณ มันเกี่ยวกับการคำนวณความแปรปรวนของประชากร ด้วย N และ N-1 ฉันไม่ได้พูดถึง n และ n-1
ilhan

1
@ilhan ในคำตอบของฉันฉันใช้Nทั้ง N และ n Nมีขนาดเท่ากับจำนวนทั้งหมดในมือไม่ว่าจะเป็นประชากรหรือกลุ่มตัวอย่าง ในการคำนวณความแปรปรวนประชากรคุณจะต้องมีประชากรเมื่อคุณต้องการ หากคุณมีตัวอย่างเพียงอย่างเดียวคุณสามารถคำนวณความแปรปรวนของตัวอย่างนี้หรือการคำนวณค่าความแปรปรวนประชากรโดยคำนวณได้ ไม่มีทางอื่น ๆ รอบ
ttnphns

ฉันมีข้อมูลที่สมบูรณ์เกี่ยวกับประชากรของฉัน รู้คุณค่าทั้งหมดแล้ว ฉันไม่สนใจการประมาณ
ilhan

1
หากคุณมีประชากรของคุณให้ใช้ N. N-1 จะไม่มีเหตุผลที่จะใช้
ttnphns

1
@ilhan - ไม่สามารถแสดงความคิดเห็นโดยตรงกับความคิดเห็นของคุณเพื่อโพสต์ ttnphns แต่นี่คือคำอธิบายของสิ่งที่คุณเห็นในหนังสือและวิธีที่คุณควรอนุมาน สัญลักษณ์ 'S' เมื่อใช้เพื่อบ่งบอกถึงความแปรปรวนมักหมายถึงความแปรปรวนตัวอย่าง ซิกมาตัวอักษรกรีกใช้เพื่ออ้างถึงความแปรปรวนของประชากร นั่นคือเหตุผลที่คุณเห็นหนังสือที่กล่าวถึง S = N * sigma / (N - 1)
Arvind

9

โดยทั่วไปเมื่อมีเพียงเศษเสี้ยวของประชากรนั่นคือตัวอย่างคุณควรหารด้วย n-1 มีเหตุผลที่ดีที่จะทำเช่นนั้นเรารู้ว่าความแปรปรวนตัวอย่างซึ่งคูณค่าเบี่ยงเบนกำลังสองเฉลี่ยจากค่าเฉลี่ยตัวอย่างโดย (n − 1) / n เป็นตัวประมาณค่าความแปรปรวนประชากรแบบไม่เอนเอียง

คุณสามารถหาหลักฐานได้ว่าตัวประมาณค่าความแปรปรวนตัวอย่างไม่เอนเอียงที่นี่: https://economictheoryblog.com/2012/06/28/latexlatexs2/

นอกจากนี้หากมีการใช้ตัวประมาณความแปรปรวนประชากรนั่นคือเวอร์ชันของตัวประมาณค่าความแปรปรวนที่หารด้วย n บนตัวอย่างแทนที่จะเป็นประชากรการประมาณที่ได้รับจะมีอคติ


ดูเหมือนว่าจะตอบคำถามอื่นเกี่ยวกับการประมาณค่าความแปรปรวนของประชากร ดูเหมือนว่าจะเป็นวงกลม: คำตอบนี้ไม่ได้บอกล่วงหน้าในการทำข้อตกลงเฉพาะสำหรับการกำหนดความแปรปรวนของประชากรตั้งแต่แรก?
whuber

7

ในอดีตมีข้อโต้แย้งว่าคุณควรใช้ N สำหรับความแปรปรวนแบบไม่อนุมาน แต่ฉันจะไม่แนะนำอีกต่อไป คุณควรใช้ N-1 เสมอ เมื่อขนาดตัวอย่างลดลง N-1 เป็นการแก้ไขที่ดีทีเดียวสำหรับความจริงที่ว่าความแปรปรวนตัวอย่างลดลง (คุณมีแนวโน้มที่จะสุ่มตัวอย่างใกล้จุดสูงสุดของการกระจาย --- ดูรูป) ถ้าขนาดตัวอย่างใหญ่จริงมันก็ไม่สำคัญว่าจะมีความหมายอะไร

คำอธิบายทางเลือกคือประชากรเป็นโครงสร้างทางทฤษฎีที่ไม่สามารถทำได้ ดังนั้นให้ใช้ N-1 เสมอเพราะสิ่งที่คุณทำอยู่คุณจะต้องประเมินความแปรปรวนประชากร

นอกจากนี้คุณจะเห็น N-1 สำหรับการประมาณค่าความแปรปรวนจากที่นี่ในคุณอาจไม่เคยพบปัญหานี้ ... ยกเว้นในการทดสอบเมื่อครูของคุณอาจขอให้คุณแยกความแตกต่างระหว่างการอนุมานและ การวัดความแปรปรวนแบบไม่อนุมาน ในกรณีนั้นอย่าใช้คำตอบหรือเหมืองแร่ของ whuber อ้างถึงคำตอบของ ttnphns

รูปที่ 1

หมายเหตุในภาพนี้ความแปรปรวนควรอยู่ใกล้กับ 1 ดูความแปรผันของขนาดตัวอย่างเมื่อคุณใช้ N เพื่อประเมินความแปรปรวน (นี่คือ "อคติ" ที่อ้างถึงทุกที่)


1
โปรดบอกฉันทีว่าทำไม "ไม่แนะนำอีกต่อไป" กับประชากรจริงในมือ? ประชากรไม่ได้เป็นโครงสร้างทางทฤษฎีเสมอไป บางครั้งตัวอย่างของคุณคือประชากรที่จริงใจสำหรับคุณ
ttnphns

1
ilhan, N สามารถใช้สำหรับตัวอย่างของคุณ, หรือสามารถใช้สำหรับขนาดประชากร, ถ้ามีอยู่ ในกรณีส่วนใหญ่ความแตกต่างระหว่างขนาดใหญ่ N และขนาดเล็ก n ขึ้นอยู่กับหัวข้อ ตัวอย่างเช่น n อาจเป็นจำนวนกรณีในแต่ละเงื่อนไขในการทดสอบในขณะที่ N อาจเป็นหมายเลขสำหรับการทดสอบ พวกเขาทั้งสองตัวอย่าง ไม่มีกฎสากล
จอห์น

1
อย่างไรก็ตามมันขึ้นอยู่กับความหมายของประชากร ฉันจะยืนยันว่าหากประชากรทั้งหมดของคุณมีขนาดเล็กมากที่ N-1 มีความสำคัญมันก็น่าสงสัยว่าการคำนวณค่าเบี่ยงเบนกำลังสองเฉลี่ยนั้นมีประโยชน์จากระยะไกลหรือไม่ แสดงค่าทั้งหมดรูปร่างและช่วงของพวกเขา นอกจากนี้อาร์กิวเมนต์เก่าทั้งหมดที่คุณมีอิสระในระดับ N จริงหากคุณไม่ได้ทำการอนุมานนั้นเป็นที่น่าสงสัย คุณทำสิ่งนี้หายไปเมื่อคุณคำนวณค่าเฉลี่ยคุณต้องคำนวณความแปรปรวน
จอห์น

1
@ จอห์นถ้าคุณคำนวณค่าเฉลี่ยภายในประชากรคุณเพียงแค่ระบุความจริงเกี่ยวกับพารามิเตอร์ดังนั้นคุณไม่ต้องใช้ความอิสระ หากคุณคำนวณในตัวอย่างและต้องการอนุมานเกี่ยวกับประชากรคุณจะใช้จ่าย นอกจากนี้ฉันสามารถมีประชากรได้ด้วย N = 1 ด้วยตัวส่วน N-1 ปรากฏว่าพารามิเตอร์ดังกล่าวเป็นความแปรปรวนไม่มีอยู่สำหรับมัน มันไร้สาระ
ttnphns

3
@ilhan โปรดลองอัปเดตคำถามของคุณ (เช่นเดียวกับคุณ) และชี้ไปที่เวอร์ชันที่อัปเดตแทนที่จะแสดงความคิดเห็นที่ไม่สร้างสรรค์ดังกล่าว ทุกอย่างถกเถียงกันโดยเฉพาะอย่างยิ่งเมื่อคำถามตัวเองขาดบริบท ดูเหมือนว่าปัญหานี้มาจากการนิยามว่าประชากรคืออะไร
chl

4

ความแปรปรวนประชากรคือผลรวมของการเบี่ยงเบนกำลังสองของค่าทั้งหมดในประชากรหารด้วยจำนวนค่าในประชากร เมื่อเราประเมินความแปรปรวนของประชากรจากตัวอย่างเราพบปัญหาที่ค่าเบี่ยงเบนของค่าตัวอย่างจากค่าเฉลี่ยของกลุ่มตัวอย่างโดยเฉลี่ยน้อยกว่าค่าเบี่ยงเบนเล็กน้อยของค่าตัวอย่างเหล่านั้นจาก ( ไม่ทราบ) ค่าเฉลี่ยประชากรที่แท้จริง ผลลัพธ์นั้นเป็นความแปรปรวนที่คำนวณจากกลุ่มตัวอย่างซึ่งน้อยกว่าค่าความแปรปรวนประชากรจริงเล็กน้อย การใช้ตัวหาร n-1 แทนการแก้ไข n สำหรับการประเมินค่าต่ำไป


@ Bunnenburg หากคุณได้รับคำตอบสำหรับคำถามของคุณ โปรดชัดเจนให้ฉันตอนนี้สิ่งที่คุณได้รับ? มันเป็นความสับสนอย่างมากสำหรับฉันเช่นกัน
Bilal Para

เพื่อชดเชยความแปรปรวนน้อยที่เราได้รับทำไมไม่ใช้ n-2, n-3 และอื่น ๆ ไม่ได้? เหตุใด n-1 โดยเฉพาะ ทำไมไม่คงที่ ... ???
Saravanabalagi Ramachandran

@SaravanabalagiRamachandran ความแตกต่างขึ้นอยู่กับขนาดตัวอย่างดังนั้นค่าคงที่จะไม่แสดง การแก้ไขโดยใช้ n-1 นั้นจะทำงานได้ใกล้เคียงกว่าที่คุณพูดถึง
Michael Lew
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.