เกิดข้อผิดพลาดในการประเมินขนาดของชุดหรือไม่


9

สมมติว่าเรามีเซต A และเซตย่อย B หากเรารู้ว่า | A | ดังนั้นเราสามารถคำนวณ | B | โดยการค้นหาความน่าจะเป็นที่องค์ประกอบที่เลือกอย่างสุ่มจาก A นั้นเป็นของ B. เฉพาะ | A | p = | B |

สมมติว่าเราสร้างองค์ประกอบ n ของ A โดยการสุ่มและใช้ข้อมูลนี้เพื่อประเมิน p (จำนวนขององค์ประกอบใน B หารด้วย n) และด้วยเหตุนี้การประมาณ | B |

การประมาณนี้น่าเชื่อถือแค่ไหน คือเราจะคำนวณข้อผิดพลาดได้อย่างไร

คำถามข้างเคียงมีชื่อสำหรับเทคนิคนี้หรือไม่? (ดูเหมือนว่าจะเป็นรุ่นทางคณิตศาสตร์ของเทคนิคการมาร์คและการรำลึกกลับคืน )


1
มันเป็นการประมาณแบบทวินาม (ไม่มีการทำเครื่องหมายหรือการยึดซ้ำเลยซึ่งนำไปสู่การประมาณค่า hypergeometric)
whuber

คำตอบ:


8

คุณกำลังประมาณสัดส่วน สำหรับการเห็นพ้องกันให้จินตนาการว่า A คือประชากรของผู้ลงคะแนนและ B คือกลุ่มของผู้ลงคะแนนที่ลงคะแนนให้ผู้สมัครที่เฉพาะเจาะจง ดังนั้น p จะเป็นเปอร์เซ็นต์ของผู้ลงคะแนนที่จะลงคะแนนให้ผู้สมัครนั้น ปล่อย:

πเป็นเปอร์เซ็นต์ที่แท้จริงของผู้ที่จะลงคะแนนให้กับผู้สมัคร

ในคำอื่น ๆ :

π=|B||A|

จากนั้นตัวอย่างแต่ละตัวอย่างของคุณคือการทดลองแบบเบอนูลลี่ที่มีความน่าจะเป็นหรือเท่ากันคุณสามารถจินตนาการได้ว่าตัวอย่างแต่ละตัวอย่างของคุณเป็นการสำรวจความคิดเห็นของผู้มีสิทธิเลือกตั้งที่มีศักยภาพถามพวกเขาว่าพวกเขาจะลงคะแนนให้ผู้สมัคร ดังนั้น MLE ของมอบให้โดย:ππ

p=nBn

ที่ไหน

nBคือจำนวนคนที่บอกว่าพวกเขาจะลงคะแนนให้กับผู้สมัครหรือจำนวนองค์ประกอบที่เป็นของชุด B ในตัวอย่างขนาดคุณn

ข้อผิดพลาดมาตรฐานสำหรับการประมาณของคุณคือ:

π(1π)n

ด้านบนสามารถประมาณได้โดยใช้ MLE สำหรับ ie โดย:π

p(1p)n

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.