การประมาณความน่าจะเป็นในกระบวนการของ Bernoulli โดยการสุ่มตัวอย่างจนถึง 10 ความล้มเหลว: มันมีอคติหรือไม่


15

สมมติว่าเรามีกระบวนการ Bernoulli ที่มีความน่าจะเป็นล้มเหลวq (ซึ่งจะเล็กพูด ) จากที่เราสุ่มตัวอย่างจนกว่าเราจะพบความล้มเหลวดังนั้นเราจึงประเมินความน่าจะเป็นของความล้มเหลวเนื่องจากโดยที่คือจำนวนตัวอย่างq0.0110q^:=10/NN

คำถาม : อะไรคือประมาณการลำเอียงของ ? และถ้าเป็นเช่นนั้นมีวิธีแก้ไขหรือไม่?q^q

ฉันกังวลว่าการยืนยันตัวอย่างสุดท้ายคือความเอนเอียงที่ล้มเหลวในการประมาณการ


5
คำตอบปัจจุบันหยุดสั้นของการให้ความแปรปรวนต่ำสุดประมาณเป็นกลาง(N-1) ดูการสุ่มตัวอย่างและการประมาณจุดของบทความวิกิพีเดียในการกระจายทวินามเชิงลบ (101)/(N1)
A. เวบบ์

คำตอบ:


10

มันเป็นความจริงที่ว่าQเป็นประมาณการลำเอียงของQในแง่ที่ว่าE (q^qE(q^)qแต่คุณควรไม่จำเป็นต้องปล่อยให้เรื่องนี้เป็นอุปสรรคคุณ สถานการณ์ที่แน่นอนนี้สามารถใช้เป็นคำวิจารณ์ต่อความคิดที่ว่าเราควรใช้ตัวประมาณที่ไม่เอนเอียงเสมอเพราะที่นี่ความลำเอียงเป็นสิ่งประดิษฐ์ของการทดลองเฉพาะที่เรากำลังทำอยู่ ข้อมูลดูตรงตามที่เราต้องการหากเราเลือกจำนวนตัวอย่างล่วงหน้าดังนั้นการอนุมานของเราจึงเปลี่ยนไป

ที่น่าสนใจถ้าคุณต้องรวบรวมข้อมูลด้วยวิธีนี้แล้วจดบันทึกฟังก์ชันความน่าจะเป็นภายใต้ทั้งแบบทวินาม (ขนาดตัวอย่างคงที่) และแบบจำลองแบบทวินามลบ, คุณจะพบว่าทั้งสองเป็นสัดส่วนกัน ซึ่งหมายความว่าคิวq^เป็นเพียงการประมาณการโอกาสสูงสุดสามัญภายใต้รูปแบบทวินามเชิงลบซึ่งแน่นอนว่าเป็นประมาณการที่เหมาะสมได้อย่างสมบูรณ์แบบ


ที่ดี! ดูเหมือนว่า (สำหรับจุดประสงค์ของฉัน) อคตินี้ไม่ใช่ปัญหา
กวักมือ

9

มันไม่ได้ยืนยันว่าตัวอย่างสุดท้ายคือความล้มเหลวซึ่งการประเมินความเอนเอียงมันเป็นการรับส่วนกลับของN

ดังนั้น ในตัวอย่างของคุณ แต่ E[10E[N10]=1qQ นี่คือใกล้กับการเปรียบเทียบค่าเฉลี่ยเลขคณิตกับค่าเฉลี่ยฮาร์มอนิกE[10N]q

ข่าวร้ายก็คืออคติสามารถเพิ่มขึ้นได้เมื่อมีขนาดเล็กลงแม้ว่าจะน้อยมากเมื่อqมีขนาดเล็กอยู่แล้ว ข่าวดีก็คืออคติลดลงเมื่อจำนวนความล้มเหลวที่ต้องการเพิ่มขึ้น ดูเหมือนว่าถ้าคุณต้องการความล้มเหลวนั้นความเอนเอียงจะถูกล้อมด้วยค่าคูณของqqfสำหรับขนาดเล็กff1 ; คุณไม่ต้องการวิธีการนี้เมื่อคุณหยุดหลังจากความล้มเหลวครั้งแรก q

หยุดหลังจากความล้มเหลวครั้งด้วยq = 0.01คุณจะได้รับE [10q=0.01แต่ E[E[N10]=100ในขณะที่q=0.001คุณจะได้E[NE[10N]0.011097q=0.001แต่ E[10E[N10]=10000.001111 อคติประมาณ10E[10N]0.001111ปัจจัยคูณ 109


7

ในฐานะที่เป็นส่วนเติมเต็มให้คำตอบ dsaxton ของที่นี่มีการจำลองบางส่วนในการวิจัยแสดงให้เห็นถึงการกระจายตัวอย่างของQเมื่อk = 10และQ 0 = 0.02 :q^k=10q0=0.02

n_replications <- 10000
k <- 10
failure_prob <- 0.02
n_trials <- k + rnbinom(n_replications, size=k, prob=failure_prob)
all(n_trials >= k)  # Sanity check, cannot have 10 failures in < 10 trials

estimated_failure_probability <- k / n_trials
histogram_breaks <- seq(0, max(estimated_failure_probability) + 0.001, 0.001)
## png("estimated_failure_probability.png")
hist(estimated_failure_probability, breaks=histogram_breaks)
abline(v=failure_prob, col="red", lty=2, lwd=2)  # True failure probability in red
## dev.off()

mean(estimated_failure_probability)  # Around 0.022
sd(estimated_failure_probability)
t.test(x=estimated_failure_probability, mu=failure_prob)  # Interval around [0.0220, 0.0223]

ดูเหมือนว่าซึ่งเป็นอคติขนาดเล็กเมื่อเทียบค่อนข้างที่จะแปรปรวนในคิวE[q^]0.022q^

ฮิสโตแกรมของ q_hat


1
นั่นเป็นประโยชน์จริงๆ ในระดับนั้นมันไม่คุ้มกับที่ฉันต้องกังวล
becky

2
คุณสามารถเขียนการจำลองนี้ให้กระชับยิ่งขึ้นเมื่อ10+rnbinom(10000,10,0.02)
A. Webb

@ A..Webb ขอบคุณนั่นเป็นจุดที่ดี ฉันกำลังคิดค้นล้อใหม่ ฉันต้องการอ่าน? rnbinom แล้วฉันจะแก้ไขโพสต์ของฉัน
Adrian

1
10/(10+rnbinom(10000,10,0.02))ที่จะเป็น การกำหนดพารามิเตอร์นั้นอยู่ในรูปของจำนวนความสำเร็จ / ความล้มเหลวมากกว่าจำนวนการทดลองทั้งหมดดังนั้นคุณจะต้องเพิ่ม k = 10 กลับ โปรดทราบว่าตัวประมาณที่ไม่เอนเอียงจะเป็น9/(9+rnbinom(10000,10,0.02))ตัวเศษและตัวส่วนน้อย
A. เวบบ์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.