อย่าใช้การประมาณปกติ
มีคนมากมายที่เขียนเกี่ยวกับปัญหานี้ คำแนะนำทั่วไปคือไม่เคยใช้การประมาณปกติ (เช่นช่วงความมั่นใจ asymptotic / Wald) เนื่องจากมีคุณสมบัติการรายงานที่แย่มาก รหัส R เพื่อแสดงสิ่งนี้:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
สำหรับความน่าจะเป็นที่จะประสบความสำเร็จเล็กน้อยคุณอาจขอช่วงความมั่นใจ 95% แต่จริง ๆ แล้วขอพูดช่วงเวลาความมั่นใจ 10%!
ข้อเสนอแนะ
แล้วเราควรใช้อะไร ฉันเชื่อว่าข้อเสนอแนะปัจจุบันเป็นสิ่งที่ระบุไว้ในการประมาณค่าแบบช่วงเวลาของกระดาษสำหรับสัดส่วนแบบทวินามโดย Brown, Cai และ DasGupta ในสถิติทางวิทยาศาสตร์ 2001, vol. หมายเลข 16 2 หน้า 101–133 ผู้เขียนตรวจสอบหลายวิธีในการคำนวณช่วงความมั่นใจ
[W] อีแนะนำช่วงเวลาที่วิลสันหรือเท่ากับนกฟรีย์ช่วงก่อนสำหรับขนาดเล็กและnและช่วงเวลาที่แนะนำในอาเกรสติและ Coull สำหรับขนาดใหญ่n
บางครั้งช่วงเวลาวิลสันก็บางครั้งเรียกว่าช่วงคะแนนเนื่องจากมันขึ้นอยู่กับการคว่ำการทดสอบคะแนน
การคำนวณช่วงเวลา
ในการคำนวณช่วงความมั่นใจเหล่านี้คุณสามารถใช้เครื่องคิดเลขออนไลน์นี้หรือbinom.confint()
ฟังก์ชั่นในbinom
แพ็คเกจใน R ตัวอย่างเช่นสำหรับ 0 ความสำเร็จในการทดลอง 25 ครั้งรหัส R จะเป็น:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
นี่bayes
คือช่วงเวลาของ Jeffreys ( type="central"
จำเป็นต้องมีอาร์กิวเมนต์เพื่อให้ได้ช่วงเวลาที่เท่าเทียมกัน )
โปรดทราบว่าคุณควรตัดสินใจว่าจะใช้วิธีใดในสามวิธีก่อนที่จะคำนวณช่วงเวลา การดูทั้งสามและการเลือกที่สั้นที่สุดจะทำให้ความน่าจะเป็นของการครอบคลุมน้อยเกินไป
คำตอบที่รวดเร็วและคาดคะเน
ในฐานะโน้ตสุดท้ายหากคุณสังเกตว่าความสำเร็จเป็นศูนย์ในการทดลองnของคุณและเพียงแค่ต้องการช่วงความมั่นใจโดยประมาณที่รวดเร็วมากคุณสามารถใช้กฎสามข้อ เพียงแค่แบ่งจำนวน 3 โดยn ในตัวอย่างข้างต้นnคือ 25 ดังนั้นขอบเขตบนคือ 3/25 = 0.12 (ขอบล่างเป็น 0 แน่นอน)