พวกเขาเชื่อว่าสมมาตรเพราะมักใช้การประมาณปกติ อันนี้ใช้ได้ดีพอในกรณีที่ p อยู่ประมาณ 0.5 binom.test
ในอีกทางหนึ่งรายงาน "ช่วงเวลา" แบบปิด "Clopper-Pearson ซึ่งขึ้นอยู่กับการแจกแจงแบบ F (ดูที่นี่สำหรับสูตรที่แม่นยำของทั้งสองวิธี) ถ้าเราจะใช้ช่วง Clopper-Pearson ใน R มันจะเป็นสิ่งที่ต้องการ (ดูหมายเหตุ ):
Clopper.Pearson <- function(x, n, conf.level){
alpha <- (1 - conf.level) / 2
QF.l <- qf(1 - alpha, 2*n - 2*x + 2, 2*x)
QF.u <- qf(1 - alpha, 2*x + 2, 2*n - 2*x)
ll <- if (x == 0){
0
} else { x / ( x + (n-x+1)*QF.l ) }
uu <- if (x == 0){
0
} else { (x+1)*QF.u / ( n - x + (x+1)*QF.u ) }
return(c(ll, uu))
}
คุณเห็นทั้งในลิงก์และในการนำไปใช้งานว่าสูตรสำหรับขีด จำกัด บนและล่างนั้นแตกต่างกันอย่างสิ้นเชิง กรณีเดียวของช่วงความเชื่อมั่นแบบสมมาตรคือเมื่อ p = 0.5 การใช้สูตรจากลิงค์และคำนึงถึงว่าในกรณีนี้n=2×xมันเป็นเรื่องง่ายที่จะเข้าใจว่ามันเกิดขึ้นได้อย่างไร
ฉันเองเข้าใจว่าเป็นการดีกว่าที่จะมองหาช่วงความเชื่อมั่นที่ดีขึ้นโดยใช้วิธีการโลจิสติกส์ โดยทั่วไปข้อมูลทวินามนั้นจะใช้แบบจำลองโดยใช้ฟังก์ชั่นลิงค์ logit ซึ่งนิยามเป็น:
logit(x)=log(x1−x)
ฟังก์ชันลิงก์นี้ "แม็พ" คำผิดพลาดในการถดถอยโลจิสติกส์ไปยังการแจกแจงแบบปกติ ดังนั้นความมั่นใจในกรอบการทำงานของโลจิสติกส์จึงมีความสมมาตรรอบค่า logit เหมือนกับในกรอบการถดถอยเชิงเส้นแบบคลาสสิก การแปลงแบบลอจิทนั้นใช้อย่างถูกต้องเพื่อให้สามารถใช้ทฤษฏีเชิงบรรทัดฐานทั้งหมดรอบ ๆ การถดถอยเชิงเส้น
หลังจากทำการแปลงผกผัน:
logit−1(x)=ex1+ex
คุณจะได้รับช่วงอสมมาตรอีกครั้ง ตอนนี้ช่วงความเชื่อมั่นเหล่านี้จะลำเอียงจริง ความครอบคลุมของพวกเขาไม่ใช่สิ่งที่คุณคาดหวังโดยเฉพาะในขอบเขตของการแจกแจงทวินาม พวกเขาแสดงให้คุณเห็นว่าทำไมมันเป็นตรรกะที่การแจกแจงทวินามมีช่วงความเชื่อมั่นไม่สมมาตร
ตัวอย่างใน R:
logit <- function(x){ log(x/(1-x)) }
inv.logit <- function(x){ exp(x)/(1+exp(x)) }
x <- c(0.2, 0.5, 0.8)
lx <- logit(x)
upper <- lx + 2
lower <- lx - 2
logxtab <- cbind(lx, upper, lower)
logxtab # the confidence intervals are symmetric by construction
xtab <- inv.logit(logxtab)
xtab # back transformation gives asymmetric confidence intervals
หมายเหตุ : อันที่จริง R ใช้การแจกแจงแบบเบต้า แต่นี่เทียบเท่าและมีประสิทธิภาพมากกว่าเล็กน้อย การนำไปใช้ใน R นั้นแตกต่างจากที่ฉันแสดงที่นี่ แต่ให้ผลเหมือนกันทุกประการ