คุณถูกต้องในการบอกว่าช่วงความเชื่อมั่น 95% เป็นสิ่งที่เกิดจากการใช้วิธีการที่ทำงานใน 95% ของกรณีแทนที่จะเป็นช่วงเวลาใด ๆ ที่มีโอกาส 95% ที่มีค่าที่คาดหวัง
"พื้นฐานทางตรรกะและการตีความขอบเขตความเชื่อมั่นยังคงเป็นเรื่องของความขัดแย้ง" {David Colquhoun, 1971, บรรยายเรื่องชีวสถิติ}
ใบเสนอราคานั้นนำมาจากตำราสถิติที่ตีพิมพ์ในปี 1971 แต่ฉันขอยืนยันว่ามันยังคงเป็นจริงในปี 2010 การโต้เถียงน่าจะรุนแรงที่สุดในกรณีของช่วงความเชื่อมั่นสำหรับสัดส่วนทวินาม มีวิธีการแข่งขันมากมายสำหรับการคำนวณช่วงความเชื่อมั่นเหล่านั้น แต่พวกเขาทั้งหมดไม่ถูกต้องในความรู้สึกหนึ่งอย่างหรือมากกว่านั้นและแม้แต่วิธีการปฏิบัติที่เลวร้ายที่สุดก็มีผู้เสนอในหมู่ผู้เขียนตำราเรียน แม้เรียกว่า 'แน่นอน' ช่วงเวลาไม่สามารถให้คุณสมบัติที่คาดหวังของช่วงความเชื่อมั่น
ในกระดาษที่เขียนขึ้นสำหรับศัลยแพทย์ (เป็นที่รู้จักอย่างกว้างขวางสำหรับความสนใจในสถิติ!), John Ludbrook และฉันโต้เถียงสำหรับการใช้งานเป็นประจำของช่วงความเชื่อมั่นที่คำนวณโดยใช้ Bayesian เหมือนกันมาก่อนเพราะช่วงเวลาดังกล่าวมีคุณสมบัติบ่อยๆ การครอบคลุม 95% ที่แท้จริงในทุกสัดส่วนที่แท้จริง) แต่ที่สำคัญคือการครอบคลุมที่ดียิ่งขึ้นกว่าสัดส่วนที่สังเกตได้ทั้งหมด (การครอบคลุม 95% ที่แน่นอน) กระดาษเนื่องจากกลุ่มเป้าหมายของมันไม่ได้มีรายละเอียดมากและดังนั้นจึงไม่สามารถโน้มน้าวใจนักสถิติทั้งหมด แต่ฉันกำลังทำงานบนกระดาษติดตามด้วยชุดเต็มของผลลัพธ์และเหตุผล
นี่เป็นกรณีที่วิธีการแบบเบย์มีคุณสมบัติเป็นประจำและเป็นวิธีที่ใช้บ่อยซึ่งเป็นสิ่งที่เกิดขึ้นค่อนข้างบ่อย สมมติฐานของเครื่องแบบก่อนหน้านี้ไม่เป็นปัญหาเพราะมีการกระจายสัดส่วนประชากรอย่างสม่ำเสมอในการคำนวณการรายงานข่าวประจำทุกครั้งที่ฉันเจอ
คุณถามว่า: "มีวิธีการดูช่วงความเชื่อมั่นอย่างน้อยในบางสถานการณ์ซึ่งจะมีความหมายต่อผู้ใช้สถิติหรือไม่" คำตอบของฉันคือว่าสำหรับช่วงความเชื่อมั่นทวินามหนึ่งสามารถรับช่วงเวลาที่มีสัดส่วนประชากร 95% ของเวลาสำหรับสัดส่วนที่สังเกตได้ทั้งหมด นั่นคือใช่ อย่างไรก็ตามการใช้งานแบบดั้งเดิมของช่วงความเชื่อมั่นคาดว่าจะครอบคลุมทุกสัดส่วนประชากรและสำหรับคำตอบคือ "ไม่!"
ความยาวของคำตอบสำหรับคำถามของคุณและคำตอบที่หลากหลายต่อพวกเขาแสดงให้เห็นว่าช่วงความมั่นใจนั้นมีการเข้าใจผิดอย่างกว้างขวาง หากเราเปลี่ยนวัตถุประสงค์ของเราจากการครอบคลุมสำหรับค่าพารามิเตอร์ที่แท้จริงทั้งหมดไปเป็นความครอบคลุมของค่าพารามิเตอร์ที่แท้จริงสำหรับค่าตัวอย่างทั้งหมดมันอาจจะง่ายขึ้นเพราะช่วงเวลานั้นจะถูกกำหนดให้มีความเกี่ยวข้องโดยตรงกับค่าที่สังเกตมากกว่าประสิทธิภาพของวิธีการต่อ se