คำตอบคร่าวๆสำหรับคำถามคือช่วงความมั่นใจ 95% ช่วยให้คุณมั่นใจ 95% ว่าค่าพารามิเตอร์จริงตั้งอยู่ภายในช่วงเวลา อย่างไรก็ตามคำตอบที่คร่าวๆนั้นไม่สมบูรณ์และไม่ถูกต้อง
ความไม่สมบูรณ์อยู่ในความจริงที่ว่ายังไม่ชัดเจนว่า "95% มั่นใจ" หมายถึงสิ่งใดก็ตามที่เป็นรูปธรรมหรือถ้าเป็นเช่นนั้นความหมายที่เป็นรูปธรรมจะไม่ได้รับการยอมรับในระดับสากลโดยแม้แต่ตัวอย่างเล็ก ๆ ของนักสถิติ ความหมายของความมั่นใจขึ้นอยู่กับวิธีการที่ใช้ในการรับช่วงเวลาและรูปแบบการอนุมานที่ใช้ (ซึ่งฉันหวังว่าจะชัดเจนขึ้นด้านล่าง)
ความไม่ถูกต้องอยู่ที่ความจริงที่ว่าช่วงความเชื่อมั่นจำนวนมากไม่ได้ออกแบบมาเพื่อบอกอะไรคุณเกี่ยวกับที่ตั้งของค่าพารามิเตอร์ที่แท้จริงสำหรับกรณีทดลองเฉพาะที่ให้ช่วงความมั่นใจ! ที่จะน่าแปลกใจสำหรับหลาย ๆ คน แต่มันดังต่อไปนี้โดยตรงจากปรัชญา Neyman-Pearson ที่ระบุไว้อย่างชัดเจนในคำพูดนี้จากกระดาษของพวกเขา 1933 "ในปัญหาของการทดสอบที่มีประสิทธิภาพมากที่สุดของสมมติฐานสถิติ":
เรามีความโน้มเอียงที่จะคิดว่าเท่าที่มีการตั้งสมมติฐานโดยเฉพาะการทดสอบตามทฤษฎีความน่าจะเป็นนั้นไม่สามารถให้หลักฐานที่มีค่าใด ๆ เกี่ยวกับความจริงหรือความเท็จของสมมติฐานนั้น
แต่เราอาจดูวัตถุประสงค์ของการทดสอบจากมุมมองอื่น โดยปราศจากความหวังที่จะรู้ว่าสมมติฐานที่แยกกันแต่ละข้อเป็นจริงหรือเท็จเราอาจค้นหากฎเพื่อควบคุมพฤติกรรมของเราเกี่ยวกับพวกเขาในการติดตามซึ่งเรามั่นใจว่าในประสบการณ์ระยะยาวเราจะไม่ผิดเกินไป
ช่วงเวลาที่เป็นไปตาม 'การผกผัน' ของการทดสอบสมมติฐาน NP จึงจะสืบทอดมาจากการทดสอบนั้นธรรมชาติของการมีคุณสมบัติข้อผิดพลาดที่รู้จักกันในระยะยาวโดยไม่อนุญาตให้อนุมานเกี่ยวกับคุณสมบัติของการทดสอบที่ให้ผล! ความเข้าใจของฉันคือสิ่งนี้ช่วยป้องกันการอนุมานแบบอุปนัยซึ่งเห็นได้ชัดว่าเนย์แมนถือว่าเป็นสิ่งที่น่ารังเกียจ
Neyman ได้วางคำเรียกร้องอย่างชัดเจนในคำว่า 'ช่วงความมั่นใจ' และที่มาของทฤษฎีความเชื่อมั่นในกระดาษ Biometrika ของเขาในปีพ. ศ. 2484“ การโต้แย้งความไว้วางใจและทฤษฎีของช่วงความเชื่อมั่น” ในแง่หนึ่งสิ่งใดก็ตามที่เป็นช่วงความเชื่อมั่นอย่างถูกต้องเล่นตามกฎของเขาและดังนั้นความหมายของแต่ละช่วงเวลาสามารถแสดงได้ในรูปของอัตราระยะยาวที่ช่วงเวลาที่คำนวณโดยวิธีนั้นมี (ครอบคลุม) จริงที่เกี่ยวข้อง ค่าพารามิเตอร์
ตอนนี้เราต้องแยกการอภิปราย หนึ่งสายตามความคิดของ 'ความครอบคลุม' และอีกกลุ่มหนึ่งติดตามช่วงเวลาที่ไม่ใช่ Neymanian ที่เป็นเหมือนช่วงความมั่นใจ ฉันจะเลื่อนอดีตเพื่อให้ฉันสามารถโพสต์นี้ให้เสร็จสมบูรณ์ก่อนที่จะยาวเกินไป
มีวิธีการที่แตกต่างกันมากมายที่ให้ช่วงเวลาที่เรียกว่าช่วงความเชื่อมั่นที่ไม่ใช่ Neymanian ครั้งแรกของเหล่านี้คือช่วงเวลา fiducial ของชาวประมง (คำว่า 'fiducial' อาจทำให้ผู้คนจำนวนมากและหลุดพ้นจากคนอื่น แต่ฉันจะทิ้งมันไว้ ... ) สำหรับข้อมูลบางประเภท (เช่นปกติกับความแปรปรวนของประชากรที่ไม่รู้จัก) ช่วงเวลาที่คำนวณโดยวิธีฟิชเชอร์จะเหมือนกับตัวเลข ช่วงเวลาที่จะคำนวณโดยวิธีของ Neyman อย่างไรก็ตามพวกเขาเชิญตีความที่ตรงกันข้ามกับ diametrically ช่วงเวลา Neymanian สะท้อนให้เห็นถึงคุณสมบัติการครอบคลุมระยะยาวของวิธีการเท่านั้นในขณะที่ช่วงเวลาของ Fisher มีวัตถุประสงค์เพื่อสนับสนุนการอนุมานแบบอุปนัยที่เกี่ยวข้องกับค่าพารามิเตอร์ที่แท้จริงสำหรับการทดลองเฉพาะที่ดำเนินการ
ความจริงที่ว่าขอบเขตของช่วงเวลาหนึ่งชุดอาจมาจากวิธีการที่ขึ้นอยู่กับกระบวนทัศน์ที่แตกต่างกันของปรัชญาสองอันนำไปสู่สถานการณ์ที่สับสนจริงๆ - ผลลัพธ์สามารถตีความได้ในสองวิธีที่ขัดแย้งกัน จากการโต้แย้ง fiducial มีโอกาส 95% ที่ช่วงเวลา fiducial 95% เฉพาะจะมีค่าพารามิเตอร์ที่แท้จริง จากวิธีการของ Neyman เรารู้เพียงว่า 95% ของช่วงเวลาที่คำนวณในลักษณะนั้นจะมีค่าพารามิเตอร์จริงและต้องบอกสิ่งที่สับสนเกี่ยวกับความน่าจะเป็นของช่วงเวลาที่มีค่าพารามิเตอร์จริงที่ไม่รู้จัก แต่อย่างใดอย่างหนึ่งหรือ 0
ในระดับใหญ่วิธีการของ Neyman ได้ส่งผลกระทบต่อฟิชเชอร์ ที่โชคร้ายที่สุดในความคิดของฉันเพราะมันไม่ได้นำไปสู่การตีความตามธรรมชาติของช่วงเวลา (อ่านข้อความอ้างอิงข้างต้นจาก Neyman และ Pearson และดูว่าตรงกับการตีความตามธรรมชาติของผลการทดลองหรือไม่น่าจะเป็นไปได้)
หากช่วงเวลาสามารถตีความได้อย่างถูกต้องในแง่ของอัตราความผิดพลาดทั่วโลก แต่ยังถูกต้องในเงื่อนไขการอนุมานในพื้นที่ฉันไม่เห็นเหตุผลที่ดีที่ผู้ใช้ช่วงเวลาแถบจากการตีความที่เป็นธรรมชาติมากขึ้นโดยหลัง ดังนั้นข้อเสนอแนะของฉันคือการตีความที่เหมาะสมของช่วงความเชื่อมั่นทั้งสองต่อไปนี้:
Neymanian: ช่วง 95% นี้ถูกสร้างขึ้นโดยวิธีการที่ให้ช่วงเวลาที่ครอบคลุมค่าพารามิเตอร์ที่แท้จริงใน 95% ของโอกาสในระยะยาว (... จากประสบการณ์เชิงสถิติของเรา)
ฟิชเชอร์: ช่วง 95% นี้มีโอกาส 95% ที่จะครอบคลุมค่าพารามิเตอร์จริง
(วิธีการแบบเบย์และความน่าจะเป็นยังให้ผลเป็นระยะด้วยคุณสมบัติที่ต้องการบ่อยครั้งเช่นช่วงนั้นเชิญการตีความที่แตกต่างกันเล็กน้อยซึ่งทั้งสองอาจจะรู้สึกเป็นธรรมชาติมากกว่า Neymanian)