ค่าทั้งหมดภายในช่วงความมั่นใจ 95% มีโอกาสเท่ากันหรือไม่


56

ฉันได้พบข้อมูลที่ไม่ลงรอยกันของคำถาม: " ถ้าใครสร้างช่วงความเชื่อมั่น 95% (CI) ของความแตกต่างในวิธีการหรือความแตกต่างของสัดส่วนค่าทั้งหมดภายใน CI มีแนวโน้มเท่ากันหรือไม่หรือเป็นจุดที่มีแนวโน้มมากที่สุด มีค่าใกล้กับ "ก้อย" ของ CI มีโอกาสน้อยกว่าค่าที่อยู่ตรงกลางของ CI หรือไม่

ตัวอย่างเช่นหากรายงานการทดลองทางคลินิกแบบสุ่มระบุว่าความเสี่ยงสัมพัทธ์ของการเสียชีวิตด้วยการรักษาแบบพิเศษคือ 1.06 (95% CI 0.96 ถึง 1.18) ความน่าจะเป็นที่ 0.96 เป็นค่าที่ถูกต้องเหมือนกับ 1.06 หรือไม่?

ฉันพบการอ้างอิงจำนวนมากเกี่ยวกับแนวคิดนี้ทางออนไลน์ แต่ตัวอย่างสองตัวอย่างต่อไปนี้สะท้อนถึงความไม่แน่นอนในนั้น:

  1. โมดูลของ Lisa Sullivan เกี่ยวกับสถานะConfidence Intervals :

    ช่วงความเชื่อมั่นสำหรับความแตกต่างหมายถึงให้ช่วงของค่าที่เป็นไปได้สำหรับ ( ) เป็นสิ่งสำคัญที่จะต้องทราบว่าค่าทั้งหมดในช่วงความเชื่อมั่นมีความเป็นไปได้ที่จะประเมินมูลค่าที่แท้จริงเท่ากัน ( μ_1-μ_2 )μ1μ2μ1μ2

  2. บล็อกนี้มีชื่ออยู่ในส่วนต่างของข้อผิดพลาดระบุ:

    สิ่งที่ฉันมีในใจเป็นความเข้าใจผิดเกี่ยวกับ“ขอบของข้อผิดพลาด” ที่ถือว่าทุกจุดภายในช่วงความเชื่อมั่นเป็นโอกาสที่เท่าเทียมกันเช่นถ้าทฤษฎีบทขีด จำกัด กลางนัยเครื่องแบบกระจาย bounded แทนทีกระจาย [... ]
    สิ่งที่พูดถึง "ความคลาดเคลื่อนของการพลาด" คือความเป็นไปได้ที่ใกล้เคียงกับการประเมินจุดนั้นมีโอกาสมากกว่าความเป็นไปได้ที่อยู่ริมขอบ "

สิ่งเหล่านี้ดูเหมือนจะขัดแย้งกัน


7
ฉันสงสัยว่ามีความสับสนอยู่ที่ไหนสักแห่งกับแนวคิดที่เกี่ยวข้องที่ค่า p มีการกระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่าง ..
Michael McGowan

4
ใบเสนอราคาแรกคือใบผิดปกติในบัญชีที่ถูกต้องเป็นอย่างอื่นของช่วงความเชื่อมั่น การเสนอราคาครั้งที่สองมาจากบัญชีที่กล่าวอย่างชัดเจนว่าเป็นเรื่องยุ่งเหยิง: มันเต็มไปด้วยข้อความที่คลุมเครือไม่ถูกต้องหรือสามารถตีความได้ในความหมายแบบเบย์เท่านั้น แต่ใบเสนอราคาทั้งคู่ผิด !
whuber

@whuber ฉันจะไม่เรียกคนที่สองเป็นระเบียบ ... ฉันเรียกมันว่าการตีความแบบเบย์ของการตีความ frequentist :)
ไมเคิลแมคโกแวน

1
@Michael ตัวอย่างหนึ่งของความสะเพร่าคือลัทธินิยมอย่างเช่นการยืนยัน CLT หมายถึง "จำนวนที่ไม่สิ้นสุดของการประมาณการซ้ำ ๆ ของ [ค่าเฉลี่ยประชากร] จะยังคงเป็นไปตามการแจกแจงแบบปกติ" หนึ่งไม่จำเป็นต้องผิดเพื่อสื่อสารความคิดเพียงเพื่อผู้ชมที่ไม่ใช่เทคนิค
whuber

2
@ โฮ่ฉันคิดว่าคุณพูดถึงบาปเพียงเล็กน้อยเท่านั้น ข้อผิดพลาดหลักคือ CLT ไม่เกี่ยวข้องกับการแจกแจง t
glassy

คำตอบ:


23

คำถามหนึ่งที่ต้องตอบคือ "น่าจะเป็น" หมายถึงอะไรในบริบทนี้

ถ้ามันหมายถึงความน่าจะเป็น (เพราะบางครั้งใช้เป็นคำเหมือน) และเราใช้คำจำกัดความที่เข้มงวดบ่อยๆค่าพารามิเตอร์ที่แท้จริงคือค่าเดียวที่ไม่เปลี่ยนแปลงดังนั้นความน่าจะเป็น (โอกาส) ของจุดนั้นคือ 100% และทั้งหมด ค่าอื่น ๆ คือ 0% ดังนั้นเกือบทั้งหมดมีโอกาสเท่ากันที่ 0% แต่ถ้าช่วงเวลานั้นมีค่าจริงมันก็แตกต่างจากคนอื่น

หากเราใช้วิธี Bayesian CI (Credible Interval) นั้นมาจากการกระจายหลังและคุณสามารถเปรียบเทียบความน่าจะเป็นที่จุดต่าง ๆ ภายในช่วงเวลา นอกเสียจากว่าคนหลังจะเหมือนกันอย่างสมบูรณ์แบบภายในช่วงเวลา (เป็นไปได้ในทางทฤษฎีฉันเดาได้ แต่นั่นอาจเป็นสถานการณ์ที่แปลก) ค่านั้นก็มีโอกาสต่างกัน

ถ้าเราใช้มีแนวโน้มที่จะคล้ายกับความมั่นใจลองคิดดูด้วยวิธีนี้: คำนวณช่วงความมั่นใจ 95% ช่วงความมั่นใจ 90% และช่วงความมั่นใจ 85% เราจะมั่นใจ 5% ว่ามูลค่าที่แท้จริงอยู่ในภูมิภาคภายในช่วง 95% แต่นอกช่วง 90% เราสามารถพูดได้ว่ามูลค่าที่แท้จริงคือ 5% น่าจะตกอยู่ในภูมิภาคนั้น เช่นเดียวกับภูมิภาคที่อยู่ในช่วง 90% แต่อยู่นอกช่วง 85% ดังนั้นหากค่าทุกค่ามีแนวโน้มเท่ากันขนาดของ 2 ภูมิภาคข้างต้นจะต้องเหมือนกันทุกประการและค่าเดียวกันจะถือเป็นจริงสำหรับภูมิภาคในช่วงความเชื่อมั่น 10% แต่อยู่นอกช่วงความมั่นใจ 5% ไม่มีการแจกแจงมาตรฐานที่ช่วงเวลาที่สร้างโดยใช้มีคุณสมบัตินี้ (ยกเว้นกรณีพิเศษที่มี 1 เสมอจากเครื่องแบบ)

คุณสามารถพิสูจน์ได้ด้วยตัวเองโดยการจำลองชุดข้อมูลจำนวนมากจากประชากรที่รู้จักคำนวณช่วงความเชื่อมั่นที่น่าสนใจจากนั้นเปรียบเทียบความถี่ที่แท้จริงของพารามิเตอร์ใกล้เคียงกับการประมาณจุดมากกว่าแต่ละจุดสิ้นสุด


3
ความน่าจะเป็นคือสิ่งที่คำถามนี้ต้องการในคำตอบไม่ใช่ความน่าจะเป็นบ่อยครั้งหรือแบบเบย์ ความเป็นไปได้ให้คำตอบที่แน่นอนคนอื่น ๆ สามารถทำได้ด้วยการบิดและยืด
Michael Lew

1
@ Greg ฉันชอบคำอธิบายของคุณ เพียงเพื่อให้ชัดเจนอาร์กิวเมนต์ของคุณสนับสนุนความคิดที่ว่าค่าที่ "หาง" ของ 95% CI มีโอกาสน้อยกว่า (น่าจะเป็นน้อยกว่า) กว่าที่ใกล้เคียงกับการประมาณจุดถูกต้องหรือไม่ ขอบคุณสำหรับคำตอบของคุณ
pmgjones

1
@pmgjones น่าจะเป็นน้อย, ไม่, ดูวรรค 2 มีโอกาสน้อยกว่าในบริบทของย่อหน้าที่ 4 ใช่
เกร็กสโนว์

2
@GregSnow ย่อหน้าที่ 2 ของคุณบอกว่าความน่าจะเป็นของพารามิเตอร์ที่แท้จริงซึ่งเป็นพารามิเตอร์ที่แท้จริงคือเกือบ 100% คุณเชื่อจริง ๆ หรือไม่ว่าการออกเสียงซ้ำซากนี้เป็น "คำจำกัดความที่เข้มงวดของผู้เล่นบ่อย"
rolando2

2
@ rolando2 ฉันคิดว่าสถิติที่ใช้บ่อยมีอยู่มากมายฉันแค่กำจัดข้อผิดพลาดทั่วไปที่บ่งบอกถึงการเปลี่ยนแปลงค่าที่แท้จริงและบางครั้งก็อยู่นอกช่วงเวลาและบางครั้งก็อยู่ในช่วงเวลา (และบางครั้งก็ใกล้กับขอบเขต ศูนย์). ย่อหน้าต่อมาจะทำให้เกิดความรู้สึกที่แท้จริงสำหรับแนวคิด
เกร็กหิมะ

19

นี่เป็นคำถามที่ยอดเยี่ยม! มีแนวคิดทางคณิตศาสตร์ที่เรียกว่าความน่าจะเป็นที่จะช่วยให้คุณเข้าใจปัญหาได้ ฟิชเชอร์คิดค้นความน่าจะเป็น แต่คิดว่ามันค่อนข้างจะเป็นที่ต้องการน้อยกว่าความน่าจะเป็น แต่โอกาสที่จะกลายเป็น 'ดั้งเดิม' มากกว่าความน่าจะเป็นและ Ian Hacking (1965) คิดว่ามันเป็นจริงซึ่งมันไม่สามารถพิสูจน์ได้ โอกาสที่จะเกิดความน่าจะเป็นนั้นค่อนข้างต่ำกว่า

แฮ็ค 1965 ลอจิกของการอนุมานทางสถิติ

ความน่าจะเป็นไม่ได้รับความสนใจที่ควรมีในหนังสือเรียนมาตรฐานของสถิติโดยไม่มีเหตุผลที่ดี มันแตกต่างจากความน่าจะเป็นในการมีคุณสมบัติเกือบทุกอย่างที่เราคาดหวังและฟังก์ชันความน่าจะเป็นและช่วงเวลานั้นมีประโยชน์มากสำหรับการอนุมาน บางทีนักสถิติบางคนอาจไม่ชอบความน่าจะเป็นเพราะบางครั้งไม่มีวิธีที่ 'ถูกต้อง' ในการได้มาซึ่งหน้าที่ความน่าจะเป็นที่เกี่ยวข้อง อย่างไรก็ตามในหลายกรณีฟังก์ชั่นความเป็นไปได้นั้นชัดเจนและได้รับการยอมรับอย่างดี การศึกษาความเป็นไปได้ในการอนุมานน่าจะเริ่มจากหนังสือที่มีขนาดเล็กและเข้าใจง่ายของ Richard Royall ที่เรียกว่าหลักฐานทางสถิติ: กระบวนทัศน์ความน่าจะเป็น

คำตอบสำหรับคำถามของคุณคือไม่ไม่มีจุดภายในช่วงเวลาใด ๆ ไม่ได้มีโอกาสเหมือนกัน ผู้ที่อยู่ที่ขอบของช่วงความมั่นใจมักจะมีโอกาสน้อยกว่าคนอื่น ๆ ที่มีต่อศูนย์กลางของช่วงเวลา แน่นอนช่วงความมั่นใจตามปกติจะไม่บอกอะไรเลยเกี่ยวกับพารามิเตอร์ที่เกี่ยวข้องกับการทดสอบนั้น ๆ โดยตรง ช่วงความเชื่อมั่นของ Neyman คือ 'ทั่วโลก' ซึ่งได้รับการออกแบบให้มีคุณสมบัติระยะยาวมากกว่าคุณสมบัติ 'ท้องถิ่น' ที่เกี่ยวข้องกับการทดสอบในมือ (ความสามารถในการทำงานระยะยาวที่ดีอย่างมีความสุขสามารถตีความได้ในท้องถิ่น แต่นั่นเป็นทางลัดทางปัญญามากกว่าความเป็นจริงทางคณิตศาสตร์) ช่วงเวลาที่น่าจะเป็นไปได้ - ในกรณีที่พวกเขาสามารถสร้างได้ - สะท้อนถึงความเป็นไปได้


1
@suncoolsu ไม่จำเป็นว่าช่วงเวลาที่เป็นปัญหาจะเป็นช่วงเวลาที่น่าจะเป็นได้ ช่วงเวลาจะต้องขยายการประมาณที่เป็นไปได้มากที่สุดเท่านั้นเพื่อให้ขอบเขตขอบเขตแต่ละช่วงมีโอกาสน้อยกว่าจุดภายในช่วงเวลา ช่วงความเชื่อมั่นทั่วไปจะเป็นไปตามข้อกำหนดนั้น
Michael Lew

2
@pmjones การทดสอบ 95% CI ไม่ได้บอกคุณว่าค่าต่อระยะขอบของ CI นั้นใกล้เคียงกับความจริงมากกว่าค่าที่อยู่ตรงกลางหรือไม่ CIs ทำงบเกี่ยวกับการสุ่มตัวอย่างซ้ำจากประชากร ในระยะยาว (เช่นหลังจากการสุ่มตัวอย่างซ้ำ ๆ ) 95% ของ CIs ดังกล่าวซึ่งสร้างขึ้นสำหรับแต่ละตัวอย่างจะครอบคลุมมูลค่าที่แท้จริง ดังนั้นจึงมีข้อสังเกตสองประการคือ 1) ใครไม่สามารถพูดอะไรเกี่ยวกับคุณค่าที่แท้จริงสำหรับ CI ที่กำหนด 2) CIs ไม่ได้บอกอะไรคุณเกี่ยวกับข้อมูลที่สังเกตซึ่งเป็นคำวิจารณ์แบบเบย์ตามปกติ
suncoolsu

1
@MichaelLew หลักการความเป็นไปได้มีประโยชน์ แต่ฉันบอกว่า (อ้างถึง LW) "แน่นอนการอนุมานของผู้กระทำผิดทุกคนเป็นการละเมิด LP ดังนั้นถ้าเรายึดมั่นใน LP เราจะต้องละทิ้งการอนุมานประจำ" เนื่องจาก CI เป็นแนวคิดที่พบบ่อยจึงละเมิด LP (ซึ่งคุณพูดว่าเป็นพื้นฐาน)
suncoolsu

1
@suncollsu คำถามไม่ได้อยู่ที่ช่วงความเชื่อมั่นเพียงอย่างเดียวและไม่มีข้อควรพิจารณาเชิงสถิติอื่นใดที่จะบอกอะไรเกี่ยวกับความน่าจะเป็นของค่าพารามิเตอร์ภายในตัวเอง มันเป็นเรื่องของความน่าจะเป็นของค่าพารามิเตอร์ภายในช่วงเวลา ฟังก์ชันความน่าจะเป็นตอบคำถามและคำตอบนั้นถูกต้องแม้ว่าช่วงความเชื่อมั่นจะละเมิดหลักการความน่าจะเป็น (อ่านความคิดเห็นก่อนหน้าของฉันอีกครั้งดูเหมือนคุณจะเพิกเฉยต่อเนื้อหาทั้งหมด)
Michael Lew

2
@ rolando2 ช่วงเวลาความมั่นใจ 95% ของ Neyman ได้รับการออกแบบเพื่อให้วิธีการประกอบด้วยพารามิเตอร์ที่แท้จริงใน 95% ของโอกาสที่วิธีการใช้ การพูดความเชื่อมั่นอย่างเคร่งครัดแนบไปกับวิธีการและไม่ใช่ช่วงเวลาส่วนตัวใด ๆ ดังนั้นช่วงเวลาแต่ละช่วงจะไม่บอกอะไรคุณเกี่ยวกับสถานะของโลกในการทดลองนั้น ดูคำตอบของฉันสำหรับคำถามนี้เพื่อดูรายละเอียดเพิ่มเติม: stats.stackexchange.com/questions/8844/…
Michael Lew

18

สมมติว่ามีคนบอกฉันว่าฉันควรให้ความไว้วางใจที่เท่าเทียมกันในทุกค่าภายใน CI95 เป็นตัวบ่งชี้ศักยภาพของค่าประชากร (ฉันตั้งใจหลีกเลี่ยงคำว่า "น่าจะเป็น" และ "น่าจะเป็น") มีอะไรพิเศษเกี่ยวกับ 95 บ้าง? ไม่มีอะไร: เพื่อความสอดคล้องฉันจะต้องให้ความไว้วางใจที่เท่าเทียมกันในทุกค่าภายใน CI96, CI97, ... และ CI99.9999999 เมื่อความครอบคลุมของ CI ใกล้ถึงขีด จำกัด แล้วจำนวนจริงทั้งหมดจะต้องรวมอยู่ด้วย ความผิดปกติของข้อสรุปนี้จะทำให้ฉันปฏิเสธข้อเรียกร้องเริ่มต้น


4
นี่เป็นคำตอบที่ยอดเยี่ยม! ฉันควรจะนึกถึงผลของการเข้าใกล้สุดขั้วของ CIs ที่เป็นไปได้ ขอขอบคุณที่เขียนสิ่งนี้!
pmgjones

2

เริ่มจากนิยามของช่วงความมั่นใจ ถ้าผมบอกว่าช่วงความมั่นใจ 95% เริ่มจากตรงนี้ผมหมายถึงว่าข้อความในลักษณะนั้นจะเป็นจริงประมาณ 95% ของเวลาและเป็นเท็จประมาณ 5% ของเวลา ฉันไม่ได้หมายความว่าฉันมั่นใจ 95% เกี่ยวกับข้อความเฉพาะนี้ ช่วงความเชื่อมั่น 90% จะแคบลงและยังแคบลง 80% ดังนั้นเมื่อสงสัยว่ามูลค่าที่แท้จริงคืออะไรฉันมีความเชื่อมั่นในคุณค่าที่น้อยกว่าเนื่องจากพวกเขาเข้าใกล้ช่วงเวลาของความมั่นใจ

โปรดทราบว่าทั้งหมดที่กล่าวมาเป็นเชิงคุณภาพโดยเฉพาะ "ความน่าเชื่อถือ" (ฉันหลีกเลี่ยงคำว่า "ความมั่นใจ" หรือ "ความน่าจะเป็น" ในคำแถลงนั้นเพราะพวกเขามีกระเป๋าสัมภาระทางคณิตศาสตร์ที่อาจแตกต่างจากสัมภาระที่ใช้งานง่ายของเรา) วิธีการแบบเบย์จะใช้ถ้อยคำใหม่กับคำถามที่มีคำตอบเชิงปริมาณ ความสามารถของเวิร์มที่นี่

ข้อความคลาสสิกของ Box, Hunter & Hunter ("สถิติสำหรับผู้ทดสอบ", Wiley, 1978) อาจช่วยได้เช่นกัน ดู "ชุดช่วงเวลาความเชื่อมั่น" ในหน้า 113, ff


เนื่องจากเรากำลังจัดการบางส่วนในแนวคิดและอีกส่วนหนึ่งในความหมายฉันจะชี้ให้เห็นว่าในประโยคที่สองของคุณคุณได้พูดว่า "... คำกล่าวของลักษณะนั้นจะเป็นจริง ... " โดยไม่ระบุว่าข้อความใดจะเป็นจริง
rolando2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.