การคำนวณ“ ความน่าจะเป็นของการครอบคลุมจริง” นั้นเหมือนกับการคำนวณ“ ช่วงเวลาที่น่าเชื่อถือ” หรือไม่


10

ฉันอ่านตำราสถิติระดับเริ่มต้น ในบทที่เกี่ยวกับการประมาณค่าความน่าจะเป็นสูงสุดของสัดส่วนความสำเร็จของข้อมูลที่มีการแจกแจงแบบทวินามมันเป็นสูตรสำหรับการคำนวณช่วงความเชื่อมั่น

พิจารณาความน่าจะเป็นที่ครอบคลุมจริงของมันนั่นคือความน่าจะเป็นที่วิธีการสร้างช่วงเวลาที่จับค่าพารามิเตอร์ที่แท้จริง นี่อาจจะน้อยกว่าค่าเล็กน้อย

และดำเนินต่อไปพร้อมกับข้อเสนอแนะในการสร้างทางเลือก "ช่วงความมั่นใจ" ซึ่งน่าจะมีความน่าจะเป็นที่ครอบคลุม

ฉันเผชิญหน้ากับความคิดของความน่าจะเป็นที่ครอบคลุมและตามจริงเป็นครั้งแรก ทำทางของฉันผ่านคำถามเก่า ๆ ที่นี่ฉันคิดว่าฉันเข้าใจมัน: มีแนวคิดที่แตกต่างกันสองอย่างที่เราเรียกว่าความน่าจะเป็นสิ่งแรกที่เป็นไปได้ที่จะเป็นไปได้ว่าเหตุการณ์ที่ยังไม่เกิดขึ้นจะให้ผลลัพธ์ที่กำหนด เป็นไปได้อย่างไรที่ตัวแทนของผู้สังเกตการณ์คาดเดาผลของเหตุการณ์ที่เกิดขึ้นแล้วนั้นเป็นจริง ดูเหมือนว่าช่วงความเชื่อมั่นจะวัดความน่าจะเป็นประเภทแรกเท่านั้นและสิ่งที่เรียกว่า "ช่วงเวลาที่น่าเชื่อถือ" วัดความน่าจะเป็นประเภทที่สอง ฉันสรุปโดยสรุปว่าความมั่นใจเป็นช่วงเวลาที่คำนวณ "ความน่าจะเป็นความครอบคลุมเล็กน้อย" และช่วงเวลาที่น่าเชื่อถือคือช่วงเวลาที่ครอบคลุม "ความน่าจะเป็นความคุ้มครองตามจริง"

แต่บางทีฉันอาจตีความหนังสือผิดไป (ไม่ชัดเจนเลยว่าวิธีการคำนวณที่แตกต่างกันนั้นมีให้สำหรับช่วงความมั่นใจและช่วงเวลาที่น่าเชื่อถือหรือช่วงความเชื่อมั่นสองประเภท) หรือแหล่งข้อมูลอื่นที่ฉันเคยมา ความเข้าใจปัจจุบันของฉัน โดยเฉพาะความคิดเห็นที่ฉันได้จากคำถามอื่น

ช่วงความเชื่อมั่นสำหรับผู้ถี่ประจำเชื่อถือได้สำหรับ Bayesian

ทำให้ฉันสงสัยในข้อสรุปของฉันเนื่องจากหนังสือเล่มนี้ไม่ได้อธิบายวิธีการแบบเบย์ในบทนั้น

ดังนั้นโปรดอธิบายหากความเข้าใจของฉันถูกต้องหรือถ้าฉันทำผิดพลาดทางตรรกะ


ความน่าจะเป็นของความครอบคลุมที่กำหนดคือความน่าจะเป็นของการครอบคลุม "เป้าหมาย": สิ่งที่เราพยายามที่จะบรรลุเมื่อเราหาวิธีที่ให้ช่วงความมั่นใจ ความครอบคลุมที่แท้จริงคือความคุ้มครอง "ที่แท้จริง" บางคนบอกว่าช่วงความเชื่อมั่นนั้นแน่นอนเมื่อความคุ้มครองที่แท้จริงเท่ากับความครอบคลุมที่กำหนด Scotchi และ Unwisdom ได้กล่าวถึงช่วงความเชื่อมั่นที่ไม่แน่นอนสำหรับข้อมูลที่ไม่ต่อเนื่อง อีกตัวอย่างหนึ่งคือเมื่อเราใช้ช่วงความเชื่อมั่น asymptotic: มันเป็นที่แน่นอนเฉพาะเมื่อ\ ฉันเข้าใจความคิดของคุณโดยสิ้นเชิงเพราะ "จริง" นั้นเป็นคำพ้องความหมายของ "ปัจจุบัน" ด้วย n
Stéphane Laurent

คำตอบ:


5

โดยทั่วไปความน่าจะเป็นของการครอบคลุมที่แท้จริงจะไม่เท่ากับความน่าจะเป็นที่ระบุเมื่อคุณทำงานกับการแจกแจงแบบไม่ต่อเนื่อง

ช่วงความมั่นใจถูกกำหนดไว้เป็นฟังก์ชั่นของข้อมูล หากคุณกำลังทำงานกับการแจกแจงทวินามมีเพียงผลลัพธ์ที่เป็นไปได้จำนวน จำกัด (เพื่อความแม่นยำ) ดังนั้นจึงมีเพียงช่วงเวลาความเชื่อมั่นที่เป็นไปได้จำนวน จำกัด เท่านั้น เนื่องจากพารามิเตอร์นั้นต่อเนื่องเป็นเรื่องง่ายที่จะเห็นว่าความน่าจะเป็นความครอบคลุม (ซึ่งเป็นฟังก์ชันของ ) นั้นทำได้ไม่ดีกว่าประมาณ 95% (หรืออะไรก็ตาม)n+1pp

โดยทั่วไปแล้ววิธีการที่ใช้ CLT นั้นจะมีความน่าจะเป็นที่ครอบคลุมต่ำกว่าค่าเล็กน้อย แต่วิธีการอื่น ๆ สามารถอนุรักษ์ได้มากกว่า


1
นี่เป็นคำสั่งอย่างเป็นทางการที่มีประโยชน์ของคำนิยาม: ให้เป็นพื้นที่ตัวอย่างและไม่รู้จักพารามิเตอร์เป็นขั้นตอนความเชื่อมั่นประกอบด้วยคู่ของฟังก์ชั่นนั้นทางด้านซ้ายมือของการแสดงออกนี้เป็น (หมายเหตุว่าเรื่องนี้ขึ้นอยู่กับθ) และ RHS เป็นระดับความเชื่อมั่นน้อย หาก infimum (ที่มากกว่า ) ของ LHS คือเท่ากับ RHS แล้วขั้นตอนนี้เป็นที่แน่นอน Ω,F,Pθ1α LU:ΩR
P[{ωΩ|[L(ω),U(ω)]θ}]1α.
coverage probabilityΩ
Unwisdom

8

มันไม่มีอะไรเกี่ยวข้องกับช่วงเวลาที่น่าเชื่อถือแบบเบย์กับช่วงความเชื่อมั่นที่พบบ่อย 95% (พูด) ช่วงความเชื่อมั่นถูกกำหนดให้เป็นให้อย่างน้อยความคุ้มครอง 95% สิ่งที่มูลค่าที่แท้จริงของพารามิเตอร์\ดังนั้นเมื่อความครอบคลุมที่ระบุคือ 95% ความครอบคลุมจริงอาจ 97% เมื่อ , 96.5% เมื่อแต่สำหรับค่าของนั้นน้อยกว่า 95% ปัญหา (เช่นความแตกต่างระหว่างความครอบคลุมปกติและที่เกิดขึ้นจริง) เกิดขึ้นกับการกระจายแบบไม่ต่อเนื่องเช่นทวินามππ=π1π=π2π

เป็นภาพพิจารณาสังเกตความสำเร็จจากทดลองทวินามกับความสำเร็จที่น่าจะเป็นที่ไม่รู้จัก : แสดงให้เห็นคอลัมน์แรกค่าสังเกตเป็นไปได้ของxประการที่สองแสดงความเชื่อมั่นที่แน่นอนบน‡ที่ถูกผูกไว้xnπ

xπUPr(X=x|π=0.7)I(πU0.7)00.39303780.000729010.58180340.010206020.72866160.059535130.84683890.185220140.93715010.324135150.99148760.302526161.00000000.1176491
x 95%πU=π:[Pr(X>x|π)=0.95]ที่คุณจะคำนวณในแต่ละกรณี ทีนี้สมมติว่า : คอลัมน์ที่สามแสดงความน่าจะเป็นของแต่ละค่าที่สังเกตได้ของภายใต้การคาดคะเนนี้ การแสดงที่สี่สำหรับกรณีที่ช่วงความเชื่อมั่นคำนวณได้ครอบคลุมค่าพารามิเตอร์ที่จริงการตั้งค่าสถานะพวกเขาด้วย1ถ้าคุณเพิ่มขึ้นน่าจะเป็นกรณีที่ช่วงความเชื่อมั่นไม่ครอบคลุมมูลค่าที่แท้จริงคุณจะได้รับความคุ้มครองที่เกิดขึ้นจริง0.989065สำหรับค่าจริงที่แตกต่างกันของความครอบคลุมจริงจะแตกต่างกัน:π=0.7x10.989065π

คุ้มครอง

การครอบคลุมเล็กน้อยจะเกิดขึ้นได้ก็ต่อเมื่อค่าพารามิเตอร์จริงตรงกับขอบเขตบนที่หาได้

[ฉันเพิ่งอ่านคำถามของคุณอีกครั้ง & สังเกตว่าผู้เขียนบอกว่าจริงอาจน้อยกว่าความน่าจะเป็นความครอบคลุมเล็กน้อย ดังนั้นฉันคิดว่าพวกเขากำลังพูดถึงวิธีการประมาณสำหรับการคำนวณช่วงความมั่นใจแม้ว่าสิ่งที่ฉันพูดข้างต้นยังคงไป กราฟอาจแนะนำให้รายงานระดับความเชื่อมั่นโดยเฉลี่ยประมาณแต่ - โดยเฉลี่ยค่าของพารามิเตอร์ที่ไม่รู้จัก?]98%

†แน่นอนในแง่ที่ว่าการรายงานข่าวที่แท้จริงนั้นไม่น้อยไปกว่าความครอบคลุมเล็กน้อยสำหรับค่าใด ๆ ของ & เท่ากับค่าบางค่าของ - @ ความรู้สึกของ Unwisdom ไม่ใช่ @ Stephaneππ

‡ช่วงเวลาที่มีขอบเขตบนและล่างจะใช้กันอย่างแพร่หลายแน่นอน แต่มีความซับซ้อนมากกว่าเล็กน้อยในการอธิบาย & มีเพียงหนึ่งช่วงเวลาที่แน่นอนในการพิจารณาโดยมีขอบเขตบน (ดู Blaker (2000), "เส้นโค้งความเชื่อมั่นและการปรับปรุงช่วงความเชื่อมั่นที่แน่นอนสำหรับการแจกแจงแบบไม่ต่อเนื่อง", วารสารสถิติแคนาดา , 28 , 4 & ข้อมูลอ้างอิง)


ขอบคุณสำหรับการตอบ ตอนนี้ฉันรู้แล้วว่าความน่าจะเป็นของการครอบคลุมที่แท้จริงคืออะไรคุณเดาว่าผู้ใช้ในคำถามนี้ถูกส่งไปยังคำถามที่อธิบายความแตกต่างระหว่างช่วงเวลาที่น่าเชื่อถือและความเชื่อมั่นหรือไม่ นี่คือที่ฉันได้รับความคิดที่ว่า prob การครอบคลุมจริง / เล็กน้อย ความเป็นคู่เกี่ยวข้องกัน stats.stackexchange.com/questions/63922/…
rumtscho

อาจเป็นเพราะ OP เพียงให้ลิงค์ไปยังที่ซึ่งเขาเห็นคำว่า "เล็กน้อย" และ "จริง" (แทนที่จะสรุปหรืออ้างจากมันในคำถามที่คุณทำ) แล้วอุทิศส่วนที่เหลือของคำถามของเขาไปที่การตีความผิดของพวกเขา ใช้ในบริบทนั้น
Scortchi - Reinstate Monica

2

ฉันคิดว่าความแตกต่างเป็นจริงเกี่ยวกับการใช้การประมาณที่เกิดขึ้นเมื่อคำนวณช่วงความมั่นใจ ตัวอย่างเช่นถ้าเราใช้ CI มาตรฐานที่เป็นธรรม

estimate±1.96×estimated standard error

เราอาจเรียกสิ่งนี้ว่า "ช่วงความมั่นใจ 95%" อย่างไรก็ตามเป็นกรณีที่มีการประมาณไว้หลายอย่างที่นี่ หากเราไม่ทำการประมาณค่าจากนั้นเราสามารถคำนวณความครอบคลุมจริงได้ สถานการณ์ทั่วไปอยู่ระหว่างการประเมินข้อผิดพลาดมาตรฐาน จากนั้นช่วงเวลาแคบเกินไปที่จะจับมูลค่าที่แท้จริงพร้อมความน่าจะเป็น 95% พวกเขาอาจจับมูลค่าที่แท้จริงโดยมีความน่าจะเป็น 85% เท่านั้น ความน่าจะเป็น "การครอบคลุมจริง" อาจถูกคำนวณโดยใช้การจำลอง monte carlo บางชนิด (เช่นสร้างชุดข้อมูลตัวอย่างจำนวนชุดโดยใช้ค่าจริงที่เลือกจากนั้นคำนวณ 95% CI สำหรับแต่ละชุดและพบว่ามีมูลค่าจริง)1000850

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.