ฟังก์ชั่นที่ไม่ต่อเนื่อง: ครอบคลุมช่วงความมั่นใจหรือไม่


9

จะคำนวณการครอบคลุมช่วงเวลาแบบไม่ต่อเนื่องได้อย่างไร?

สิ่งที่ฉันรู้วิธีการทำ:

ถ้าฉันมีแบบจำลองต่อเนื่องฉันสามารถกำหนดช่วงความมั่นใจ 95% สำหรับค่าที่คาดการณ์ของฉันแต่ละค่าจากนั้นดูความถี่ที่ค่าจริงอยู่ในช่วงความมั่นใจ ฉันอาจพบว่ามีเพียง 88% ของช่วงเวลาที่ช่วงความมั่นใจ 95% ของฉันครอบคลุมค่าจริง

สิ่งที่ฉันไม่รู้จะทำอย่างไร:

ฉันจะทำสิ่งนี้อย่างไรกับแบบจำลองที่ไม่ต่อเนื่องเช่นปัวซองหรือแกมม่าปัวซอง? สิ่งที่ฉันมีสำหรับรุ่นนี้มีดังต่อไปนี้ทำการสังเกตเพียงครั้งเดียว (จากกว่า 100,000 แผนฉันจะสร้าง :)

การสังเกต #: (โดยพลการ)

ค่าที่คาดการณ์: 1.5

ความน่าจะเป็นที่คาดการณ์ไว้คือ 0: .223

ความน่าจะเป็นที่คาดการณ์ไว้ 1: .335

ความน่าจะเป็นที่คาดการณ์ไว้ที่ 2: .251

ความน่าจะเป็นที่คาดการณ์ไว้ 3: .126

ความน่าจะเป็นที่คาดการณ์ไว้ที่ 4: .048

ความน่าจะเป็นที่คาดการณ์ไว้ที่ 5: .014 [และ 5 หรือมากกว่านั้นคือ. 019]

... ( ฯลฯ )

ความน่าจะเป็นที่คาดการณ์ไว้ที่ 100 (หรือตัวเลขที่ไม่สมจริงอื่น ๆ ): .000

มูลค่าจริง (จำนวนเต็มเช่น "4")

โปรดทราบว่าในขณะที่ฉันได้รับค่าปัวซองข้างต้นในแบบจำลองจริงค่าคาดการณ์ที่ 1.5 อาจมีความน่าจะเป็นทำนายที่แตกต่างกันคือ 0,1, ... 100 จากการสังเกต

ฉันสับสนด้วยความแตกต่างของค่านิยม เห็นได้ชัดว่า "5" อยู่นอกช่วงเวลา 95% เนื่องจากมีเพียง 0.19 ที่ 5 ขึ้นไปซึ่งน้อยกว่า. 025 แต่จะมีจำนวนมากของ 4 - แต่ละคนพวกเขาอยู่ภายใน แต่ฉันจะร่วมกันประเมินจำนวน 4 ที่เหมาะสมมากขึ้นได้อย่างไร

ทำไมฉันถึงแคร์

แบบจำลองที่ฉันกำลังดูได้รับการวิพากษ์วิจารณ์ว่ามีความถูกต้องในระดับรวม แต่ให้การคาดการณ์รายบุคคลที่ไม่ดี ฉันต้องการดูว่าการคาดการณ์ของแต่ละคนที่แย่กว่านั้นยิ่งแย่กว่าช่วงความเชื่อมั่นที่กว้างโดยกำเนิดจากแบบจำลอง ฉันคาดหวังว่าการรายงานข้อมูลเชิงประจักษ์จะแย่ลง (เช่นฉันอาจพบว่า 88% ของค่าอยู่ภายในช่วงความมั่นใจ 95%) แต่ฉันหวังว่าจะเลวร้ายลงเล็กน้อย

คำตอบ:


6

ช่วงความมั่นใจของ Neyman ไม่พยายามที่จะให้ความครอบคลุมของพารามิเตอร์ในกรณีของช่วงเวลาใด ๆ แต่จะให้ความครอบคลุมมากกว่าค่าพารามิเตอร์ที่เป็นไปได้ทั้งหมดในระยะยาว ในความรู้สึกที่พวกเขาพยายามที่จะถูกต้องทั่วโลกที่ค่าใช้จ่ายของความถูกต้องในท้องถิ่น

ช่วงความเชื่อมั่นสำหรับสัดส่วนทวินามให้ภาพที่ชัดเจนของปัญหานี้ การประเมินค่า Neymanian ของช่วงเวลาทำให้เกิดความครอบคลุมที่ผิดปกติเช่นนี้ซึ่งเป็นช่วงเวลา 95% Clopper-Pearson สำหรับ n = 10 การทดลองแบบทวินาม:

พล็อตคุ้มครอง Clopper-Pearson

มีอีกทางเลือกหนึ่งในการทำข่าวซึ่งฉันคิดว่าเป็นการส่วนตัวที่เข้าถึงได้ง่ายกว่าและมีประโยชน์ ความครอบคลุมตามช่วงเวลาสามารถระบุเงื่อนไขในผลลัพธ์ที่สังเกตได้ ความคุ้มครองนั้นจะเป็นความคุ้มครองระดับท้องถิ่น นี่คือพล็อตที่แสดงการครอบคลุมในท้องถิ่นสำหรับสามวิธีที่แตกต่างกันในการคำนวณช่วงการประชุมสำหรับสัดส่วนทวินาม: Clopper-Pearson, คะแนนของวิลสันและวิธีการที่แน่นอนตามเงื่อนไข

การครอบคลุมแบบมีเงื่อนไขสำหรับช่วงเวลาสามประเภท

ขอให้สังเกตว่าวิธี 95% Clopper-Pearson ให้ความคุ้มครองในพื้นที่มากกว่า 98% แต่ช่วงเวลาตามเงื่อนไขที่แน่นอนคือดีและแน่นอน

วิธีคิดความแตกต่างระหว่างช่วงเวลาระหว่างโลกกับท้องถิ่นคือการพิจารณาจากทั่วโลกว่าเป็นผู้ทดสอบสมมติฐานสมมุติฐานของเนย์แมน - เพียร์สันซึ่งผลลัพธ์คือการตัดสินใจบนพื้นฐานของการพิจารณาอัตราความผิดพลาดระยะยาวในปัจจุบัน การทดสอบในฐานะสมาชิกของชุดส่วนกลางของการทดสอบทั้งหมดที่อาจทำงาน ช่วงเวลาท้องถิ่นมากขึ้นคล้ายกับการผกผันของการทดสอบอย่างมีนัยสำคัญ Fisherian ซึ่งให้ผลผลิตคุ้มค่า P ซึ่งหมายถึงหลักฐานโมฆะจากนี้โดยเฉพาะการทดลอง

(เท่าที่ฉันรู้ความแตกต่างระหว่างสถิติโลกและท้องถิ่นถูกสร้างขึ้นเป็นครั้งแรกในวิทยานิพนธ์ปริญญาโทที่ไม่ได้เผยแพร่โดย Claire F Leslie (1998) การขาดความมั่นใจ: การศึกษาการปราบปรามตัวอย่างต่อต้านทฤษฎีของเนย์แมน - เพียร์สัน การอนุมานทางสถิติที่มีการอ้างอิงโดยเฉพาะกับทฤษฎีของช่วงความเชื่อมั่นวิทยานิพนธ์ดังกล่าวจัดขึ้นโดยห้องสมุด Baillieu ที่มหาวิทยาลัยเมลเบิร์น)


2
ฉันไม่คิดว่าแคลร์เลสลี่ประดิษฐ์ความแตกต่างระดับโลก / ระดับท้องถิ่น แต่เธอได้ให้คำอธิบายโดยละเอียดพร้อมด้วยการอ้างอิงมากมาย ฉันขอแนะนำวิทยานิพนธ์ของเธอด้วย
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.