จะคำนวณการครอบคลุมช่วงเวลาแบบไม่ต่อเนื่องได้อย่างไร?
สิ่งที่ฉันรู้วิธีการทำ:
ถ้าฉันมีแบบจำลองต่อเนื่องฉันสามารถกำหนดช่วงความมั่นใจ 95% สำหรับค่าที่คาดการณ์ของฉันแต่ละค่าจากนั้นดูความถี่ที่ค่าจริงอยู่ในช่วงความมั่นใจ ฉันอาจพบว่ามีเพียง 88% ของช่วงเวลาที่ช่วงความมั่นใจ 95% ของฉันครอบคลุมค่าจริง
สิ่งที่ฉันไม่รู้จะทำอย่างไร:
ฉันจะทำสิ่งนี้อย่างไรกับแบบจำลองที่ไม่ต่อเนื่องเช่นปัวซองหรือแกมม่าปัวซอง? สิ่งที่ฉันมีสำหรับรุ่นนี้มีดังต่อไปนี้ทำการสังเกตเพียงครั้งเดียว (จากกว่า 100,000 แผนฉันจะสร้าง :)
การสังเกต #: (โดยพลการ)
ค่าที่คาดการณ์: 1.5
ความน่าจะเป็นที่คาดการณ์ไว้คือ 0: .223
ความน่าจะเป็นที่คาดการณ์ไว้ 1: .335
ความน่าจะเป็นที่คาดการณ์ไว้ที่ 2: .251
ความน่าจะเป็นที่คาดการณ์ไว้ 3: .126
ความน่าจะเป็นที่คาดการณ์ไว้ที่ 4: .048
ความน่าจะเป็นที่คาดการณ์ไว้ที่ 5: .014 [และ 5 หรือมากกว่านั้นคือ. 019]
... ( ฯลฯ )
ความน่าจะเป็นที่คาดการณ์ไว้ที่ 100 (หรือตัวเลขที่ไม่สมจริงอื่น ๆ ): .000
มูลค่าจริง (จำนวนเต็มเช่น "4")
โปรดทราบว่าในขณะที่ฉันได้รับค่าปัวซองข้างต้นในแบบจำลองจริงค่าคาดการณ์ที่ 1.5 อาจมีความน่าจะเป็นทำนายที่แตกต่างกันคือ 0,1, ... 100 จากการสังเกต
ฉันสับสนด้วยความแตกต่างของค่านิยม เห็นได้ชัดว่า "5" อยู่นอกช่วงเวลา 95% เนื่องจากมีเพียง 0.19 ที่ 5 ขึ้นไปซึ่งน้อยกว่า. 025 แต่จะมีจำนวนมากของ 4 - แต่ละคนพวกเขาอยู่ภายใน แต่ฉันจะร่วมกันประเมินจำนวน 4 ที่เหมาะสมมากขึ้นได้อย่างไร
ทำไมฉันถึงแคร์
แบบจำลองที่ฉันกำลังดูได้รับการวิพากษ์วิจารณ์ว่ามีความถูกต้องในระดับรวม แต่ให้การคาดการณ์รายบุคคลที่ไม่ดี ฉันต้องการดูว่าการคาดการณ์ของแต่ละคนที่แย่กว่านั้นยิ่งแย่กว่าช่วงความเชื่อมั่นที่กว้างโดยกำเนิดจากแบบจำลอง ฉันคาดหวังว่าการรายงานข้อมูลเชิงประจักษ์จะแย่ลง (เช่นฉันอาจพบว่า 88% ของค่าอยู่ภายในช่วงความมั่นใจ 95%) แต่ฉันหวังว่าจะเลวร้ายลงเล็กน้อย