เรามีขั้นตอนการสุ่มที่อาจจะหรืออาจจะไม่เกิดขึ้นหลายครั้งในระยะเวลาที่กำหนดของเวลาTเรามีฟีดข้อมูลจากรูปแบบที่มีอยู่ก่อนของกระบวนการนี้ที่ให้ความน่าจะเป็นของจำนวนของเหตุการณ์ที่เกิดขึ้นในช่วงเวลาที่<T โมเดลที่มีอยู่นี้เก่าและเราจำเป็นต้องเรียกใช้การตรวจสอบสดกับข้อมูลฟีดสำหรับข้อผิดพลาดในการประเมิน รุ่นเก่าผลิตข้อมูลฟีด (ซึ่งจะให้ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในเวลาที่เหลืออีก ) จะอยู่ที่ประมาณ Poisson กระจายT0≤t<Tnt
ดังนั้นเพื่อตรวจสอบความผิดปกติ / ข้อผิดพลาดเราปล่อยให้tเป็นเวลาที่เหลืออยู่และXtเป็นจำนวนรวมของเหตุการณ์ที่จะเกิดขึ้นในระยะเวลาที่เหลือทีtรุ่นเก่าหมายถึงการประมาณการP(Xt≤c)ค) ดังนั้นภายใต้สมมติฐานของเราXt∼Poisson(λt)เรามี:
P(Xt≤c)=e−λ∑k=0cλktk!.
เพื่อให้ได้อัตราการจัดกิจกรรมของเรา
λtจากเอ้าท์พุทของโมเดลเก่า (การสังเกต
yt ) เราใช้วิธีพื้นที่ของรัฐและสร้างแบบจำลองความสัมพันธ์ของรัฐเป็น:
yt=λt+εt(εt∼N(0,Ht)).
เรากรองการสังเกตจากแบบจำลองเก่าโดยใช้แบบจำลองพื้นที่รัฐ [การสลายตัวด้วยความเร็วคงที่] สำหรับการวิวัฒนาการของ
λtเพื่อรับสถานะการกรอง
E(λt|Yt)และตั้งค่าสถานะความผิดปกติ / ความผิดพลาดในความถี่เหตุการณ์โดยประมาณจาก ที่ฟีดข้อมูลหาก
E(λt|Yt)<yt<y_t
วิธีการนี้ใช้งานได้ดีในการรับข้อผิดพลาดในเหตุการณ์ที่คาดการณ์นับในช่วงเวลาTเต็มรูปแบบTแต่ไม่ดีถ้าเราต้องการทำเช่นเดียวกันสำหรับช่วงเวลาอื่น0≤t<σโดยที่σ<23TT ในการหลีกเลี่ยงสิ่งนี้เราได้ตัดสินใจแล้วว่าตอนนี้เราต้องการเปลี่ยนไปใช้การแจกแจงลบแบบทวินามเพื่อที่เราจะได้สมมติว่าตอนนี้Xt∼NB(r,p)และเรามี:
P(Xt≤c)=pr∑k=0c(1−p)k(k+r−1r−1),
ซึ่งตอนนี้พารามิเตอร์
λถูกแทนที่ด้วย
rและ
p. สิ่งนี้ควรตรงไปตรงมาเพื่อนำไปใช้ แต่ฉันมีปัญหากับการตีความและทำให้ฉันมีคำถามบางอย่างที่ต้องการให้คุณช่วย:
1.เราสามารถตั้งค่าp=λในการแจกแจงแบบทวินามลบได้ไหม? ถ้าไม่ทำไมไม่
2.สมมติว่าเราสามารถตั้งค่าp=f(λ)โดยที่fคือฟังก์ชั่นบางอย่างเราจะตั้งค่าrอย่างถูกต้องได้rอย่างไร (เราจำเป็นต้องพอดีกับrโดยใช้ชุดข้อมูลที่ผ่านมา)?
3.คือrขึ้นอยู่กับจำนวนของเหตุการณ์ที่เกิดขึ้นเราคาดว่าจะเกิดขึ้นในระหว่างขั้นตอนที่กำหนดหรือไม่
ภาคผนวกเพื่อแยกการประมาณสำหรับr (และp ):
ฉันรู้ว่าถ้าเราในความเป็นจริงมีปัญหานี้กลับและเรามีจำนวนเหตุการณ์สำหรับแต่ละกระบวนการที่เราสามารถนำมาใช้ประมาณการโอกาสสูงสุดสำหรับและPแน่นอนน่าจะเป็นประมาณการสูงสุดอยู่เพียงตัวอย่างที่ความแปรปรวนของกลุ่มตัวอย่างมีขนาดใหญ่กว่าค่าเฉลี่ยของกลุ่มตัวอย่าง แต่ถ้าเรื่องนี้เป็นกรณีที่เราสามารถตั้งค่าฟังก์ชั่นความน่าจะเป็นสำหรับอิสระสังเกตกันกระจายเป็น:
ซึ่งเราสามารถเขียนฟังก์ชันบันทึกความเป็นไปได้ดังนี้:
rpNk1,k2,…,kN
L(r,p)=∏i=1NP(ki;r,p),
l(r,p)=∑i=1Nln(Γ(ki+r))−∑i=1Nln(ki!)−Nln(Γ(r))+∑i=1Nkiln(p)+Nrln(1−p).
เพื่อหาค่าสูงสุดเราหาอนุพันธ์ย่อยบางส่วนเทียบกับและแล้วตั้งค่าเป็นศูนย์:
การตั้งค่าและการตั้งค่าเราพบ:
rp∂rl(r,p)∂pl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(1−p),=∑i=1Nki1p−Nr11−p.
∂rl(r,p)=∂pl(r,p)=0p=∑i=1Nki(Nr+∑Ni=1ki),∂rl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(rr+∑Ni=1kiN)=0.
สมการนี้ไม่สามารถแก้ไขได้สำหรับ r ในรูปแบบปิดโดยใช้นิวตันหรือแม้แต่ EM อย่างไรก็ตามนี่ไม่ใช่กรณีในสถานการณ์นี้ แม้ว่าเรา
จะสามารถใช้ข้อมูลที่ผ่านมาเพื่อรับค่าคงที่และนี่ไม่ใช่การใช้งานจริงสำหรับกระบวนการของเรา แต่เราต้องปรับพารามิเตอร์เหล่านี้ในเวลาเช่นเดียวกับที่เราใช้ปัวซอง
rp