การตรวจหาการเปลี่ยนแปลงคู่เคียงแบบเบย์ออนไลน์


9

ฉันกำลังอ่านรายงานการตรวจหาการเปลี่ยนแปลงไบเซียนออนไลน์โดย Adams และ MacKay ( ลิงก์ )

ผู้แต่งเริ่มต้นด้วยการเขียนการแจกแจงการทำนายแบบชายขอบ: โดยที่

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
  • xtคือการสังเกตในเวลา ;t
  • x1:tหมายถึงชุดการสังเกตจนกระทั่งเวลา ;t
  • rtNคือ runlength ปัจจุบัน (เวลานับตั้งแต่การเปลี่ยนแปลงครั้งล่าสุดสามารถเป็น 0); และ
  • xt(r)เป็นชุดของการสังเกตที่เกี่ยวข้องกับการทำงานr_trt

อีคิว 1 ถูกต้องเป็นทางการ (ดูคำตอบด้านล่างโดย @JuhoKokkala) แต่ความเข้าใจของฉันคือถ้าคุณต้องการทำนายเกี่ยวกับคุณจะต้องขยายดังต่อไปนี้:xt+1

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

เหตุผลของฉันคืออาจมีการเปลี่ยนเวลา (ในอนาคต) เวลาแต่หลังครอบคลุมจนถึงเท่านั้นt+1P(rt|x1:t)t

ประเด็นก็คือผู้แต่งในกระดาษทำให้เราเป็นสมการ 1 ตามที่เป็นอยู่ (ดู Eqs. 3 และ 11 ในกระดาษ) และไม่ใช่ 1b ดังนั้นพวกเขาดูเหมือนจะไม่สนใจความเป็นไปได้ของ changepoint ที่ในเวลาเมื่อทำนายจากข้อมูลที่มีอยู่ในเวลาทีในตอนต้นของส่วนที่ 2 พวกเขาพูดen passantt+1xt+1t

เราคิดว่าเราสามารถคำนวณการกระจายการทำนาย [สำหรับ ] เงื่อนไขในการให้วิ่งยาวr_txt+1rt

ซึ่งอาจเป็นที่เคล็ดลับอยู่ แต่โดยทั่วไปการกระจายการทำนายนี้น่าจะดูเหมือน Eq 1b; ซึ่งไม่ใช่สิ่งที่พวกเขาทำ (อสม. 11)

ดังนั้นฉันไม่แน่ใจว่าฉันเข้าใจว่าเกิดอะไรขึ้น บางทีอาจมีบางสิ่งที่ตลก ๆ เกิดขึ้นพร้อมกับเครื่องหมาย


การอ้างอิง

  • Adams, RP, & MacKay, DJ (2007) การตรวจหาการเปลี่ยนแปลงสัญญาณแบบเบย์แบบออนไลน์ พิมพ์ล่วงหน้า arXiv arXiv: 0710.3742

คำอธิบายที่มีศักยภาพเป็นที่หมายถึงระยะเวลาในการทำงานที่ส่วนท้ายของเวลาขั้นตอนซึ่งเป็นหลังจาก changepoint ในเวลาทีด้วยสิ่งนี้สมการ 1 ทำให้รู้สึก ในความเป็นจริงหนึ่งในการเริ่มต้นของขั้นตอนวิธีคือโดยการตั้งค่าซึ่งสันนิษฐานว่ามี changepoint ขวาก่อนที่จะเริ่มที่ 1 อย่างไรก็ตามรูปที่ 1 เป็นสิ่งที่ผิด (หรืออย่างน้อยทำให้เข้าใจผิด) ในกรณีที่มีการเปลี่ยนระหว่างและและระหว่างและดังแสดงในรูปที่ 1a ดังนั้นและrtttP(r0=0)=1t=1t=4t=5t=10t=11r4r10ควรเป็น 0 ตามสัญกรณ์นี้ไม่ใช่และr5r11ตามรูปที่ 1b
lacerbi

1
มีบางอย่างแปลก ๆ เกิดขึ้นใน Eq 3 เป็นตัวประกอบกลางในการสรุปในบรรทัดสุดท้ายคือ P(xtrt1,xt(r)) ในขณะที่ฉันคิด xt(r) มี xt. ฉันสงสัยว่าt และ t1 ได้เปลี่ยนสถานที่เป็น P(xtrt,xt1(r))จะทำให้รู้สึก ในสมการ 11 ดูเหมือนว่าทางด้านขวาจะขึ้นอยู่กับxt(r)ซึ่งไม่ปรากฏที่ด้านซ้ายเลยดังนั้นมีบางอย่างผิดปกติหรือฉันไม่เข้าใจสัญกรณ์เลย
Juho Kokkala

@JuhoKokkala: ฉันดีใจที่ผมไม่ได้เป็นเพียงคนเดียวที่มีความรู้สึกว่า ...
lacerbi

1
@lacerbi ผมมีคำถามเกี่ยวกับบทความนี้อีกและคิดว่าคุณอาจจะสามารถที่จะตอบมันตั้งแต่คุณดูเหมือนคุ้นเคยกับการทำงาน: stats.stackexchange.com/questions/419988
gwg

คำตอบ:


5

ทั้ง (1) และ (1b) ถูกต้อง OP มีสิทธิ์ที่ (ในรุ่นนี้) อาจมีการเปลี่ยนที่t+1และ xt+1ขึ้นอยู่กับว่ามีการเปลี่ยนแปลงหรือไม่ สิ่งนี้ไม่ได้หมายความถึงปัญหาใด ๆ กับ (1) ว่าเป็นค่าที่เป็นไปได้ของrt+1 ถูก "ปิด" อย่างสมบูรณ์โดย P(xt+1rt,x1:t). P(xt+1|rt,x1:t) หมายถึงการกระจายเงื่อนไขของ xt+1 เงื่อนไข (rt,x1:t). การแจกแจงแบบมีเงื่อนไขนี้มีค่าเฉลี่ยมากกว่า "ทุกอย่าง" รวมถึงrt+1บนเงื่อนไข (rt,x1:t). เหมือนที่เขียนได้พูดได้P(xt+1000|xt)ซึ่งจะคำนึงถึงการกำหนดค่าที่เป็นไปได้ทั้งหมดของการเปลี่ยนค่ารวมทั้งค่าของ xiเกิดขึ้นระหว่าง t และ t+1000.

ในส่วนที่เหลือฉันแรกได้รับ (1) และจากนั้น (1b) ตาม (1)

แหล่งที่มาของ (1)

สำหรับตัวแปรสุ่มใด ๆ A,B,C, เรามี

P(AB)=cP(AB,C=c)P(C=cB),
ตราบเท่าที Cไม่ต่อเนื่อง (ไม่เช่นนั้นผลรวมจะต้องถูกแทนที่ด้วยอินทิกรัล) ใช้สิ่งนี้กับxt+1,x1:t,rt:

P(xt+1x1:t)=rtP(xt+1rt,x1:t)P(rtx1:t),
ซึ่งถือไม่ว่าสิ่งที่อ้างอิงระหว่าง rt, x1:t, xt+1คือนั่นคือยังไม่มีการใช้สมมติฐานที่เป็นรูปแบบ ในรูปแบบปัจจุบันxt+1 รับ rt,xt(r) ถูกสันนิษฐานว่า * เป็นเงื่อนไขที่เป็นอิสระจากค่าของ x จากการวิ่งมาก่อน xt(r). สิ่งนี้แสดงถึงP(xt+1rt,x1:t)=P(xt+1rt,xt(r)). เราได้สิ่งนี้มาแทนสมการก่อนหน้า

P(xt+1x1:t)=rtP(xt+1rt,xt(r))P(rtx1:t),(1)
ซึ่งคือ (1) ใน OP

แหล่งที่มาของ (1b)

ให้เราพิจารณาการสลายตัวของ P(xt+1rt,xt(r)) มากกว่าค่าที่เป็นไปได้ของ rt+1:

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,rt,xt(r))P(rt+1rt,xt(r)).

เนื่องจากมันถูกสันนิษฐานว่า * ว่าการเปลี่ยนแปลงเกิดขึ้นที่ t+1 (ระหว่าง xt และ xt+1) ไม่ได้ขึ้นอยู่กับประวัติของ x, เรามี P(rt+1rt,xt(r))=P(rt+1rt). Furthermore, since rt+1 determines whether xt+1 belongs into the same run as xt, we have P(xt+1rt+1,rt,xt(r))=P(xt+1rt+1,xt(r)). Substituting these two simplifications into the factorization above, we get

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,xt(r))P(rt+1rt).
Substituting this into (1), we get
P(xt+1x1:t)=rt(rt+1P(xt+1rt+1,xt(r))P(rt+1rt))P(rtx1:t),(1b)
which is OP's (1b).

* Remark on the model's conditional independence assumptions

Based on quickly browsing the paper, I would personally like the conditional independence properties to be more explicitly stated somewhere, but I suppose that the intention is that r is Markovian and the x:s associated to different runs are independent (given the runs).


1
(+1) Thanks. Yep, of course, I understand that Eq. 1 is formally correct if one assumes implicit marginalization over rt+1. The problem is that later on the authors make predictions (Eq. 11 in the paper, and implicitly in Eq. 3) and they are seemingly not marginalizing over rt+1 when they take them.
lacerbi

1
Oh. It seems then that I misunderstood the question - should I delete this? You may want to clarify the question, currently it sounds like (1) is somehow incorrect (instead of perhaps not useful)
Juho Kokkala

Please keep this answer, which is valuable. My mistake that I was't clear enough in my original post. I tried to clarify my question thanks to your comments, and in a way that still makes this answer meaningful.
lacerbi
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.