คำถามติดแท็ก change-point

วิธีการที่พยายามตรวจจับเมื่อมีการเปลี่ยนแปลงเกิดขึ้นในการแจกจ่ายกระบวนการหรือฟังก์ชัน

6
การหาจุดเปลี่ยนแปลงในข้อมูลจากฟังก์ชันเชิงเส้นแบบต่อเนื่อง
ทักทาย, ฉันกำลังทำการวิจัยที่จะช่วยกำหนดขนาดของพื้นที่ที่สังเกตและเวลาที่ผ่านไปนับตั้งแต่บิ๊กแบง หวังว่าคุณจะช่วยได้! ฉันมีข้อมูลที่สอดคล้องกับฟังก์ชันเชิงเส้นเป็นเส้นตรงซึ่งฉันต้องการดำเนินการถดถอยเชิงเส้นสองแบบ มีประเด็นที่ความชันและการสกัดกั้นเปลี่ยนไปและฉันต้องการ (เขียนโปรแกรมเป็น) เพื่อหาจุดนี้ คิด?

1
ฉันจะเน้นเสียงแก้ไขที่มีเสียงดังในอนุกรมเวลาได้อย่างไร
ฉันมีข้อมูลอนุกรมเวลาจำนวนมาก - ระดับน้ำและความเร็วเทียบกับเวลา มันเป็นผลลัพธ์จากการจำลองแบบไฮดรอลิก เป็นส่วนหนึ่งของกระบวนการตรวจสอบเพื่อยืนยันว่าแบบจำลองทำงานได้ตามที่คาดหวังฉันต้องวางแผนในแต่ละช่วงเวลาเพื่อให้แน่ใจว่าไม่มี "การโยกเยก" ในข้อมูล (ดูตัวอย่างการโยกเยกเล็กน้อยด้านล่าง) การใช้ UI ของซอฟต์แวร์การสร้างแบบจำลองเป็นวิธีที่ค่อนข้างช้าและลำบากในการตรวจสอบข้อมูลนี้ ฉันจึงเขียนแมโคร VBA สั้น ๆ เพื่อนำเข้าบิตข้อมูลต่าง ๆ จากแบบจำลองรวมถึงผลลัพธ์ลงใน Excel และพล็อตพวกมันทั้งหมดในครั้งเดียว ฉันหวังว่าจะเขียนแมโคร VBA สั้น ๆ อีกชุดเพื่อวิเคราะห์ข้อมูลอนุกรมเวลาและเน้นส่วนที่สงสัย สิ่งเดียวที่ฉันคิดก็คือฉันสามารถวิเคราะห์ความชันของข้อมูลได้บ้าง ทุกที่ที่ความชันเปลี่ยนแปลงอย่างรวดเร็วจากการเป็นค่าบวกเป็นค่าลบหลายครั้งภายในหน้าต่างการค้นหาที่ระบุอาจถูกจัดประเภทว่าไม่เสถียร ฉันพลาดเทคนิคที่ง่ายกว่านี้ไหม? โดยพื้นฐานแล้วการจำลอง "เสถียร" ควรให้เส้นโค้งที่ราบรื่นมาก การเปลี่ยนแปลงอย่างฉับพลันใด ๆ มีแนวโน้มที่จะเป็นผลมาจากความไม่แน่นอนในการคำนวณ

1
การตรวจหาการเปลี่ยนแปลงคู่เคียงแบบเบย์ออนไลน์
ฉันกำลังอ่านรายงานการตรวจหาการเปลี่ยนแปลงไบเซียนออนไลน์โดย Adams และ MacKay ( ลิงก์ ) ผู้แต่งเริ่มต้นด้วยการเขียนการแจกแจงการทำนายแบบชายขอบ: โดยที่P(xt+1|x1:t)=∑rtP(xt+1|rt,x(r)t)P(rt|x1:t)(1)P(xt+1|x1:t)=∑rtP(xt+1|rt,xt(r))P(rt|x1:t)(1) P(x_{t+1} | \textbf{x}_{1:t}) = \sum_{r_t} P(x_{t+1} | r_t, \textbf{x}_t^{(r)}) P(r_t | \textbf{x}_{1:t}) \qquad \qquad (1) xtxtx_tคือการสังเกตในเวลา ;ttt x1:tx1:t\textbf{x}_{1:t}หมายถึงชุดการสังเกตจนกระทั่งเวลา ;ttt rt∈Nrt∈Nr_t \in \mathbb{N}คือ runlength ปัจจุบัน (เวลานับตั้งแต่การเปลี่ยนแปลงครั้งล่าสุดสามารถเป็น 0); และ x(r)txt(r)\textbf{x}_t^{(r)}เป็นชุดของการสังเกตที่เกี่ยวข้องกับการทำงานr_trtrtr_t อีคิว 1 ถูกต้องเป็นทางการ (ดูคำตอบด้านล่างโดย @JuhoKokkala) แต่ความเข้าใจของฉันคือถ้าคุณต้องการทำนายเกี่ยวกับคุณจะต้องขยายดังต่อไปนี้:xt+1xt+1x_{t+1} P(xt+1|x1:t)=∑rt,rt+1P(xt+1|rt+1,x(r)t)P(rt|x1:t)P(rt+1|rt)(1b)P(xt+1|x1:t)=∑rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b) P(x_{t+1} | \textbf{x}_{1:t}) = \sum_{r_t, r_{t+1}} …

2
การตรวจหา Switchpoint ด้วยการโปรแกรมที่น่าจะเป็น (pymc)
ฉันกำลังอ่านการเขียนโปรแกรมน่าจะเป็นและวิธีเบส์สำหรับแฮกเกอร์ "หนังสือ" ฉันได้อ่านบทไม่กี่บทและฉันก็คิดในบทแรกที่ตัวอย่างแรกของ pymc ประกอบด้วยการตรวจสอบ witchpoint ในข้อความ ในตัวอย่างว่าตัวแปรสุ่มเพื่อระบุว่าเมื่อ switchpoint ที่เกิดขึ้นจะถูกระบุด้วย\หลังจากขั้นตอน MCMC การแจกแจงหลังของ จะได้รับ:ττ\tauττ\tau ประการแรกสิ่งที่สามารถเรียนรู้ได้จากกราฟนี้คือมีความเป็นไปได้เกือบ 50% ที่จุดเปลี่ยนเกิดขึ้นในวันที่ 45 แม้ว่าจะเกิดอะไรขึ้นถ้าไม่มีจุดเปลี่ยน แทนที่จะสมมติว่ามีสวิตช์พอยต์แล้วลองค้นหาฉันต้องการตรวจสอบว่ามีสวิตช์pointหรือไม่ ผู้เขียนตอบคำถาม "เกิด switchpoint เกิดขึ้น" โดย "ไม่มีการเปลี่ยนแปลงเกิดขึ้นหรือมีการเปลี่ยนแปลงอย่างค่อยเป็นค่อยไปเมื่อเวลาผ่านไปการกระจายหลัง จะกระจายออกไปมากขึ้น" แต่คุณจะตอบคำถามนี้อย่างไรเช่นมีโอกาส 90% ที่จุดเปลี่ยนจะเกิดขึ้นและมีโอกาส 50% ที่จะเกิดขึ้นในวันที่ 45ττ\tau จำเป็นต้องเปลี่ยนโมเดลหรือไม่ หรือสามารถตอบด้วยรุ่นปัจจุบันได้หรือไม่

2
วิธีการที่ทันสมัยเพื่อค้นหาศูนย์ค่าเฉลี่ยส่วนของอนุกรมเวลา
ฉันมีอนุกรมเวลาที่มีเสียงดังซึ่งฉันต้องแบ่งส่วนออกเป็นส่วน ๆ ด้วยค่าเฉลี่ยเป็นศูนย์และส่วนที่ไม่มีค่าเฉลี่ยเป็นศูนย์ การค้นหาขอบเขตอย่างแม่นยำที่สุดเท่าที่จะเป็นไปได้มีความสำคัญ (ชัดเจนว่าขอบเขตอยู่ตรงไหนเป็นเรื่องส่วนตัว) ฉันคิดว่าตัวแปร cusum สามารถปรับให้ทำเช่นนี้ได้ แต่เนื่องจาก cusum เป็นหลักเกี่ยวกับการค้นหาการเปลี่ยนแปลงเดียวที่ทำให้กลยุทธ์การแบ่งกลุ่มทั้งหมดไม่ได้รับการแก้ไขอย่างสมบูรณ์ ฉันแน่ใจว่ามีการทำวิจัยเป็นจำนวนมากเกี่ยวกับปัญหานี้ แต่ไม่สามารถหาได้ ป.ล. จำนวนข้อมูลในอนุกรมเวลาเหล่านี้ค่อนข้างมากตัวอย่างมากถึงหลายร้อยล้านตัวอย่างและแต่ละตัวอย่างสามารถเป็นเวกเตอร์ที่มีองค์ประกอบสองร้อยชิ้นดังนั้นวิธีที่สามารถคำนวณได้อย่างรวดเร็วเป็นปัจจัยสำคัญ . PPS ไม่มีแท็กการแบ่งกลุ่มดังนั้นแท็กการจัดหมวดหมู่
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.