วิธีการที่ทันสมัยเพื่อค้นหาศูนย์ค่าเฉลี่ยส่วนของอนุกรมเวลา


9

ฉันมีอนุกรมเวลาที่มีเสียงดังซึ่งฉันต้องแบ่งส่วนออกเป็นส่วน ๆ ด้วยค่าเฉลี่ยเป็นศูนย์และส่วนที่ไม่มีค่าเฉลี่ยเป็นศูนย์ การค้นหาขอบเขตอย่างแม่นยำที่สุดเท่าที่จะเป็นไปได้มีความสำคัญ (ชัดเจนว่าขอบเขตอยู่ตรงไหนเป็นเรื่องส่วนตัว) ฉันคิดว่าตัวแปร cusum สามารถปรับให้ทำเช่นนี้ได้ แต่เนื่องจาก cusum เป็นหลักเกี่ยวกับการค้นหาการเปลี่ยนแปลงเดียวที่ทำให้กลยุทธ์การแบ่งกลุ่มทั้งหมดไม่ได้รับการแก้ไขอย่างสมบูรณ์

ฉันแน่ใจว่ามีการทำวิจัยเป็นจำนวนมากเกี่ยวกับปัญหานี้ แต่ไม่สามารถหาได้

ป.ล. จำนวนข้อมูลในอนุกรมเวลาเหล่านี้ค่อนข้างมากตัวอย่างมากถึงหลายร้อยล้านตัวอย่างและแต่ละตัวอย่างสามารถเป็นเวกเตอร์ที่มีองค์ประกอบสองร้อยชิ้นดังนั้นวิธีที่สามารถคำนวณได้อย่างรวดเร็วเป็นปัจจัยสำคัญ .

PPS ไม่มีแท็กการแบ่งกลุ่มดังนั้นแท็กการจัดหมวดหมู่

คำตอบ:


1

ดูเหมือนว่าปัญหาหลักที่นี่คือการตรวจจับจุดเปลี่ยนที่มีประสิทธิภาพเนื่องจากหลังจากนั้นค่าเฉลี่ยของกลุ่มสามารถพบได้เล็กน้อยโดยเพิ่มความแม่นยำในจำนวนตัวอย่าง เมื่อแนวทางล่าสุดที่น่าสนใจคือZ. Harchaoui, F. Bach และ E. Moulines การวิเคราะห์จุดเปลี่ยนเคอร์เนล, ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท (NIPS), 2008


1

สิ่งนี้อาจไม่ทันสมัย ​​แต่วิธีการที่ใช้งานง่ายจะทำให้ข้อมูลราบรื่นโดยการวางตุ้มน้ำหนักบนการสังเกตใกล้กับแต่ละจุดในเวลา ดังนั้นหากคุณต้องการทราบว่าตัวอย่าง R มีค่าเฉลี่ยเป็นศูนย์ ณ เวลา T หรือไม่:

mu(R,T)=w1*Sample(R,T)+w2*Sample(R,T-1)+w3*Sample(R,T+1)....

บางทีตุ้มน้ำหนักแบบเอ็กซ์โปเนนเชียลอาจเป็นตัวเลือกที่ดีขึ้นอยู่กับคำจำกัดความของที่ตั้งของขอบเขต

หลังจากดูแลรายละเอียดทางเทคนิคบางอย่างเช่นคำจำกัดความที่จุดเริ่มต้นและจุดสิ้นสุดของแต่ละ Somple คุณสามารถทดสอบได้ว่าแต่ละ mu นั้นอยู่ใกล้กับศูนย์มากพอที่จะหาจุดที่ค่าเฉลี่ยเป็นศูนย์หรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.