อนุกรมเวลาและการตรวจจับความผิดปกติ


15

ฉันต้องการติดตั้งอัลกอริทึมสำหรับตรวจจับความผิดปกติในอนุกรมเวลาและฉันวางแผนที่จะใช้การทำคลัสเตอร์สำหรับสิ่งนั้น

  • เหตุใดฉันจึงควรใช้เมทริกซ์ระยะทางสำหรับการจัดกลุ่มและไม่ใช่ข้อมูลอนุกรมเวลา

  • สำหรับการตรวจจับความผิดปกติฉันจะใช้การจัดกลุ่มตามความหนาแน่นอัลกอริธึมเป็น DBscan ดังนั้นกรณีนี้จะใช้ได้หรือไม่ มีเวอร์ชั่นออนไลน์สำหรับการสตรีมข้อมูลหรือไม่

  • ฉันต้องการตรวจจับความผิดปกติก่อนที่จะเกิดขึ้นดังนั้นการใช้อัลกอริธึมการตรวจจับแนวโน้ม (ARIMA) เป็นทางเลือกที่ดีหรือไม่?


มันถูกเขียนอย่างถูกต้อง DBSCAN มันเป็นตัวย่อ ฉันไม่แน่ใจว่าคุณกำลังพยายามทำอะไร ตรวจจับความผิดปกติภายในอนุกรมเวลาหรืออนุกรมเวลาผิดปกติโดยรวม
เลิกเล่น - Anony-Mousse

ใช่ DBSCAN แน่นอน! สิ่งที่ฉันพยายามจะทำคือการตรวจจับความผิดปกติทางออนไลน์ในชุดข้อมูลอนุกรมเวลา! ดังนั้น! คำขอใด ๆ ขอขอบคุณด้วย
napsterockoeur

ออนไลน์เช่นเดียวกับในช่วงเวลาที่กำลังเติบโตหรือในซีรี่ส์เพิ่มเติมที่เพิ่มเข้ามา? อีกครั้งสิ่งเหล่านี้แตกต่างกันมากและคุณต้องชัดเจนมากในเรื่องที่คุณหมายถึง
จบแล้ว - Anony-Mousse

ฉันหมายถึงทางออนไลน์ (สตรีม) ซีรีย์ที่กำลังเติบโตที่มาจากเซ็นเซอร์ .. ทุกๆหนึ่งชั่วโมงจะได้รับชุดข้อมูล (เวกเตอร์) ..
napsterockoeur

คำตอบ:


12

เกี่ยวกับคำถามแรกของคุณฉันขอแนะนำให้คุณอ่านบทความที่มีชื่อเสียงนี้ (การจัดกลุ่มตามลำดับอนุกรมเวลาเป็นสิ่งที่ไร้ความหมาย) ก่อนทำการจัดกลุ่มในอนุกรมเวลา มันเขียนไว้อย่างชัดเจนและแสดงให้เห็นถึงข้อผิดพลาดมากมายที่คุณต้องการหลีกเลี่ยง


6

การตรวจจับความผิดปกติหรือ "การตรวจจับการแทรกแซง" ได้รับการสนับสนุนจาก GCTiao และอื่น ๆ ในการทำวิทยาศาสตร์คือการค้นหารูปแบบซ้ำ ๆ การตรวจสอบความผิดปกติคือการระบุค่าที่ไม่เป็นไปตามรูปแบบซ้ำ ๆ เราเรียนรู้จากนิวตัน "ใครก็ตามที่รู้หนทางของธรรมชาติจะสังเกตเห็นความเบี่ยงเบนของเธอได้ง่ายขึ้นและในทางกลับกันใครก็ตามที่รู้ว่าการเบี่ยงเบนของเธอจะอธิบายวิถีชีวิตของเธอได้แม่นยำกว่า" หนึ่งเรียนรู้กฎโดยการสังเกตเมื่อกฎปัจจุบันล้มเหลว พิจารณาอนุกรมเวลา 1,9,1,9,1,9,5,9 ในการระบุความผิดปกตินั้นต้องมีรูปแบบ "5" นั้นมีความผิดปกติมากเท่ากับ "14" ในการระบุรูปแบบเพียงใช้ ARIMA และในกรณีนี้ "ความผิดปกติ" จะกลายเป็นชัดเจน ลองใช้ซอฟต์แวร์ / แนวทางที่แตกต่างกันและดูว่าอันไหนที่แนะนำโมเดล ARIMA ของการสั่งซื้อ 1,0 0 ที่มีค่าสัมประสิทธิ์ -1.0 ใช้ขั้นตอน google / search เพื่อค้นหา "arima อัตโนมัติ" หรือ "การตรวจจับการแทรกแซงอัตโนมัติ" คุณอาจผิดหวังกับของฟรีเพราะมันอาจคุ้มค่ากับสิ่งที่คุณจ่ายไป การเขียนด้วยตัวคุณเองอาจเป็นเรื่องที่น่าสนใจหากคุณมีฉากหลังที่หนักหน่วงและเสียเวลาไปสองสามปีมีข้อ จำกัด ที่ร้ายแรงสำหรับวิธีการทางไกลhttp://www3.ntu.edu.sg/SCE/pakdd2006/tutorial/chawla_tutorial_pakddslides.pdf


ขอบคุณมาก Sir IrishStat ฉันโอเคกับคุณทั้งหมดมีข้อ จำกัด อย่างมากเกี่ยวกับวิธีการทางไกลและฉันเดาวิธีอื่นเช่นกันนี่คือเหตุผลที่ฉันกำลังทดสอบวิธีฐานความหนาแน่นฉันเห็นบทความจำนวนมากพูด เกี่ยวกับการตรวจจับความผิดปกติของอนุกรมเวลาเช่นเดียวกับการวิจัยของนาซ่ามหาวิทยาลัย .. ฯลฯ แต่มีความคืบหน้าเล็กน้อยสำหรับปัญหาข้อมูลเฉพาะและเมื่อเร็ว ๆ นี้ฉันพบซอฟต์แวร์ฟรีที่ดีสำหรับการตรวจจับค่าผิดปกติ: MOA ของ Weka! คุณเคยทดสอบมาก่อนหรือไม่ มันเป็นซอฟต์แวร์โอเพนซอร์ซฉันพยายามใช้มันเพื่อพัฒนาและรวมอัลกอริทึมความผิดปกติของการตรวจจับขนาดเล็กของฉัน
napsterockoeur

โอ้: FYI: ฉันกำลังจัดการข้อมูลสตรีมมิ่ง
napsterockoeur
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.