กำลังมองหาแพ็คเกจที่ดีสำหรับการตรวจจับความผิดปกติในอนุกรมเวลา


17

มีแพ็คเกจโอเพ่นซอร์สที่ครอบคลุม (โดยเฉพาะอย่างยิ่งใน python หรือ R) ที่สามารถใช้สำหรับการตรวจจับความผิดปกติในอนุกรมเวลาหรือไม่?

มีแพ็คเกจ SVM หนึ่งคลาสใน scikit-Learn แต่ไม่ใช่สำหรับข้อมูลอนุกรมเวลา ฉันกำลังมองหาแพ็คเกจที่มีความซับซ้อนมากขึ้นตัวอย่างเช่นใช้เครือข่ายแบบเบย์เพื่อตรวจจับสิ่งผิดปกติ


เราจำเป็นต้องเขียนหนึ่งพี่ชาย !! : P
Arpit Sisodia

คำตอบ:


19

ฉันรู้ว่าฉันช้าไปหน่อย แต่ก็มีแพ็คเกจสำหรับการตรวจจับความผิดปกติพร้อมกับเฟรมเวิร์กชุดค่าผสมที่ผิดปกติ

มันยังอยู่ในช่วงเริ่มต้นของการพัฒนาบน GitHub และจะเผยแพร่ใน JMLR ในไม่ช้า

แพ็คเกจเป็นภาษาไพ ธ อนและชื่อของแพ็คเกจคือpyod ( https://github.com/yzhao062/Pyod )

มันมีหลายอัลกอริทึมสำหรับวิธีการดังต่อไปนี้:

  1. รุ่นเชิงเส้นสำหรับการตรวจจับค่าผิดปกติ ( PCA, vMCD, vOne-Class และ SVM )
  2. แบบจำลองการตรวจหาค่าที่อยู่ใกล้เคียง ( LOF, CBLOF, HBOS, KNN, AverageKNN และ MedianKNN )
  3. แบบจำลองความน่าจะเป็นสำหรับการตรวจจับค่าผิดปกติ ( ABOD และ FastABOD )
  4. ตระการตาและกรอบการรวมกัน ( IsolationForest และ FeatureBagging )
  5. โครงข่ายประสาทและโมเดลการเรียนรู้ลึก ( เข้ารหัสอัตโนมัติพร้อมเครือข่ายประสาทที่เชื่อมต่ออย่างสมบูรณ์ )

ท้ายที่สุดหากคุณกำลังมองหาซีรีย์ตามเวลาที่เฉพาะเจาะจงลิงก์ gitub นี้จะมีประโยชน์

มีรายการแพ็กเกจต่อไปนี้สำหรับการตรวจหาค่าในชุดเวลา:

datastream.io

เส้นขอบฟ้า

banpei

AnomalyDetection


วิธีใดบ้างที่จะทำงานกับความผิดปกติตามบริบท
Arpit Sisodia

คุณกำลังพูดถึงการตรวจจับความผิดปกติหรือการตรวจจับที่ผิดปกติ? มีความแตกต่าง
Arpit Sisodia

6

มีหลายวิธีในการจัดการความผิดปกติของอนุกรมเวลา -

1) หากทราบความผิดปกติให้สร้างแบบจำลองการจำแนกประเภท ใช้โมเดลนี้เพื่อตรวจจับความผิดปกติประเภทเดียวกันสำหรับข้อมูลอนุกรมเวลา

2) หากไม่ทราบความผิดปกติสิ่งที่เราทำในองค์กรของเรา - คือการรวมกันของการจัดกลุ่มและการจำแนก -

ใช้งานครั้งแรก LOF / K-mean / Cook's distance เพื่อระบุค่าผิดปกติ แปลงข้อมูลทั้งหมดเป็นปัญหาการจำแนกเนื่องจากเรามี 2 คลาสในขณะนี้ - ค่าผิดปกติและค่าปกติ ตอนนี้สร้างโมเดลการจัดประเภทและรับกฎ (โมเดลการจำแนก) เพื่อระบุความผิดปกติในเวลาทำงาน (ข้อมูลอนุกรมเวลา)

3) หากความผิดปกติไม่เป็นที่รู้จักในระหว่างการวิจัยของฉันวิธีที่พบมากที่สุดในการระบุความผิดปกติคือการสร้างแบบจำลองปกติและการเบี่ยงเบนใด ๆ จากแบบจำลองปกติ (ข้อผิดพลาด) ผิดปกติดังนั้นในกรณีที่คุณคาดการณ์อนุกรมเวลาสำหรับชั่วโมงถัดไป ด้วยค่าจริง หากเกิดข้อผิดพลาดมากกว่าที่คาดหมายจะมีบางสิ่งผิดปกติเกิดขึ้น

ฉันไม่สามารถค้นหาแพ็คเกจโดยตรงใน python หรือ R ได้เนื่องจากไม่มีใครรู้ว่ามีอะไรผิดปกติจริงๆ: P ในทุกกรณีที่เกี่ยวข้องกับการตรวจจับนอกขอบเขต

ลิงค์ที่มีประโยชน์บางอย่าง

https://machinelearningstories.blogspot.com/2018/12/easiest-way-of-detection-abnormality.html

https://machinelearningstories.blogspot.com/2018/07/anomaly-detection-anomaly-detection-by.html


2

ลองใช้ห้องสมุดศาสดา

ศาสดาเป็นกระบวนการในการพยากรณ์ข้อมูลอนุกรมเวลาตามแบบจำลองการเติมซึ่งแนวโน้มที่ไม่เป็นเชิงเส้นเหมาะสมกับฤดูกาลรายสัปดาห์รายสัปดาห์และรายวันรวมถึงเอฟเฟกต์วันหยุด ทำงานได้ดีที่สุดกับอนุกรมเวลาที่มีเอฟเฟกต์ตามฤดูกาลที่รุนแรงและข้อมูลทางประวัติศาสตร์หลายฤดูกาล ท่านศาสดาพยากรณ์มีความแข็งแกร่งต่อข้อมูลที่หายไปและการเปลี่ยนแปลงในแนวโน้ม

เพิ่มเติมที่: การตรวจจับความผิดปกติในอนุกรมเวลาด้วย Library Prophet

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.