มีอัลกอริทึมการเรียนรู้ที่ไม่มีผู้ดูแลสำหรับข้อมูลที่มีการเรียงลำดับเวลาหรือไม่?


9

การสังเกตในข้อมูลของฉันแต่ละครั้งถูกรวบรวมด้วยความแตกต่าง 0.1 วินาที ฉันไม่ได้เรียกมันว่าอนุกรมเวลาเพราะมันไม่มีวันที่และเวลา ในตัวอย่างของอัลกอริทึมการจัดกลุ่ม (ฉันพบออนไลน์) และ PCA ข้อมูลตัวอย่างมีการสังเกต 1 ครั้งต่อเคสและไม่ได้กำหนดเวลา แต่ข้อมูลของฉันมีการสำรวจนับร้อยที่รวบรวมทุก ๆ 0.1 วินาทีต่อคันและมียานพาหนะมากมาย

หมายเหตุ: ฉันได้ถามคำถามนี้กับโควต้าด้วยเช่นกัน


1
โปรดทราบภาษา คำถามของคุณไม่ชัดเจนโดยสิ้นเชิง "ข้อมูลตัวอย่างมีการสังเกต 1 ครั้งต่อกรณีและไม่มีการจับเวลา" หมายความว่าอะไร
Kasra Manshaei

1
ฉันกำลังพูดถึงตัวอย่างที่พบในบทช่วยสอนออนไลน์ ข้อมูลตัวอย่างที่ใช้มีเพียง 1 การสังเกตต่อกรณี / รายบุคคล (เช่นลูกค้าประเทศ ฯลฯ ) และข้อมูลเหล่านั้นไม่ใช่อนุกรมเวลา
umair durrani

คำตอบ:


7

สิ่งที่คุณมีคือลำดับเหตุการณ์ตามเวลาดังนั้นอย่าลังเลที่จะเรียกมันว่าอนุกรมเวลา!

การจัดกลุ่มในอนุกรมเวลามีความหมายต่างกัน 2 ประการ:

  1. การแบ่งส่วนของอนุกรมเวลาคือคุณต้องการแบ่งกลุ่มอนุกรมเวลาเป็นช่วงเวลาที่แตกต่างกันตามความคล้ายคลึงภายใน
  2. การจัดกลุ่มอนุกรมเวลาคือคุณมีอนุกรมเวลาหลายชุดและคุณต้องการค้นหากลุ่มที่แตกต่างกันตามความคล้ายคลึงกันระหว่างกลุ่ม

ฉันถือว่าคุณหมายถึงคนที่สองและนี่คือคำแนะนำของฉัน:

คุณมียานพาหนะมากมายและการสังเกตต่อยานพาหนะเช่นคุณมียานพาหนะมากมาย ดังนั้นคุณมีเมทริกซ์หลายตัว (ยานพาหนะแต่ละตัวเป็นเมทริกซ์) และเมทริกซ์แต่ละตัวมีแถวNแถว (Nr ของการสังเกต) และคอลัมน์T (จุดเวลา) ข้อเสนอแนะหนึ่งข้ออาจใช้ PCA กับแต่ละเมทริกซ์เพื่อลดความสลัวและสังเกตข้อมูลในพื้นที่พีซีและดูว่ามีความสัมพันธ์ที่มีความหมายระหว่างการสังเกตที่แตกต่างกันภายในเมทริกซ์ (ยานพาหนะ)หรือไม่ จากนั้นคุณสามารถทำการสังเกตแต่ละครั้งสำหรับยานเกราะทุกคันและสร้างเมทริกซ์และใช้ PCA กับสิ่งนั้นเพื่อดูความสัมพันธ์ของการสังเกตเพียงครั้งเดียวระหว่างยานพาหนะต่าง ๆ

หากคุณไม่ได้มีค่าลบเมทริกซ์ตัวประกอบขอแนะนำสำหรับการลดขนาดของข้อมูลในแบบฟอร์มแมทริกซ์

ข้อเสนอแนะอีกข้อหนึ่งสามารถใส่เมทริกซ์ทั้งหมดไว้ด้านบนของกันและกันและสร้างเมตริกซ์N x M x Tโดยที่NคือจำนวนยานพาหนะMคือจำนวนการสังเกตและTเป็นลำดับเวลาและใช้Tensor Decompositionเพื่อดูความสัมพันธ์ทั่วโลก

แนวทางที่ดีในการจัดกลุ่มอนุกรมเวลาแสดงในบทความนี้ซึ่งการนำไปปฏิบัตินั้นเงียบไปข้างหน้า

ฉันหวังว่ามันจะช่วย!

โชคดี :)


แก้ไข

ดังที่คุณพูดถึงคุณหมายถึงการแบ่งส่วนอนุกรมเวลาฉันเพิ่มลงในคำตอบ

การแบ่งส่วนอนุกรมเวลาเป็นปัญหาการจัดกลุ่มเดียวที่มีความจริงในการประเมิน อันที่จริงคุณพิจารณาการกระจายการสร้างที่อยู่เบื้องหลังชุดเวลาและวิเคราะห์มันผมขอแนะนำนี้ , นี้ , นี้ , นี้ , นี้และนี้ว่าปัญหาของคุณได้รับการศึกษาอย่างทั่วถึง พิเศษล่าสุดและวิทยานิพนธ์ระดับปริญญาเอก

โชคดี!


1
ขอบคุณสำหรับคำตอบที่ดี อันที่จริงเป้าหมายของฉันคือทำ "การแบ่งส่วนของอนุกรมเวลา" สำหรับรถแต่ละคันในชุดข้อมูลของฉัน
umair durrani

1
ฉันกำลังศึกษาบทเรียนเกี่ยวกับการสลายตัวของอนุกรมเวลา ฉันพบว่ามีวิธีในการย่อยสลายพวกเขาเป็นแนวโน้มองค์ประกอบตามฤดูกาลและวงจร อนุกรมเวลาของฉันอย่างไรก็ตามเป็นเส้นทางการเคลื่อนที่ของยานพาหนะไม่กี่วินาที เป็นไปได้หรือไม่ที่จะแยกพวกมันออกเป็นส่วนประกอบของพฤติกรรมการขับขี่ที่แตกต่างกันไปตามแนวโน้มในการเร่งความเร็วความเร็วนำรถความเร็วและการเร่งความเร็วภายในเส้นทางที่สังเกตได้
umair durrani

2
อาจจะ! สำหรับสิ่งนี้ดีกว่าที่จะพิจารณาทั้ง "การย่อยสลาย" และ "การแบ่งส่วน" ตัวอย่างเช่นหากอนุกรมเวลาของคุณแสดงกลุ่มที่สำคัญในพื้นที่ PC คุณสามารถเชื่อมโยงพวกเขากับพฤติกรรมการขับขี่ การแบ่งส่วนก็เพื่อตรวจจับพฤติกรรมการขับขี่ที่แตกต่างกันภายในอนุกรมเวลา เรื่องสั้นที่สั้นคือคุณสามารถใช้การแบ่งส่วนสำหรับส่วนพฤติกรรมการขับขี่ที่แตกต่างกันสำหรับยานพาหนะคันเดียวและเทคนิคการสลายตัวสำหรับการตรวจสอบพฤติกรรมการขับขี่ทั่วโลกเหนือยานพาหนะทุกคัน
Kasra Manshaei
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.