ชุดข้อมูลของฉันประกอบด้วยลำดับเวกเตอร์ แต่ละเวกเตอร์มี 50 มิติของมูลค่าที่แท้จริง จำนวนเวกเตอร์ในลำดับอยู่ระหว่าง 3-5 ถึง 10-15 กล่าวอีกนัยหนึ่งความยาวของลำดับไม่คงที่
จำนวนเงินที่เหมาะสมของลำดับ (ไม่ใช่เวกเตอร์!) จะมีคำอธิบายประกอบพร้อมกับฉลากระดับ งานของฉันคือการเรียนรู้ลักษณนามที่กำหนดลำดับเวกเตอร์ฉลากคลาสสำหรับลำดับทั้งหมดถูกคำนวณ
ฉันไม่สามารถบอกลักษณะที่แน่นอนของข้อมูลได้ แต่ลักษณะของลำดับไม่ได้เป็นการชั่วคราว อย่างไรก็ตามเวกเตอร์ ไม่สามารถสลับกับเวกเตอร์ได้ โดยไม่ต้องเปลี่ยนฉลาก () กล่าวอีกนัยหนึ่งลำดับของเวกเตอร์นั้นสำคัญ ตัวเวกเตอร์นั้นเปรียบได้ตัวอย่างเช่นมันสมเหตุสมผลที่จะคำนวณผลิตภัณฑ์ดอทและใช้ค่าความคล้ายคลึงกันนี้
คำถามของฉันคืออะไรเครื่องมือ / อัลกอริทึมที่สามารถช่วยจำแนกข้อมูลดังกล่าวคืออะไร?
UPDATE: ข้อมูลมีคุณสมบัติเช่นนั้นเวกเตอร์หนึ่งหรือสองสามตัวมีอิทธิพลอย่างมากต่อเลเบลของคลาส
วิธีแก้ปัญหาที่เป็นไปได้: หลังจากการวิจัยบางอย่างดูเหมือนว่า Recurrent Neural Networks (RNN) จะพอดีกับใบเรียกเก็บเงินตามธรรมชาติ แนวคิดที่ครอบคลุมคือการเลือกขนาดบริบท, เชื่อมเวกเตอร์คำต่อกัน, ทำ maxing ร่วมกันและให้อาหารผ่าน NN คลาสสิก ที่ตำแหน่งหน้าต่างบริบทที่เป็นไปได้แต่ละประโยคในประโยคหนึ่งเวกเตอร์คุณลักษณะจะถูกสร้างขึ้น คุณลักษณะเวกเตอร์ขั้นสุดท้ายถูกสร้างขึ้นโดยใช้การรวมกำไรสูงสุดตัวอย่างเช่น backpropagation ทำเพื่อปรับพารามิเตอร์ของเครือข่าย ฉันได้รับผลลัพธ์ที่เป็นบวกแล้ว (ต้องมี GPU)