ฉันต้องการใช้ข้อมูลที่ไม่ใช่ปรมาณูเป็นคุณลักษณะสำหรับการคาดการณ์ สมมติว่าฉันมีตารางที่มีคุณสมบัติเหล่านี้:
- Column 1: Categorical - House
- Column 2: Numerical - 23.22
- Column 3: A Vector - [ 12, 22, 32 ]
- Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ]
- Column 5: A List [ 122, Boolean ]
ฉันต้องการทำนาย / จำแนกตัวอย่างเช่นคอลัมน์ 2
ฉันกำลังทำบางสิ่งบางอย่างเพื่อตอบคำถามโดยอัตโนมัติคำถามประเภทใด ๆ เช่น "Where is Foo Born" ...
ฉันสร้างเคียวรีให้กับเครื่องมือค้นหาก่อนแล้วจึงได้รับข้อมูลตัวอักษรจากนั้นฉันทำการแยกวิเคราะห์ข้อมูลทั้งหมด (การติดแท็กการกั้นการแยกวิเคราะห์การแยก ... )
วิธีแรกของฉันคือการสร้างตารางแต่ละแถวที่มีบรรทัดข้อความและคุณลักษณะมากมายเช่น "First Word", "Tag of First Word", "Chunks" ฯลฯ ...
แต่ด้วยวิธีนี้ฉันขาดความสัมพันธ์ระหว่างประโยค
ฉันอยากจะรู้ว่ามีอัลกอริทึมที่มองเห็นภายในโครงสร้างต้นไม้ (หรือเวกเตอร์) และทำให้ความสัมพันธ์และแยกสิ่งที่เกี่ยวข้องกับการทำนาย / การจำแนก ฉันต้องการทราบเกี่ยวกับห้องสมุดที่ทำสิ่งนั้นมากกว่าอัลกอริทึมที่ฉันต้องใช้