ฉันไม่รู้ว่านี่เป็นวิธีปฏิบัติทั่วไป / ดีที่สุด แต่เป็นอีกมุมมองหนึ่งของเรื่องนี้
หากคุณมีวันที่คุณสามารถใช้แต่ละฟิลด์เป็น "ตัวแปรหมวดหมู่" แทน "ตัวแปรต่อเนื่อง" วันจะมีค่าในชุด {1, 2 ... , 31}, เดือนจะมีค่าเป็น {1, ... , 12} และสำหรับปีนี้คุณเลือกค่าต่ำสุดและค่าสูงสุด และสร้างชุด
จากนั้นเนื่องจากค่าตัวเลขเฉพาะของวันเดือนและปีอาจไม่เป็นประโยชน์สำหรับการค้นหาแนวโน้มในข้อมูลให้ใช้การแทนแบบไบนารี่เพื่อเข้ารหัสค่าตัวเลขเนื่องจากคุณลักษณะแต่ละบิตเป็นบิต ตัวอย่างเช่นเดือน 5 จะเป็น0 0 0 0 1 0 0 0 0 0 0 0
(11 0's 1 ในตำแหน่งที่ 5 แต่ละบิตเป็นคุณลักษณะ)
เช่นมี 10 ปีใน "ชุดปี" วันที่จะถูกแปลงเป็นเวกเตอร์ของ 43 คุณสมบัติ (= 31 + 12 + 10) การใช้ "sparse vector" จำนวนของคุณสมบัติไม่น่าจะมีปัญหา
สิ่งที่คล้ายกันสามารถทำได้สำหรับข้อมูลเวลาวันของสัปดาห์วันของเดือน ...
ทุกอย่างขึ้นอยู่กับคำถามที่คุณต้องการให้แบบจำลองการเรียนรู้ของเครื่องตอบคำถาม