การเข้ารหัสวันที่ / เวลา (ข้อมูลรอบ) สำหรับเครือข่ายประสาท


12

วิธีเข้ารหัสวันที่และเวลาของเหตุการณ์สำหรับเครือข่ายประสาทเทียม

ฉันไม่มีอนุกรมเวลาต่อเนื่อง แต่มีบางเหตุการณ์ที่มีวันที่และเวลาและฉันวิเคราะห์ความสนใจบางอย่าง ความสนใจนี้แตกต่างกันระหว่างเช้าและเย็นและแตกต่างระหว่างวันธรรมดาและระหว่างฤดูร้อนและฤดูหนาวและก่อนคริสต์มาสและอีสเตอร์เป็นต้น และเหตุการณ์ต่าง ๆ ก็มีการกระจายตัวที่ไม่สม่ำเสมอตลอดเวลา (มากกว่าในตอนกลางคืนมากกว่ากลางคืนในบางประเภทในช่วงสัปดาห์

ฉันพยายามเข้ารหัสเป็นจำนวนสัปดาห์ในปีเช่นวันธรรมดา 1-7 และชั่วโมงของวัน แต่การเล่นโดยใช้ตัวกระจายสัญญาณอัตโนมัติทำให้ฉันรู้สึกว่าข้อมูลของฉันไม่สมเหตุสมผลกับเครือข่ายประสาทเทียมมันไม่สามารถทำซ้ำสิ่งใดก็ได้ที่อยู่ใกล้กับอินพุตแม้จะมีเลเยอร์ที่ซ่อนอยู่ขนาดใหญ่ ไม่ว่าจะเป็น categorial 0-1 หรือเป็นค่าปกติ

แต่การค้นหาการเข้ารหัสเวลาสำหรับเครือข่ายประสาทส่วนใหญ่จะให้ข้อมูลเกี่ยวกับอนุกรมเวลาดังนั้นฉันจึงปิดตาเล็กน้อย แต่มองหาต้นไม้

แน่นอนฉันสามารถดูข้อมูลและจัดหมวดหมู่คร่าวๆได้ไม่มากก็น้อย แต่แนวคิดของการเรียนรู้อย่างลึกซึ้งดูเหมือนว่าจะแยกการสกัดคุณลักษณะด้วยมือที่สร้างขึ้นด้วยมือทั้งหมด และการจัดหมวดหมู่จะแทรกการกระโดดครั้งใหญ่ในตัวแปรอินพุตต่อเนื่องตามธรรมชาติ

"การเข้ารหัสตามธรรมชาติ" ในสมองของฉันเป็นเหมือนสมาชิกฟัซซี่ในบางประเภทเช่น "กลางคืน", "เช้า", "วันธรรมดา" เป็นต้น

เพื่อทำให้สิ่งทั้งหมดน่าสนใจยิ่งขึ้นนอกจากนี้ตัวแปรที่ขึ้นอยู่กับยังประกอบด้วยข้อมูลวันที่ / เวลา แต่นั่นเป็นคำถามที่แตกต่าง

แก้ไข: อย่างใดที่เกี่ยวข้องกับชนิดของข้อมูลเป็นคำถามล่าสุดเช่น

การทดสอบทางสถิติใดที่เหมาะสมกับชุดข้อมูลเวลานี้

คำตอบ:


7

ฉันกำลังมองหาคำตอบของปัญหาที่คล้ายกันและสะดุดในหัวข้อนี้ แนวคิดการเข้ารหัสแบบไซน์ถูกสำรวจในบล็อกโพสต์นี้:

การเข้ารหัสคุณสมบัติต่อเนื่องของวัฏจักร - เวลา 24 ชั่วโมง

คำตอบของเอียนตอบสนองความต้องการของฉันได้อย่างเต็มที่ดังนั้นฉันจึงคิดถึงการโพสต์ไว้ที่นี่เพื่อความทรงจำในอนาคต


ฉันสงสัยว่าจะสามารถใช้stackoverflow.com/questions/59653862/นี้ได้อย่างไร- พิเศษเมื่อเวลามีฟีเจอร์
user4581

1

คุณสามารถลองแทนเวลาเป็นเมทริกซ์ขนาดใหญ่เช่น 365 คูณ 24 เพื่อเป็นตัวแทนวันของปีและชั่วโมงของวันและจากนั้น "ปลด" สิ่งนี้ลงในเวกเตอร์ 1 คูณ 8760 เวลาจะสอดคล้องกับตำแหน่งภายในเวกเตอร์นี้และค่าที่ตำแหน่งนี้คือค่าในเวลานั้น


2
คุณลองและประสบความสำเร็จกับการเข้ารหัสเช่นนั้นหรือไม่? ฉันจะแปลกใจถ้า Neural Net จะ "เรียนรู้" ตำแหน่งที่แน่นอนของเช้าวันอาทิตย์ในการเข้ารหัสนี้ แต่การแปลกใจที่ไร้เดียงสาเป็นหนึ่งในจุดแข็งของอวนประสาทดังนั้นฉันจะไม่เดิมพันกับสก๊อตของฉัน ;-)
flaschenpost

สิ่งนี้อาจมีประโยชน์หากคุณต้องการตรวจสอบเหตุการณ์ที่เกิดขึ้นตามรอบในเวลาเดียวกันในหลาย ๆ ปี แต่สำหรับฉันแล้วความสัมพันธ์จะอ่อนแอมาก ฉันสามารถดูความเป็นไปได้ที่สูงขึ้นของความสัมพันธ์ระหว่างชั่วโมงเดียวกันในแต่ละสัปดาห์หรือชั่วโมงเดียวกันในแต่ละวันสำหรับข้อมูลอนุกรมเวลาส่วนใหญ่
thekingoftruth

1

ฉันขอแนะนำให้สร้างคุณลักษณะการป้อนข้อมูลหลายอย่างจากอนุกรมเวลาโดยใช้ความสัมพันธ์ที่คุณรู้จัก (หรือเชื่อว่า) มีอยู่แล้วในข้อมูล ตัวอย่างเช่นคุณระบุว่าผลลัพธ์เป้าหมายจะแตกต่างกัน:

ระหว่างตอนเช้าและตอนเย็นและแตกต่างระหว่างวันธรรมดาและระหว่างฤดูร้อนและฤดูหนาว ...

ดังนั้นทำไมไม่สร้างชุดของคุณสมบัติที่อธิบายแต่ละ 'รอบ' เหล่านี้ สิ่งนี้อาจช่วยในการหยอกล้อทั้งไมโครและมาโครแทนที่จะใช้ฟีเจอร์เดียวที่อธิบายทั้งหมด

ตัวอย่างเช่น...

หากคุณมีแนวโน้มที่บางสิ่งที่น่าสนใจเกิดขึ้นประมาณเที่ยงวันในแต่ละวันให้สร้างฟีเจอร์จากที่อธิบายชั่วโมงในแต่ละวัน ตอนนี้เครือข่ายจะเรียนรู้ที่จะทริกเกอร์ที่ประมาณ 12 เปรียบเทียบกับกรณีที่คุณมีข้อมูลเดียวกันนี้เข้ารหัสเป็นชั่วโมงในสัปดาห์1..168ตอนนี้เครือข่ายต้องลองเรียนรู้ที่จะเรียกใช้ซึ่งมีความซับซ้อนมากขึ้น1..168 12 , 36 , 60 ...1..241..16812,36,60...


ใช่นี่เป็นความคิดแรกของฉันด้วย แต่แนวคิดเวลาวงกลม (23:59 ตามด้วย 00:00) จะถูกซ่อนไว้และอีกสิ่งหนึ่งที่ทำให้ฉันรำคาญคือการกระโดดระหว่างตัวเลขทั้งหมดที่ดูเหมือน - เหตุการณ์ที่ 09:55 คล้ายกับ 10:05 แต่ในตอนเช้า 06:10 แตกต่างจากตอนกลางคืน 06:55 ฉันจินตนาการถึงการค้นหาศูนย์กลางของเวลา (เลนส์หรือสิ่งที่คล้ายกัน) แล้ววัดและให้ระยะทางกับศูนย์เหล่านั้น ดังนั้น 04:30 น. เป็นคืนที่ลึกที่สุดในขณะที่ 05:30 "มากกว่าทุกเช้า" แต่ไม่เหมือนตอนเย็น
flaschenpost

1
ในกรณีนี้คุณสามารถลองเข้ารหัสเป็นไซน์หรือโคไซน์หรือในความเป็นจริงทั้งคู่
CatsLoveJazz
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.