ฉันกำลังพิจารณาสองกลยุทธ์ในการทำ "การเพิ่มข้อมูล" ในการพยากรณ์อนุกรมเวลา
ครั้งแรกพื้นหลังเล็กน้อย ตัวทำนายเพื่อคาดการณ์ขั้นตอนถัดไปของอนุกรมเวลาเป็นฟังก์ชันที่โดยทั่วไปจะขึ้นอยู่กับสองสิ่งคือสถานะของอนุกรมเวลาที่ผ่านมา แต่ยังรวมถึงรัฐในอดีตของผู้ทำนายด้วย:
หากเราต้องการปรับ / ฝึกอบรมระบบของเราเพื่อให้ได้ที่ดีเราจะต้องมีข้อมูลที่เพียงพอ บางครั้งข้อมูลที่มีอยู่อาจไม่เพียงพอดังนั้นเราจึงพิจารณาเพิ่มข้อมูล
วิธีแรก
สมมติว่าเรามีชุดเวลากับ n และสมมติว่าเรามีที่ตรงตามเงื่อนไขต่อไปนี้: }
เราสามารถสร้างอนุกรมเวลาใหม่โดยที่เป็นการรับรู้ของการแจกแจง )
จากนั้นแทนการลดการสูญเสียหน้าที่เพียงกว่าเราทำอย่างนั้นได้ยังมากกว่า } ดังนั้นหากกระบวนการปรับให้เหมาะสมใช้ขั้นตอนเราต้อง "เตรียมใช้งาน" ตัวทำนายครั้งและเราจะคำนวณสถานะภายในตัวทำนายประมาณ
แนวทางที่สอง
เราคำนวณเป็นมาก่อน แต่เราไม่ได้อัปเดตสถานะภายในทำนายโดยใช้แต่ } เราใช้ทั้งสองซีรีส์เท่านั้นในเวลาที่คำนวณฟังก์ชั่นการสูญเสียดังนั้นเราจะคำนวณสถานะภายในของตัวทำนายประมาณ
แน่นอนว่ามีการคำนวณน้อยกว่า (แม้ว่าอัลกอริธึมจะไม่ค่อยน่าสนใจเท่าไหร่) แต่ตอนนี้ก็ไม่สำคัญ
มีข้อสงสัย
ปัญหาคือ: จากมุมมองทางสถิติซึ่งเป็นตัวเลือก "ดีที่สุด"? และทำไม?
สัญชาตญาณของฉันบอกฉันว่าอันแรกดีกว่าเพราะมันช่วย "ปรับ" น้ำหนักที่เกี่ยวข้องกับสถานะภายในในขณะที่อีกอันที่สองช่วยปรับน้ำหนักที่เกี่ยวข้องกับอดีตอนุกรมเวลาที่สังเกตได้
เสริม:
- มีแนวคิดอื่นใดที่ต้องเพิ่มข้อมูลสำหรับการพยากรณ์อนุกรมเวลาหรือไม่
- น้ำหนักของข้อมูลสังเคราะห์ในชุดฝึกอบรมเป็นอย่างไร?