ฉันใช้ชุดข้อมูลการขายรายวันที่มีจุดข้อมูลรายวันประมาณ 2 ปี จากบทเรียนออนไลน์ / ตัวอย่างบางส่วนฉันพยายามระบุฤดูกาลในข้อมูล ดูเหมือนว่ามีรายสัปดาห์รายเดือนและอาจเป็นระยะ / ปีตามฤดูกาล
ตัวอย่างเช่นมีวันจ่ายเงินโดยเฉพาะอย่างยิ่งในวันที่ 1 ของเดือนที่มีผลในสองสามวันในช่วงสัปดาห์ นอกจากนี้ยังมีเอฟเฟกต์วันหยุดบางอย่างซึ่งสามารถระบุได้อย่างชัดเจนโดยสังเกตจากการสังเกต
เมื่อติดตั้งกับข้อสังเกตเหล่านี้ฉันได้ลองทำสิ่งต่อไปนี้:
ARIMA (พร้อม
Arima
และauto.arima
จากแพคเกจ R- คาดการณ์) โดยใช้ regressor (และค่าเริ่มต้นอื่น ๆ ที่จำเป็นในการทำงาน) regressor ที่ฉันสร้างนั้นเป็นเมทริกซ์ที่มีค่า 0/1:- ตัวแปร 11 เดือน (n-1)
- 12 ตัวแปรวันหยุด
- ไม่สามารถหาส่วนของวันจ่ายเงินได้ ... เนื่องจากมันมีผลกระทบที่ซับซ้อนกว่าที่ฉันคิดเล็กน้อย เอฟเฟกต์ payday ทำงานแตกต่างกันไปขึ้นอยู่กับวันทำงานของวันที่ 1 ของเดือน
ฉันใช้ 7 (เช่นความถี่รายสัปดาห์) เพื่อทำโมเดลอนุกรมเวลา ฉันลองทดสอบ - คาดการณ์ครั้งละ 7 วัน ผลลัพธ์มีความสมเหตุสมผล: ความแม่นยำโดยเฉลี่ยสำหรับการคาดการณ์ 11 สัปดาห์มาถึงค่าเฉลี่ยรายสัปดาห์ RMSE ถึง 5%
รุ่น TBATS (จากแพ็คเกจ R- คาดการณ์) - ใช้หลายฤดูกาล (7, 30.4375, 365.25) และเห็นได้ชัดว่าไม่มีการถดถอย ความแม่นยำนั้นดีกว่าแบบจำลอง ARIMA อย่างน่าประหลาดใจโดยเฉลี่ยต่อสัปดาห์ RMSE 3.5%
ในกรณีนี้รูปแบบที่ไม่มีข้อผิดพลาด ARMA จะทำงานได้ดีขึ้นเล็กน้อย ตอนนี้ถ้าฉันใช้ค่าสัมประสิทธิ์สำหรับเพียงเอฟเฟกต์วันหยุดจากแบบจำลอง ARIMA ที่อธิบายไว้ใน # 1 กับผลลัพธ์ของแบบจำลอง TBATS avg รายสัปดาห์เฉลี่ย RMSE เพิ่มขึ้นเป็น 2.95%
ตอนนี้โดยไม่ต้องมีพื้นฐานหรือความรู้มากมายเกี่ยวกับทฤษฎีพื้นฐานของแบบจำลองเหล่านี้ฉันอยู่ในภาวะที่กลืนไม่เข้าคายไม่ออกว่าวิธีการของ TBATS นี้เป็นวิธีที่ถูกต้องหรือไม่ แม้ว่ามันจะปรับปรุง RMSE อย่างมีนัยสำคัญในการทดสอบ 11 สัปดาห์ฉันสงสัยว่ามันสามารถรักษาความแม่นยำนี้ในอนาคตได้หรือไม่ หรือแม้ว่าการใช้เอฟเฟ็กต์วันหยุดจาก ARIMA กับผลลัพธ์ TBATS นั้นสมเหตุสมผล ความคิดใด ๆ จาก / ผู้มีส่วนร่วมทั้งหมดจะได้รับการชื่นชมอย่างมาก
หมายเหตุ: ทำ "บันทึกลิงก์เป็น" เพื่อดาวน์โหลดไฟล์