วิธีการบัญชีสำหรับผลกระทบของวันหยุดในการคาดการณ์


12

ฉันมีซีรีย์เวลารายวันที่สามารถคาดการณ์ได้ค่อนข้างมีฤดูกาลทุกสัปดาห์ ฉันสามารถหาคำทำนายที่ค่อนข้างแม่นยำ (ยืนยันโดยการตรวจสอบข้าม) เมื่อไม่มีวันหยุด อย่างไรก็ตามเมื่อมีวันหยุดฉันมีปัญหาดังต่อไปนี้:

  1. ฉันได้รับตัวเลขที่ไม่เป็นศูนย์สำหรับวันหยุดในการคาดการณ์ของฉันแม้ว่าวันหยุดประวัติศาสตร์ทั้งหมดจะเป็น 0 นี่ไม่ใช่ประเด็นหลักจริงๆ ปัญหาคือ ...
  2. เนื่องจากการประมวลผลที่ไม่ได้เกิดขึ้นในวันหยุด "หกล้นเกิน" ไปจนถึงวันถัดจากวันหยุดตัวแปรดัมมี่ที่เรียบง่ายไม่ได้ตัดมันเนื่องจากค่าผิดปกติเหล่านี้ดูเหมือนจะเป็นนวัตกรรมระยะสั้น หากไม่มีฤดูกาลประจำสัปดาห์ฉันอาจจะเกิดขึ้นกับการประมาณการสำหรับการกระจายข้อมูลที่ไม่ได้ประมวลผลในวันหยุดในช่วงห้าวันหรือมากกว่านั้นหลังจากวันหยุด (ดังที่แนะนำในวิธีทำคุณสร้างตัวแปรที่สะท้อนถึงโอกาสในการขาย ผลกระทบของปฏิทินในการวิเคราะห์อนุกรมเวลา? ) อย่างไรก็ตามการกระจายของ "การรั่วไหล" ขึ้นอยู่กับวันของสัปดาห์ที่เกิดขึ้นและไม่ว่าวันหยุดจะเป็นวันคริสต์มาสหรือวันขอบคุณพระเจ้าซึ่งคำสั่งซื้อจะถูกวางในอัตราที่ต่ำกว่าช่วงที่เหลือของปี

ต่อไปนี้เป็นภาพรวมบางส่วนจากการตรวจสอบความถูกต้องไขว้ของฉันซึ่งแสดงผลลัพธ์ (สีน้ำเงิน) ที่คาดการณ์ไว้กับผลลัพธ์ที่แท้จริง (สีแดง) สำหรับวันหยุดที่ปรากฏในวันที่แตกต่างกันของสัปดาห์:

ป้อนคำอธิบายรูปภาพที่นี่

ฉันยังกังวลว่าผลกระทบของคริสต์มาสจะขึ้นอยู่กับวันในสัปดาห์และฉันมีข้อมูลประวัติศาสตร์เพียงหกปีหรือมากกว่านั้น

ไม่มีใครมีข้อเสนอแนะใด ๆ เกี่ยวกับวิธีจัดการกับค่าผิดปกติเชิงนวัตกรรมประเภทนี้ในบริบทของการพยากรณ์หรือไม่? (น่าเสียดายที่ฉันไม่สามารถแชร์ข้อมูลใด ๆ ได้)


1
ฉันก็ค่อนข้างสนใจในเรื่องนี้เช่นกัน
EngrStudent

2
หากคุณไม่สามารถโพสต์ข้อมูลของคุณได้คุณอาจโพสต์ข้อมูลที่คล้ายคลึงกับข้อมูลของคุณหรือไม่ ในหลายกรณีสิ่งนี้จะอำนวยความสะดวกในการตอบที่เกี่ยวข้องมากขึ้น
ทิม

1
ปรับขนาดข้อมูล โมเดลจะเหมือนกัน (เพิ่งปรับสัดส่วน) คุณสามารถ rescale การคาดการณ์กลับสู่การวัดเดิมของคุณ
Tom Reilly

คำตอบ:


1

คุณไม่สามารถสร้างตัวแปรจำลองสำหรับวันหยุดหนึ่งตัวสำหรับวันหยุด + 1 และอีกหนึ่งสำหรับวันหยุด + 2 และตั้งให้เป็น 1 ตราบใดที่พวกเขาตกในวันธรรมดา

สำหรับวันขอบคุณพระเจ้าและวันคริสต์มาสการแนะนำตัวแปรจำลองที่แยกต่างหากสำหรับวันหยุดเหล่านี้น่าจะเป็นตัวเลือกที่แย่ที่สุดของคุณ (เนื่องจากคุณมีข้อมูลเพียงหกปี) ในระดับหนึ่งนั่นอาจเป็นทางเลือกเพียงอย่างเดียวของคุณ - ผู้คนเพียงแค่ทำตัวแตกต่างกันในวันหยุดเหล่านั้นมากกว่าที่พวกเขาพูดกันในวันที่สี่ของเดือนกรกฎาคม (และถ้าคุณกำลังศึกษาเช่นรูปแบบการขายปลีก เป็นวันหยุด "พิเศษ" และแน่นอนต้องการวิเคราะห์แยกต่างหาก) อย่างไรก็ตามแนวคิดด้านล่างอาจเป็นประโยชน์กับคุณ:

  • วันขอบคุณพระเจ้า. ความจริงที่ว่ามันไม่ตรงกับวันเดียวกันของสัปดาห์ (วันพฤหัสบดี) ทำให้มันง่ายขึ้นหรือไม่? นั่นคือหุ่นจำลองวันขอบคุณพระเจ้าอาจใช้งานได้แม้ในชุดข้อมูลหกปีเพราะรูปแบบวันทำงานจะเหมือนเดิมเสมอ
  • คริสต์มาส. ดูเหมือนว่าฉันจะดูกราฟของคุณว่าปัญหาหลักคือผลกระทบนั้นจะยาวนานกว่าวันหยุดอื่น ๆ - ถ้าคุณกำหนด "คริสต์มาส" เป็นวันคริสต์มาสอีฟ (24 ธ.ค. ) นั่นจะเป็นเพราะหลายคนจะอยู่บ้านด้วยกัน วันคริสต์มาส (25 ธันวาคม) (และแม้กระทั่งวันบ็อกซิ่งเดย์ (26 ธันวาคม) ในบางแห่ง) ฉันจะคิดเพิ่มเติมเกี่ยวกับเรื่องนี้

ฉันหวังว่านี่จะช่วยได้.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.