ปรับการเติบโตตามฤดูกาลในแต่ละเดือนโดยอิงตามฤดูกาลรายสัปดาห์


9

เป็นงานอดิเรกด้านฉันได้รับการสำรวจชุดเวลาการพยากรณ์ (โดยเฉพาะอย่างยิ่งการใช้ R)

สำหรับข้อมูลของฉันฉันมีจำนวนการเข้าชมต่อวันสำหรับทุกวันย้อนกลับไปเกือบ 4 ปี ในข้อมูลนี้มีรูปแบบที่แตกต่างกัน:

  1. วันจันทร์ถึงวันศุกร์มีการเข้าชมจำนวนมาก (สูงสุดในวันจันทร์ / อังคาร) แต่มีน้อยกว่าในวันเสาร์ - อาทิตย์
  2. บางครั้งของปีลดลง (เช่นการเข้าชมน้อยกว่ามากในช่วงวันหยุดของสหรัฐอเมริกาในช่วงฤดูร้อนแสดงการเติบโตน้อยลง)
  3. การเติบโตที่สำคัญปีต่อปี

มันเป็นเรื่องดีที่จะสามารถคาดการณ์ปีที่จะมาถึงของข้อมูลนี้และใช้เพื่อปรับปรุงการเติบโตแบบเดือนต่อเดือน สิ่งสำคัญที่ทำให้ฉันมีมุมมองรายเดือนคือ:

  • บางเดือนจะมีจันทร์ / อังคารมากกว่าเดือนอื่น ๆ (ซึ่งไม่สอดคล้องกันในช่วงหลายปีที่ผ่านมา) ดังนั้นเดือนที่เกิดขึ้นกับวันธรรมดาจะต้องมีการปรับตาม

การสำรวจสัปดาห์ก็ดูเหมือนยากเนื่องจากระบบการกำหนดหมายเลขสัปดาห์เปลี่ยนจาก 52-53 ขึ้นอยู่กับปีและดูเหมือนว่าtsจะไม่จัดการเรื่องนั้น

ฉันไตร่ตรองโดยเฉลี่ยในวันธรรมดาของเดือน แต่หน่วยผลลัพธ์นั้นค่อนข้างแปลก (การเติบโตในอัตราเฉลี่ยการเข้าชมวันทำงาน) และนั่นจะเป็นการทิ้งข้อมูลที่ถูกต้อง

ฉันรู้สึกว่าข้อมูลประเภทนี้จะเป็นเรื่องธรรมดาในอนุกรมเวลา (เช่นการใช้ไฟฟ้าในอาคารสำนักงานอาจเป็นแบบนี้) ทุกคนมีคำแนะนำเกี่ยวกับวิธีการสร้างแบบจำลองโดยเฉพาะใน R?

ข้อมูลที่ฉันทำงานด้วยนั้นค่อนข้างตรงไปตรงมามันเริ่มต้นจาก:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

และยังคงเป็นเช่นนี้จนถึงปัจจุบันโดยมีแนวโน้มการเติบโตโดยรวมลดลงบางช่วงสัปดาห์หยุดวันหยุดของสหรัฐอเมริกาและการเจริญเติบโตโดยทั่วไปชะลอตัวในช่วงฤดูร้อน


อีกแง่มุมที่น่าสนใจของข้อมูลคือมีเหตุการณ์ฉับพลันที่ขัดขวางแนวโน้มการเติบโตโดยรวมภายในระยะเวลา ~ สองเดือน ถึงแม้ว่าตอนนี้ฉันอยู่ในช่วงที่พยายามกำหนดฤดูกาลอย่างเหมาะสมฉันก็ไม่สนใจเรื่องนั้น
Kyle Brandt

และแก้ไขให้ถูกต้องหากฉันไม่ได้ใช้ "ฤดูกาล" อย่างถูกต้อง ฉันกำลังคิดว่ามันเป็นลายในหน่วยเวลาที่ฉันพูด ดังนั้น "ฤดูกาลรายสัปดาห์" สำหรับฉันหมายถึง "รูปแบบที่ซ้ำทุกสัปดาห์"
Kyle Brandt

อืมฟังดูคุ้น ๆ (-;

ดูคำตอบstats.stackexchange.com/questions/14742/... อาจเป็นจุดเริ่มต้น
Peter Ellis

อาจเป็นหัวใจของการรวมกันของสัปดาห์ + ปี? ดูเหมือนว่าts(และยังmsts) ไม่พอดีกับช่วงเวลาการสุ่มตัวอย่างของสัปดาห์ด้วยช่วงเวลาที่ "เป็นธรรมชาติ" ของปี หรือผมก็ไม่เข้าใจวิธีการที่จะทำให้การทำงานที่ ...
ไคล์ Brandt

คำตอบ:


5

ฉันสร้างแบบจำลองของข้อมูลตลอดเวลา คุณต้องรวม

  • วันของสัปดาห์
  • เอฟเฟกต์วันหยุด (เอฟเฟกต์นำ, เกิดขึ้นพร้อมกันและล้าหลัง)
  • วันพิเศษของเดือน
  • อาจเป็นวันศุกร์ก่อนวันหยุดหรือวันจันทร์หลังจากวันหยุด
  • ผลกระทบรายสัปดาห์
  • ผลกระทบรายเดือน
  • โครงสร้าง ARIMA เพื่อแสดงข้อผิดพลาดเสียงสีขาว
  • et.al. .

วิธีการทางสถิติเรียกว่าการถ่ายโอนฟังก์ชันการสร้างแบบจำลองด้วยการแทรกแซง หากคุณต้องการแบ่งปันข้อมูลของคุณเป็นการส่วนตัวผ่าน dave@autobox.com หรือโดยเฉพาะอย่างยิ่งผ่านทาง SE ฉันยินดีที่จะแสดงให้คุณเห็นถึงข้อมูลเฉพาะของรุ่นสุดท้ายและช่วยให้คุณสามารถทำด้วยตัวเองหรืออย่างน้อยก็ช่วยคุณได้ และคนอื่น ๆ เพื่อเข้าใจสิ่งที่ต้องทำและสิ่งที่สามารถทำได้ ไม่ว่าในกรณีใดคุณออกมาอย่างชาญฉลาดโดยไม่ต้องใช้สมบัติใด ๆ ไม่ว่าจะเป็นเหรียญหรือเวลาคุณอาจอ่านคำตอบอื่น ๆ ของคำถามอนุกรมเวลาเพื่อเรียนรู้เพิ่มเติม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.