@Irishstat ครอบคลุมถึงสิ่งที่ฉันกำลังจะพูด แต่ฉันจะตอบกลับด้วยประสบการณ์ส่วนตัวของฉันในการสร้างแบบจำลองข้อมูลเหล่านี้ด้วยการถดถอยอนุกรมเวลาและการถดถอย OLS
หากเป็นข้อมูลรายวันฉันจะทำสิ่งต่อไปนี้:
สร้างตัวแปรจำลองสำหรับฤดูกาลต่าง ๆ :
- หากต้องการจับภาพวันตามฤดูกาลให้สร้างตัวแปรจำลอง 6 ตัว
- หากต้องการจับภาพวันตามฤดูกาลให้สร้างตัวแปรจำลอง 30 ตัว
- หากต้องการจับภาพเดือนของปีให้สร้างตัวแปรจำลอง 11 ตัว
สร้างตัวแปรดัมมี่สำหรับตัวแปรเทรนด์:
เพิ่มตัวแปรอิสระตัวแปร
นี่เป็นข้อมูลอนุกรมเวลาดังนั้นควรระมัดระวังเกี่ยวกับผลกระทบของตะกั่วและความล่าช้าของ varibales อิสระ ตัวอย่างเช่นในตัวอย่างของคุณคุณพูดถึงการตั้งค่าสถานะการส่งเสริมการขายจุดราคาพวกเขาอาจไม่มีผลทันทีต่อการตอบสนองของคุณเช่นอาจมีความล่าช้าและผลกระทบที่เกิดจากการเน่า / ถาวร ตัวอย่างเช่นหากดำเนินการส่งเสริมการขายในวันนี้คุณอาจมียอดขายเพิ่มขึ้นในวันนี้ แต่ผลของการส่งเสริมการขายจะลดลงหลังจากไม่กี่วัน ไม่มีวิธีที่ง่ายในการสร้างแบบจำลองนี้โดยใช้การถดถอยแบบหลายครั้งคุณต้องการใช้แบบจำลองฟังก์ชั่นการถ่ายโอนซึ่งเป็น parsimonoius และสามารถจัดการกับชนิดตะกั่วและความล่าช้าได้ ดูตัวอย่างนี้ที่ฉันโพสต์ไว้ก่อนหน้านี้ซึ่งมีการแทรกแซง (ในจุดราคากรณีของคุณ) และมีการเพิ่มขึ้นอย่างฉับพลันตามด้วยผลกระทบเนื้อที่ ต้องบอกว่าถ้าคุณมีความรู้เบื้องต้นเกี่ยวกับผลกระทบของการรอคอยและการล่าช้าสร้างตัวแปรเพิ่มเติมในตัวแปรจำลองกรณีของคุณก่อนและหลังจุดราคาและ (ใช่ / ไม่ใช่) การเปลี่ยนแปลงการส่งเสริม
คุณจะต้องเพิ่มตัวแปรตัวบ่งชี้วันหยุดที่เคลื่อนไหวเช่น Irishstat ชี้ให้เห็นว่าคุณต้องการที่จะเพิ่มวันอีสเตอร์ / วันขอบคุณพระเจ้า (ในสหรัฐอเมริกา) ซึ่งกำลังย้ายวันหยุด วันหยุดที่มีวันที่ตายตัวจะได้รับการดูแลโดยอัตโนมัติหากคุณใช้รูปแบบการเข้ารหัสแบบหลอกเพื่อจับภาพฤดูกาล
นอกจากนี้คุณจะต้องระบุค่าผิดปกติเช่นสารเติมแต่ง / พัลส์ (เหตุการณ์ครั้งเดียว) หรือการเลื่อนระดับ (การเลื่อนอย่างถาวร) และเพิ่มพวกเขาเป็นผู้ถดถอย การระบุค่าผิดปกติในการถดถอยหลายครั้งสำหรับข้อมูลอนุกรมเวลาแทบเป็นไปไม่ได้ คุณจะต้องใช้วิธีการตรวจหาค่าล่วงเวลาอนุกรมเช่นขั้นตอนของ Tsayหรือขั้นตอนของChen และ Liuซึ่งรวมอยู่ในซอฟต์แวร์เช่น AUTOBOX, SPSS, SAS หรือtsoutlier
แพ็คเกจใน R
ปัญหาที่อาจเกิดขึ้น:
ต่อไปนี้เป็นปัญหาที่คุณจะพบถ้าคุณจำลองข้อมูลอนุกรมเวลาโดยใช้ OLS หลายการถดถอย
- ข้อผิดพลาดอาจเกี่ยวข้องอัตโนมัติ ดูเว็บไซต์ที่ดีและเว็บไซต์นี้อธิบายถึงปัญหานี้ วิธีหนึ่งในการหลีกเลี่ยงปัญหานี้คือการใช้วิธีGeneralized Squares (GLS)หรือARIMAXเทียบกับ OLS หลายการถดถอยซึ่งคุณสามารถแก้ไขความสัมพันธ์อัตโนมัติ
- แบบจำลอง OLS จะไม่เป็น parsimonoius คุณมีตัวแปรจำลองสำหรับฤดูกาล6+30+11=47
- ด้วยการใช้ตัวแปรดัมมี่คุณกำลังสมมติว่าฤดูกาลของคุณนั้นถูกกำหนดไว้แล้วนั่นคือมันจะไม่เปลี่ยนแปลงตลอดเวลา เนื่องจากคุณมีข้อมูลเพียง 3 ปีฉันจะไม่กังวลเกี่ยวกับมัน แต่ก็ยังคุ้มค่าที่จะวางแผนซีรีส์และดูว่าฤดูกาลไม่เปลี่ยนแปลงหรือไม่
และมีข้อเสียอีกหลายประการในการใช้การถดถอยหลายครั้ง หากการทำนายมีความสำคัญต่อคุณฉันก็จะเก็บข้อมูลอย่างน้อย 6 เดือนและทดสอบความสามารถในการทำนายของการถดถอยหลายครั้งของคุณ หากเป้าหมายหลักของคุณคือการอธิบายความสัมพันธ์ระหว่างตัวแปรอิสระฉันจะต้องระมัดระวังการใช้การถดถอยหลายครั้งและฉันจะใช้วิธีอนุกรมเวลาเช่น ARIMAX / GLS แทน
หากคุณสนใจคุณสามารถอ้างอิงข้อความที่ยอดเยี่ยมโดยPankratzสำหรับฟังก์ชั่นการถ่ายโอนและการสร้างแบบจำลองการถดถอยแบบไดนามิก สำหรับข้อมูลทั่วไปของการพยากรณ์อนุกรมเวลาโปรดดูที่Makridakis et al, นอกจากนี้ข้อความอ้างอิงที่ดีก็คือDieboldสำหรับการพยากรณ์และการพยากรณ์ตามอนุกรมเวลา