การพยากรณ์อนุกรมเวลาของ Arima (auto.arima) ที่มีตัวแปรที่แปลกประหลาดหลายตัวใน R


14

ฉันต้องการดำเนินการคาดการณ์ตามแบบอนุกรมเวลา ARIMA หลายรุ่นพร้อมกับตัวแปรที่แปลกประหลาดหลายตัว เนื่องจากฉันไม่ใช่ทักษะที่เกี่ยวข้องกับสถิติและ RI ที่ไม่ต้องการเก็บไว้เป็นเรื่องง่ายที่สุดเท่าที่จะทำได้ (การพยากรณ์แนวโน้ม 3 เดือนก็เพียงพอแล้ว)

ฉันมีอนุกรมเวลา 1 ชุดและอนุกรมเวลาตัวทำนาย 3-5 ชุดข้อมูลรายเดือนทั้งหมดไม่มีช่องว่าง "ขอบฟ้า" ในเวลาเดียวกัน

ฉันพบฟังก์ชัน auto.arima และถามตัวเองว่านี่จะเป็นวิธีการแก้ปัญหาที่เหมาะสมสำหรับปัญหาของฉันหรือไม่ ฉันมีราคาสินค้าโภคภัณฑ์ที่แตกต่างและราคาของผลิตภัณฑ์ที่ทำจากพวกเขา ข้อมูลดิบทั้งหมดไม่อยู่นิ่ง แต่ผ่านความแตกต่างในการสั่งซื้อครั้งแรกพวกเขาทั้งหมดกลายเป็นข้อมูลนิ่ง ADF, KPSS ระบุสิ่งนี้ (ซึ่งหมายความว่าฉันได้ทดสอบการรวมระบบแล้วใช่ไหม)

คำถามของฉันคือ: ฉันจะใช้สิ่งนี้กับฟังก์ชั่น auto.arima และ ARIMA เป็นวิธีการที่ถูกต้องได้อย่างไร? ppl บางคนแนะนำให้ฉันใช้ VAR แล้ว แต่เป็นไปได้ไหมกับ ARIMA ด้วย?

ตารางต่อไปนี้เป็นข้อมูลของฉัน ที่จริงแล้วชุดข้อมูลขึ้นไป 105 ข้อสังเกต แต่ 50 แรกจะทำ เทรนด์และฤดูกาลเป็นที่สนใจอย่างชัดเจนที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

ขอบคุณสำหรับคำแนะนำและความช่วยเหลือ! เฟรดริก


โปรดโพสต์ข้อมูลของคุณเพื่อให้สามารถดาวน์โหลดได้ ใช้ excel นี่อาจเป็นเพียงงานที่จะระบุซีรีย์อินพุตที่ไม่จำเป็น ฉันไม่คิดว่า VAR เป็นสิ่งที่จำเป็นหรือส่วนประกอบหลักการมีประโยชน์สำหรับปัญหานี้
IrishStat

คำตอบ:


10

ถ้า regressors ภายนอกของคุณเป็นสาเหตุของแต่ไม่ใช่วิธีอื่น ๆ และไม่ก่อให้เกิดกันและกัน ARIMA นั้นเหมาะสมอย่างแน่นอน VAR เหมาะสมถ้าชุดเวลาที่แตกต่างของคุณทั้งหมดขึ้นอยู่กับแต่ละอื่น ๆy

สำหรับauto.arima()การทำงานกับ regressors ภายนอกเก็บ regressors ของคุณให้เป็นเมทริกซ์Xที่คุณป้อนเข้าสู่พารามิเตอร์ของxreg auto.arima()(แน่นอนXต้องมีจำนวนแถวเท่ากันกับอนุกรมเวลาที่yคุณกำลังสร้างโมเดล)

สำหรับการคาดการณ์คุณจะต้องมีค่าในอนาคตของ regressors ของคุณซึ่งคุณจะป้อนเข้าสู่xregพารามิเตอร์ของforecastอีกครั้ง

หน้าความช่วยเหลืออยู่?auto.arimaและ?forecast.Arima(สังเกตเมืองหลวง - นี่ไม่ใช่การพิมพ์ผิดอย่าถามฉัน ... )


1
(+1) คุณสามารถอธิบายแนวคิดเกี่ยวกับความเป็นเหตุเป็นผลได้เล็กน้อยและจะทดสอบอย่างไร มันอาจจะเป็นประโยชน์สำหรับความครบถ้วนของคำตอบของคุณในขณะที่คุณพูดถึงว่าการตัดสินใจใช้ ARIMA นั้นถูกกำหนดโดยทิศทางของความเป็นเหตุเป็นผลระหว่างตัวแปร คุณตัวอย่างเช่นความคิดเกี่ยวกับการทดสอบเวรกรรมเกรนเจอร์หรือทดสอบ Hausman ? ขอบคุณ
javlacalle

3
@javlacalle: ฉันไม่ได้เป็นแฟนตัวยงของการทดสอบทางสถิติสำหรับเวรกรรม (ซึ่งการทดสอบ Granger เป็นที่รู้จักกันดีที่สุด) ฉันชอบที่จะตัดสินใจเกี่ยวกับ "สาเหตุที่เป็นไปได้" ตามเนื้อหาสาระ ตัวอย่างเช่นฉันจะไม่ใช้การทดสอบของเกรนเจอร์เพื่อประเมินว่าการลดราคาเพิ่มยอดขายซูเปอร์มาร์เก็ตหรือวิธีอื่น ๆ ไม่ว่าจะเป็นจีดีพีอัตราแลกเปลี่ยนและการสร้างงานเป็นสาเหตุร่วมกัน ในทั้งสองกรณีมีเรื่องที่ชัดเจนเพียงพอและการทดสอบตามทฤษฎีจะไม่สอนอะไรเราในขณะที่การทดสอบทฤษฎีที่ขัดแย้งจะทำให้สับสนเท่านั้น (และอาจไม่มากไปกว่าเสียงรบกวน)
Stephan Kolassa

1
... ฉันรู้ว่าฉันกำลังเปิดไฟลุกโชนด้วยความคิดเห็นสุดท้ายของฉัน ;-)
Stephan Kolassa

@ Stephan: ขอบคุณสำหรับการป้อนข้อมูลของคุณ ถึงแม้ว่า y ของฉันคือ definitley ที่เกิดจาก regressors ของฉันและไม่ใช่วิธีอื่น แต่ regressors ของฉันมีความสัมพันธ์กันอย่างชัดเจนและควรมีผลกระทบโดยตรงมากขึ้นหรือน้อยลง ตามความคิดเห็นของคุณหมายความว่าฉันควรใช้ VAR แทน arima เนื่องจากจะหลีกเลี่ยงปัญหา (?) ฉันใช้ชุดสินค้า / ราคาสินค้าที่นี่ซึ่งโดยทั่วไปเกี่ยวข้องกันจนถึงจุดหนึ่ง "วัตถุดิบ" คือ Y ของฉันผลิตภัณฑ์จากห่วงโซ่คุณค่าเช่นเดียวกับผลิตภัณฑ์ด้าน ฯลฯ เป็นตัวทำนายของฉัน
จอร์จ

1
การรู้บริบทของข้อมูลนั้นมีประโยชน์เสมอและผลลัพธ์จากการวิเคราะห์ใด ๆ ควรนำมาเปรียบเทียบกับความรู้เบื้องต้นของเรา อย่างไรก็ตามขอแนะนำให้ใช้ความระมัดระวังบางอย่าง สัญชาตญาณล้มเหลวในบางครั้งและทฤษฎีที่บางครั้งใช้เพื่อให้ขึ้นอยู่กับสมมติฐานที่ไม่ได้รับการสนับสนุนจากข้อเท็จจริง แต่ฉันเข้าใจว่าคุณหมายถึงอะไรและเห็นด้วยโดยรวม
javlacalle
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.