แนวปฏิบัติที่ดีเมื่อทำการพยากรณ์อนุกรมเวลา


10

ฉันทำงานมาหลายเดือนแล้วเกี่ยวกับการพยากรณ์โหลดระยะสั้นและการใช้ข้อมูลสภาพอากาศ / สภาพอากาศเพื่อปรับปรุงความแม่นยำ ฉันมีพื้นฐานด้านวิทยาศาสตร์คอมพิวเตอร์และด้วยเหตุนี้ฉันจึงพยายามที่จะไม่ทำผิดพลาดใหญ่ ๆ และทำการเปรียบเทียบที่ไม่เป็นธรรมกับเครื่องมือสถิติเช่นแบบจำลอง ARIMA ฉันต้องการทราบความคิดเห็นของคุณเกี่ยวกับสองสิ่ง:

  1. ฉันใช้ทั้งสองรุ่น (S) ARIMA และ (S) ARIMAX เพื่อตรวจสอบผลกระทบของข้อมูลสภาพอากาศในการพยากรณ์คุณคิดว่าจำเป็นหรือไม่ที่จะต้องใช้วิธีการปรับให้เรียบแบบเอ็กซ์โปเนนเชียล

  2. มีอนุกรมเวลา 300 ตัวอย่างรายวันฉันเริ่มจากสองสัปดาห์แรกและฉันทำการพยากรณ์ล่วงหน้า 5 วันโดยใช้รุ่นที่สร้างขึ้นด้วยฟังก์ชั่น auto.arima R (แพ็คเกจการคาดการณ์) จากนั้นฉันเพิ่มตัวอย่างอีกชุดข้อมูลของฉันและฉันสอบเทียบโมเดลอีกครั้งและฉันทำการพยากรณ์อีก 5 วันและต่อไปเรื่อย ๆ จนกว่าจะสิ้นสุดข้อมูลที่มี คุณคิดว่าวิธีการทำงานนี้ถูกต้องหรือไม่?

ขอบคุณสำหรับคำแนะนำของคุณถึงแม้ว่าเป้าหมายการทำงานของเราคือบทความในวารสารวิศวกรรมศาสตร์ แต่ฉันต้องการทำงานอย่างเข้มงวดที่สุดเท่าที่จะเป็นไปได้จากมุมมองทางสถิติ


1
คำถามนี้ดูเหมือนจะเกี่ยวข้องกันอย่างใกล้ชิด: stats.stackexchange.com/questions/16915/…
whuber

1
นี่คือคำตอบเก่า stats.stackexchange.com/questions/6513/…
bill_080

คำตอบ:


9
  1. ฉันคิดว่ามันจะคุ้มค่าที่จะสำรวจโมเดลที่ปรับให้เรียบแบบเอ็กซ์โปเนนเชียลเช่นกัน แบบจำลองการปรับให้เรียบแบบเอกซ์โพเนนเชียลเป็นแบบจำลองที่แตกต่างกันในระดับพื้นฐานจากรุ่น ARIMA และอาจให้ผลลัพธ์ที่แตกต่างกันในข้อมูลของคุณ

  2. เสียงเช่นนี้เป็นวิธีการที่ถูกต้องและมีความคล้ายคลึงกับอนุกรมเวลาวิธีการตรวจสอบข้ามที่เสนอโดยร็อบ Hyndman

ฉันจะรวมข้อผิดพลาดการตรวจสอบข้ามจากการคาดการณ์แต่ละครั้ง (การทำให้เรียบแบบเอ็กซ์โปเนนเชียล, ARIMA, ARMAX) จากนั้นใช้ข้อผิดพลาดโดยรวมเพื่อเปรียบเทียบ 3 วิธี

คุณอาจต้องการพิจารณา "การค้นหากริด" สำหรับพารามิเตอร์ ARIMA แทนที่จะใช้ auto.arima ในการค้นหากริดคุณจะสำรวจแต่ละพารามิเตอร์ที่เป็นไปได้สำหรับโมเดล arima จากนั้นเลือกพารามิเตอร์ที่ "ดีที่สุด" โดยใช้ความแม่นยำในการพยากรณ์


ขอบคุณสำหรับการตอบกลับฉันใช้ auto.arima เมื่อปิดการค้นหาขั้นตอนและฉันคิดว่าด้วยวิธีนี้มันจะสำรวจพารามิเตอร์ทั้งหมดระหว่างช่วง min-max (ฉันยังไม่ได้อ่านกระดาษ Hyndman & Kandahar 2008)
Matteo De Felice

@Matteo De Felice: สิ่งนี้คือการปรับพารามิเตอร์เหล่านั้นให้เหมาะสมตาม AIC ฉันแนะนำว่ามันอาจคุ้มค่าที่จะปรับพารามิเตอร์เหล่านั้นด้วยประสิทธิภาพนอกตัวอย่างซึ่งคุณสามารถประเมินโดยการตรวจสอบข้าม นอกจากนี้หากคุณต้องการเปรียบเทียบรุ่นอื่น ๆ (เช่น ETS) คุณจะต้องใช้เมตริกประสิทธิภาพนอกตัวอย่างเนื่องจากคุณไม่สามารถเปรียบเทียบ AIC ระหว่างรุ่นต่าง ๆ (เช่น auto.arima และ ets)
Zach

ในขณะนี้ฉันทำการค้นหากริด (โดยใช้ auto.arima กับ stepwise = FALSE) จากนั้นฉันลองแบบจำลองที่พบบ่อยที่สุดเพื่อประเมินการแสดงของพวกเขา
Matteo De Felice

@Matteo De Felice: หากคุณมีปัญหาในการใช้การตรวจสอบข้ามอนุกรมเวลาบล็อกโพสต์นี้อาจช่วยได้: robjhyndman.com/researchtips/tscvexample
Zach

ควรสังเกตว่าโมเดล ARIMA และ ETS ไม่แตกต่างกันโดยพื้นฐาน อันที่จริงแบบจำลองการยกกำลังเชิงเส้นเชิงเส้นเป็นกรณีพิเศษของแบบจำลอง ARIMA ดูที่นี่: otexts.org/fpp/8/10
หูดที่
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.