แบบจำลองอนุกรมเวลาทั้งหมด


13

ฉันต้องทำการพยากรณ์อนุกรมเวลาโดยอัตโนมัติและฉันไม่ทราบล่วงหน้าเกี่ยวกับคุณลักษณะของซีรี่ส์เหล่านั้น (ฤดูกาล, แนวโน้ม, เสียง, ฯลฯ )

เป้าหมายของฉันคือไม่ได้แบบที่ดีที่สุดเท่าที่จะเป็นไปได้สำหรับแต่ละซีรี่ย์ แต่เพื่อหลีกเลี่ยงโมเดลที่แย่มาก กล่าวอีกนัยหนึ่งการได้รับข้อผิดพลาดเล็ก ๆ น้อย ๆ ทุกครั้งไม่ใช่ปัญหา แต่จะได้รับข้อผิดพลาดใหญ่ ๆ เป็นครั้งคราว

ฉันคิดว่าฉันสามารถทำสิ่งนี้ได้โดยการรวมโมเดลที่คำนวณด้วยเทคนิคที่แตกต่างกัน

นั่นคือแม้ว่า ARIMA จะเป็นวิธีที่ดีที่สุดสำหรับซีรีส์หนึ่ง แต่มันอาจจะไม่ดีที่สุดสำหรับซีรีย์อื่น เช่นเดียวกับการปรับให้เรียบแบบเอกซ์โพเนนเชียล

อย่างไรก็ตามถ้าฉันรวมโมเดลหนึ่งจากแต่ละเทคนิคแม้ว่าหนึ่งโมเดลจะไม่ดีนัก แต่อีกรุ่นจะนำค่าประมาณมาใกล้เคียงกับมูลค่าที่แท้จริงมากขึ้น

เป็นที่ทราบกันดีว่า ARIMA ใช้งานได้ดีกว่าสำหรับซีรีย์ที่มีพฤติกรรมดีในระยะยาวในขณะที่การปรับให้เรียบแบบเอ็กซ์โปเนนเชียลนั้นดูโดดเด่นด้วยซีรีย์ที่มีเสียงรบกวนระยะสั้น

  • ความคิดของฉันคือการรวมโมเดลที่สร้างจากทั้งสองเทคนิคเพื่อให้ได้การคาดการณ์ที่มีประสิทธิภาพยิ่งขึ้น

อาจมีหลายวิธีในการรวมโมเดลเหล่านั้น

  • หากนี่เป็นวิธีการที่ดีฉันจะรวมมันอย่างไร

ค่าเฉลี่ยของการคาดการณ์อย่างง่ายคือตัวเลือก แต่บางทีฉันอาจได้การคาดการณ์ที่ดีกว่าถ้าฉันให้น้ำหนักค่าเฉลี่ยตามแบบวัดความดีของแบบจำลอง

  • อะไรคือการรักษาความแปรปรวนเมื่อรวมตัวแบบ?

ความคิดของคุณดีมาก แต่ฉันไม่แน่ใจเกี่ยวกับการใช้แบบจำลอง ARIMA โดยอัตโนมัติ สำหรับซีรีย์ที่ไม่มีการเปลี่ยนแปลงบางที ... ภูมิปัญญาดั้งเดิมคือโฮลท์ - วินเทอร์นั้นมีความแข็งแกร่งที่ใช้โดยอัตโนมัติดังนั้นนั่นอาจเป็นพื้นฐานของคุณสำหรับการเปรียบเทียบตัวอย่างระหว่างวิธีการต่างๆ
Scortchi - Reinstate Monica

@Scortchi ฉันลืมที่จะพูดถึงว่าซีรีส์ทั้งหมดเป็น univariate! ;) ฉันยอมรับว่า Holt-Winters ทำงานได้ดีมากเมื่อใช้โดยอัตโนมัติ แต่ฉันตั้งใจจะได้รับความเห็นเพิ่มเติมจากโมเดลอื่นเพื่อหลีกเลี่ยงกรณีที่การคาดการณ์ไม่ดี บางครั้ง HW แสดงพฤติกรรมแนวโน้มที่แปลก
João Daniel

1
แม้ในกรณีที่ไม่มีการเปลี่ยนแปลงฉันพยายามจินตนาการถึงกระบวนการอัตโนมัติ - มีแนวโน้ม (สุ่มหรือกำหนดขึ้น) การเปลี่ยนแปลงที่เป็นไปได้ฤดูกาล (คูณหรือเพิ่มเติม) คิดและฉันพบว่าเพื่อไปยังแบบจำลองที่ฉันใช้ความรู้ก่อนหน้านี้มากมาย เกี่ยวกับสิ่งที่เหมาะสมสำหรับสิ่งที่ชุดเฉพาะแสดงในความเป็นจริง ถึงกระนั้นหลักฐานการพุดดิ้งอยู่ในระหว่างการรับประทานอาหาร - ฉันแค่อยากจะบอกว่าอย่าลืมทำการเปรียบเทียบตัวอย่างด้วยเทคนิคง่าย ๆ - โชคดีมาก
Scortchi - Reinstate Monica

คำตอบ:


15

การรวมการคาดการณ์เป็นความคิดที่ยอดเยี่ยม (ฉันคิดว่ามันไม่ใช่เรื่องที่พูดเกินจริงที่จะพูดว่านี่เป็นหนึ่งในสองสามสิ่งที่นักพยากรณ์ทางวิชาการเห็นด้วย)

ฉันเคยเขียนบทความย้อนกลับไปดูวิธีต่างๆในการพยากรณ์น้ำหนักในการรวมเข้าด้วยกัน: http://www.sciencedirect.com/science/article/pii/S0169207010001032โดยทั่วไปการใช้น้ำหนัก (Akaike) ไม่ได้ปรับปรุงชุดค่าผสมอย่างสม่ำเสมอ บนวิธีที่เรียบง่ายหรือถูกตัดแต่ง / ชนะหรือปรับเปลี่ยนดังนั้นฉันจะคิดสองครั้งก่อนที่จะใช้กระบวนการที่ซับซ้อนซึ่งอาจไม่ได้ประโยชน์แน่นอน ซึ่งอาจขึ้นอยู่กับช่วงเวลาที่คุณมีแน่นอน

ฉันดูที่การรวมช่วงการทำนายในกระดาษด้านบน แต่ไม่รวมการแปรปรวนเช่นนี้ ฉันดูเหมือนจะจำบทความไม่นานในIJFด้วยการมุ่งเน้นนี้ดังนั้นคุณอาจต้องการค้นหา "การรวม" หรือ "การรวมกัน" ผ่านปัญหาด้านหลังของ IJF

เอกสารอื่น ๆ ไม่กี่คนที่ได้ดูการรวมการคาดการณ์อยู่ที่นี่ (จาก 1989 แต่การตรวจสอบ)และที่นี่และที่นี่ (ยังมีลักษณะที่มีความหนาแน่น)และที่นี่และที่นี่. บันทึกจำนวนมากเหล่านี้ยังคงเข้าใจได้ไม่ดีว่าทำไมชุดค่าผสมการคาดการณ์จึงมีประสิทธิภาพสูงกว่ารุ่นที่เลือกเดี่ยว บทความที่สอง - สุดท้าย - อยู่ที่การแข่งขันการพยากรณ์ M3; หนึ่งในการค้นพบหลักของพวกเขาคือ (หมายเลข (3) บนหน้า 458) ว่า "ความถูกต้องของการรวมกันของวิธีการต่าง ๆ มีประสิทธิภาพสูงกว่าโดยเฉลี่ยวิธีการเฉพาะที่รวมกันและทำได้ดีเมื่อเปรียบเทียบกับวิธีอื่น ๆ " เอกสารชุดสุดท้ายพบว่าชุดค่าผสมไม่จำเป็นต้องทำงานได้ดีกว่าแบบจำลองเดียว แต่สามารถลดความเสี่ยงจากความล้มเหลวอย่างรุนแรง (ซึ่งเป็นหนึ่งในเป้าหมายของคุณ) ควรหาวรรณกรรมเพิ่มเติมในวารสารการพยากรณ์ระหว่างประเทศวารสารการพยากรณ์ และสำหรับการใช้งานที่เฉพาะเจาะจงมากขึ้นในสาขาเศรษฐศาสตร์หรือวรรณกรรมด้านซัพพลายเชน


1
มุมมองที่ยอดเยี่ยมเกี่ยวกับการรวมโมเดลต่างๆ! คำตอบของคุณสร้างสรรค์มาก!
João Daniel

@Stephan Kolassa คุณจะมีความคิดเห็นใด ๆ เกี่ยวกับการรวมตัวทำนายไปข้างหน้าและถอยหลังเหมือนในวิธีการของ Burg
ปฏิเสธ

@ เดนิส: ฉันไม่คุ้นเคยกับการคาดการณ์ไปข้างหน้าหรือข้างหลังหรือด้วยวิธีของ Burg ขอโทษด้วย ... ถึงแม้ว่าฉันจะสมมติว่าการรวมการคาดการณ์ / การคาดการณ์
เตฟาน Kolassa

สวัสดีสเตฟานบทความดีๆ ดูเหมือนว่าเว็บไซต์วารสารมีการเปลี่ยนแปลงและเป็นไปไม่ได้ที่จะดาวน์โหลดรหัส R ของคุณจากเว็บไซต์หลักอีกต่อไป ตอนนี้โฮสต์บนไซต์อื่นหรือไม่
เอียน

@Ian: คุณอาจไม่สามารถเข้าถึงได้หากคุณไม่ได้สมัคร ส่งอีเมลหาฉัน ( หาที่อยู่ของฉันที่นี่ ) ฉันจะส่งสคริปต์ไปให้ ให้เวลาฉันสักสองสามวันเพื่อขุดพวกมัน
เตฟาน Kolassa

1

ทำไมไม่ระบุเพิ่มเติม ฉันไม่คิดว่ารูปแบบใดรูปแบบหนึ่งที่คุณจะผลิตอาจจะดีกว่าหรือดีกว่าตัวเลือกเฉพาะ

ด้วยที่กล่าวว่าหากคุณสามารถ จำกัด ตัวเลือกของคุณให้เล็กลงสำหรับสิ่งที่คุณสามารถทดสอบได้และการป้อนข้อมูลสามารถเป็นมาตรฐานแล้วทำไมไม่เขียนขั้นตอนการทดสอบอัตโนมัติใน R

สมมติว่าคุณตัดสินใจว่าข้อมูลของคุณจะอยู่ในช่วงที่ประเมินโดยห้ารุ่นรวมถึง "สำรอง" หนึ่งรายการ สมมติว่าคุณสามารถระบุลักษณะของข้อมูลโดยการทดสอบที่แตกต่างกัน จากนั้นไปข้างหน้าแล้วเขียนอัลกอริทึม R (หรือโปรแกรมเช่นนั้น) ที่ทำงานให้คุณ วิธีนี้ใช้ได้ผลถ้าคุณสามารถสร้างผังงานที่รูปแบบการทำงานจะขึ้นอยู่กับข้อมูลทดสอบนั่นคือถ้าจุดใด ๆ ของแผนภูมิการตัดสินใจเป็นไบนารี

หากนี่ไม่ใช่ตัวเลือกเนื่องจากการตัดสินใจอาจไม่ใช่แบบไบนารีฉันขอแนะนำให้คุณใช้ระบบการให้คะแนนตามการทดสอบที่ใช้งานได้และเรียกใช้ข้อมูลจำลอง "กรณีสุดขั้ว" ผ่านกริดของคุณเพื่อดูว่าผลลัพธ์เป็นสิ่งที่คุณต้องการหรือไม่

คุณสามารถรวมสิ่งต่าง ๆ เหล่านี้ได้อย่างชัดเจนตัวอย่างเช่นการทดสอบความไม่คงที่อาจให้ผลไม่แน่นอนขณะที่คุณลักษณะอื่น ๆ อาจตกอยู่ในช่วงเช่นความหลากหลายทางชีวภาพ
คุณสามารถวาดมันลงบนกระดาษก่อนจากนั้นสร้างมันจำลองด้วยการแจกแจงที่คุณคาดว่าจะมี

จากนั้นเพียงเรียกใช้โปรแกรม R ทุกครั้งที่มีข้อมูลใหม่มาถึง ฉันไม่เห็นจำเป็นต้องรวมหลายรุ่นเข้ากับความสามารถในการคำนวณที่คุณมีอยู่ในมือ


การ จำกัด ตัวเลือกให้แคบลงเป็นความคิดที่ดีเช่นไม่ใช้วิธีการที่ไม่ใช่ฤดูกาลหากข้อมูลชัดเจนตามฤดูกาล แต่ถึงอย่างนั้นฉันก็ขอยืนยันว่าการหาค่าเฉลี่ยของแบบจำลองตามฤดูกาลหลายแบบ (เติมแต่งเทียบกับฤดูกาลแบบหลายจุดโดยมีหรือไม่มีแนวโน้ม ฯลฯ ) โดยเฉลี่ยจะปรับปรุงความแม่นยำในการพยากรณ์ อย่างน้อยนั่นคือความประทับใจที่ฉันได้รับจากการสัมผัสกับชุมชนการคาดการณ์เช่นเดียวกับ M3 และการแข่งขันการคาดการณ์ที่คล้ายกัน
เตฟาน Kolassa

คุณมีเอกสารเพิ่มเติมเกี่ยวกับเรื่องนี้หรือไม่? ฉันหมายความว่านี่จะเป็นงานวิจัยที่ตรงไปตรงมา แต่ยังเกี่ยวข้อง ความคิดที่น่าสนใจมาก แต่เพียงแค่สังหรณ์ใจฉันไม่เห็นด้วยว่ามันจะต้องดีกว่าตารางแบบไดนามิกของแบบจำลอง
IMA

จุดดี. ฉันแก้ไขคำตอบของฉันเพื่อเพิ่มย่อหน้าด้วยตัวชี้วรรณกรรมเพิ่มเติม ฉันยอมรับว่าสิ่งนี้ตรงไปตรงมาและมีความเกี่ยวข้องและก็ยังเข้าใจได้ไม่ดีว่าทำไมค่าเฉลี่ยการคาดการณ์มักเพิ่มความแม่นยำ
เตฟาน Kolassa

ใช่ฉันหมายความว่าคุณสามารถจำลองปัญหาการกระจายได้ทุกประเภทและโจมตีมันโดยใช้คอมพิวเตอร์และพื้นฐาน ขอบคุณสำหรับเอกสารที่น่าสนใจมาก
IMA

0

มีสูตรที่ดีและเรียบง่ายสำหรับการรวมวิธีการพยากรณ์สองวิธีคุณเพียงแค่ให้น้ำหนักพวกเขาคูณด้วยตัวแรกและอีกตัวหนึ่งด้วย (1 - a) โดยที่ a ถูกพบโดยการลดความแปรปรวนของการพยากรณ์แบบรวมนี้ให้น้อยที่สุด เมื่อคุณทราบข้อผิดพลาดของวิธีการพยากรณ์ทั้งสองวิธีคุณสามารถคำนวณข้อผิดพลาดของชุดค่าผสมซึ่งจะขึ้นอยู่กับ "a" การคำนวณนั้นง่ายเมื่อค่าเฉลี่ยของแต่ละวิธีคือ = 0 สำหรับการรวมกันมากกว่า 2 วิธีสูตรยังคง "ง่าย" ในแง่ที่ว่าคุณสามารถคำนวณได้ "ด้วยมือ" หรือใช้ตัวเลือก Solver จาก EXCEL


คุณช่วยอ้างอิงวิธีนี้ได้ไหม
horaceT
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.