มันผิดปกติหรือไม่ที่ MEAN จะทำได้ดีกว่า ARIMA?


37

ฉันเพิ่งใช้วิธีการพยากรณ์หลายแบบ (MEAN, RWF, ETS, ARIMA และ MLPs) และพบว่า MEAN ทำได้ดีอย่างน่าประหลาดใจ (หมายถึง: ที่การคาดการณ์ในอนาคตทั้งหมดถูกคาดการณ์ว่าเท่ากับค่าเฉลี่ยเลขคณิตของค่าที่สังเกต) MEAN ยิ่งกว่า ARIMA ในสามชุดที่ฉันใช้

สิ่งที่ฉันอยากรู้คือถ้ามันผิดปกติ? นี่หมายความว่าไทม์สที่ฉันใช้แปลกหรือเปล่า? หรือสิ่งนี้บ่งชี้ว่าฉันได้ตั้งบางสิ่งผิดปกติหรือไม่?



@ Mehrdad เราสามารถสร้างคำตอบที่ดีเกี่ยวกับ Martingales ได้อย่างแน่นอน
shadowtalker

1
มันค่อนข้างธรรมดาสำหรับวิธีการง่ายๆในการทำงานได้ดีโดยเฉพาะอย่างยิ่งตัวอย่างนอก (ซึ่งเป็นที่ที่มันสำคัญ) ผลกระทบนี้จะแข็งแกร่งขึ้นในซีรี่ส์สั้น หากมีความสัมพันธ์แบบอนุกรมหรือแนวโน้มไม่มากนักเราคาดหวังว่าค่าเฉลี่ยจะทำได้ดีมากแม้ว่าจะมีซีรี่ส์ที่ค่อนข้างยาว
Glen_b

คำตอบ:


31

ฉันเป็นผู้ปฏิบัติงานทั้งผู้ผลิตและผู้ใช้งานของการพยากรณ์และไม่ใช่นักสถิติที่ผ่านการฝึกอบรมมาแล้ว ด้านล่างฉันแบ่งปันความคิดของฉันเกี่ยวกับสาเหตุที่การคาดคะเนเฉลี่ยของคุณดีกว่า ARIMA โดยอ้างอิงจากบทความวิจัยที่อาศัยหลักฐานเชิงประจักษ์ หนังสือเล่มหนึ่งที่ครั้งแล้วครั้งเล่าที่ฉันกลับไปอ้างถึงเป็นหนังสือหลักการของการพยากรณ์โดยอาร์มสตรองและเว็บไซต์ซึ่งฉันอยากจะแนะนำให้อ่านอย่างดีเยี่ยมสำหรับผู้ทำนายใด ๆ ให้ข้อมูลเชิงลึกที่ยอดเยี่ยมเกี่ยวกับการใช้งาน

เพื่อตอบคำถามแรกของคุณ - สิ่งที่ฉันต้องการทราบคือถ้านี่เป็นเรื่องผิดปกติหรือไม่?

มีบทที่เรียกว่าการคาดการณ์สำหรับ Time-Series และข้อมูลภาคตัดขวางเป็นที่ยังสามารถใช้ได้ฟรีในเดียวกันเว็บไซต์ ต่อไปนี้เป็นคำพูดจากบทที่

"ตัวอย่างเช่นในการแข่งขัน M2 แบบเรียลไทม์ซึ่งตรวจสอบ 29 ชุดข้อมูลรายเดือน Box-Jenkins พิสูจน์แล้วว่าเป็นหนึ่งในวิธีการที่มีความแม่นยำน้อยที่สุดและข้อผิดพลาดโดยรวมอยู่ที่ 17% มากกว่าที่คาดการณ์ไร้เดียงสา"

มีหลักฐานเชิงประจักษ์เกี่ยวกับสาเหตุที่การคาดคะเนเฉลี่ยของคุณดีกว่าแบบจำลอง ARIMA

นอกจากนี้ยังมีการศึกษาหลังการศึกษาในการแข่งขันเชิงประจักษ์และการแข่งขัน M3ครั้งที่สามที่แสดงวิธีการ Box - Jenkins ARIMA ล้มเหลวในการสร้างการคาดการณ์ที่แม่นยำและขาดหลักฐานที่แสดงว่าทำงานได้ดีขึ้นสำหรับการคาดการณ์แนวโน้มที่ไม่แปรเปลี่ยน

นอกจากนี้ยังมีรายงานฉบับอื่นและการศึกษาอย่างต่อเนื่องของกรีนและอาร์มสตรองในหัวข้อ "การพยากรณ์อย่างง่าย: หลีกเลี่ยงน้ำตาก่อนนอน " ในเว็บไซต์เดียวกัน ผู้เขียนบทความสรุปดังนี้:

โดยรวมแล้วเราพบว่ามี 29 กระดาษที่รวม 94 การเปรียบเทียบอย่างเป็นทางการของความถูกต้องของการคาดการณ์จากวิธีการที่ซับซ้อนกับที่มาจากง่าย - แต่ไม่ใช่ในทุกกรณีอย่างง่ายซับซ้อน - วิธีการ ร้อยละแปดสิบสามของการเปรียบเทียบพบว่าการคาดการณ์จากวิธีการง่าย ๆ มีความแม่นยำมากกว่าหรือแม่นยำกว่าในทำนองเดียวกันกับวิธีการที่ซับซ้อน โดยเฉลี่ยแล้วข้อผิดพลาดของการพยากรณ์จากวิธีการที่ซับซ้อนนั้นสูงกว่าข้อผิดพลาดของการคาดการณ์ประมาณ 32 เปอร์เซ็นต์จากวิธีการง่าย ๆ ในการศึกษา 21 ครั้งที่ให้การเปรียบเทียบข้อผิดพลาด

หากต้องการตอบคำถามที่สามของคุณ : สิ่งนี้บ่งชี้ว่าฉันได้ตั้งสิ่งผิดปกติหรือไม่? ไม่ฉันจะพิจารณา ARIMA เป็นวิธีการที่ซับซ้อนและการพยากรณ์ค่าเฉลี่ยเป็นวิธีการง่ายๆ มีหลักฐานเพียงพอที่วิธีการง่าย ๆ เช่นการคาดการณ์ค่าเฉลี่ยมีประสิทธิภาพสูงกว่าวิธีการที่ซับซ้อนเช่น ARIMA

เพื่อตอบคำถามที่สองของคุณ : นี่หมายความว่าซีรี่ส์ที่ฉันใช้แปลกหรือไม่?

ด้านล่างนี้คือสิ่งที่ฉันถือว่าเป็นผู้เชี่ยวชาญในการพยากรณ์โลกแห่งความจริง:

  • Makridakis (บุกเบิกการแข่งขันเชิงประจักษ์เกี่ยวกับการพยากรณ์ที่เรียกว่า M, M2 และ M3 และปูทางสำหรับวิธีการตามหลักฐานในการพยากรณ์)
  • Armstrong (ให้ข้อมูลเชิงลึกที่มีค่าในรูปแบบของหนังสือ / บทความเกี่ยวกับการพยากรณ์การปฏิบัติ)
  • Gardner (Invented Damped Trend ชี้แจงวิธีการแบบเรียบง่ายอีกวิธีหนึ่งซึ่งทำงานได้ดีอย่างน่าประหลาดใจกับ ARIMA)

นักวิจัยทั้งหมดข้างต้นสนับสนุนความเรียบง่าย (วิธีการเช่นการพยากรณ์ค่าเฉลี่ยของคุณ) กับวิธีการที่ซับซ้อนเช่น ARIMA ดังนั้นคุณควรรู้สึกสะดวกสบายที่การคาดการณ์ของคุณดีและชอบความเรียบง่ายมากกว่าความซับซ้อนตามหลักฐานเชิงประจักษ์ นักวิจัยเหล่านี้ล้วนมีส่วนสำคัญในการพยากรณ์ประยุกต์อย่างมาก

นอกจากรายการวิธีการพยากรณ์อย่างง่ายของสเตฟานแล้ว นอกจากนี้ยังมีวิธีอื่นที่เรียกว่าวิธีการพยากรณ์ Thetaซึ่งเป็นวิธีที่ง่ายมาก (โดยทั่วไปคือการยกกำลังแบบเอ็กซ์โปเนนเชียลแบบเรียบกับดริฟท์เท่ากับ 1/2 ความชันของการถดถอยเชิงเส้น) ฉันจะเพิ่มสิ่งนี้ลงในกล่องเครื่องมือของคุณ Forecast package in Rใช้วิธีนี้


2
ฉันชอบมุมมองที่คุณมีต่อการคาดการณ์และหลักฐานที่คุณเพิ่มเข้ามาเพื่อสนับสนุน แต่องค์ประกอบของคำตอบนี้น่ารังเกียจเพราะพวกเขาอ่านมากเกินไปเหมือนกับการพูดจาโผงผางต่อ "นักสถิติ" หรืออาจต่อต้านการฝึกอบรมทางสถิติอย่างเป็นทางการ . ตัวอย่างเช่นองศาขั้นสูงของ Makridakis อยู่ในสถิติ (คาดเดาคืออะไร) นั่นคือสิ่งที่เขาสอนและนั่นคือสิ่งที่เขาทำ
whuber

1
เข้าใจแล้วฉันจะลบมัน ฉันพยายามชี้ให้เห็นว่าความก้าวหน้าที่สำคัญในวิธีการตามหลักฐานมาจากนักสถิติที่ไม่ใช่ แต่ฉันเห็นจุดของคุณว่ามันอาจเจอเช่นนั้น
ทำนาย

เสร็จแล้ว Makridakis PHD อยู่ในระบบสารสนเทศเพื่อการจัดการตามการสัมภาษณ์ที่ตีพิมพ์
ทำนาย

FWIW เขาหน้า LinkedIn --which เขารักษา - ทั้งสองรายการปริญญาเอกของเขาในสถิติ แต่การโต้เถียงนั้นไม่มีจุดหมาย: การอ้างว่าใครบางคนไม่ใช่นักสถิติเพราะการศึกษาระดับปริญญาของพวกเขาอาจไม่ได้อยู่ในสถิติโดยเฉพาะมีค่าน้อยและอยู่ด้านข้างจุดนี้ (จนกระทั่งเมื่อเร็ว ๆ นี้คนส่วนใหญ่ที่มีอาชีพอยู่ในสถิติมีองศาในสาขาอื่นเพราะมีโปรแกรมสถิติไม่กี่แห่ง)
whuber

2
+1 อย่างไรก็ตามคุณเขียนว่า "มีหลักฐานเชิงประจักษ์อยู่ว่าทำไมการคาดคะเนเฉลี่ยของคุณจึงดีกว่าตัวแบบ ARIMA" - ไม่มีนี้บอกเพียงเราที่ความหมายดี (ในกรณีนี้โดยเฉพาะ) ไม่ได้ว่าทำไม ฉันจะเปลี่ยนข้อโต้แย้งและวางภาระการพิสูจน์ให้กับ ARIMA และรุ่นอื่น ๆ ฉันไม่เคยเข้าใจเลยว่าทำไมกระบวนการสร้างข้อมูลจึงควรใส่ใจกับข้อผิดพลาดในอดีตกับโมเดลของฉัน ความสงสัยส่วนตัวของฉันคือ ARIMA ได้รับความนิยมอย่างมากเพราะคุณสามารถพิสูจน์สิ่งต่าง ๆ ได้เช่นรากหน่วยและความคงที่ - ไม่ใช่เพราะมันคาดการณ์ได้ดี
S. Kolassa - Reinstate Monica

36

นี่คือไม่ได้ทั้งหมดที่น่าแปลกใจ ในการพยากรณ์คุณมากมักจะพบว่าวิธีการที่ง่ายมากเช่น

  • ค่าเฉลี่ยโดยรวม
  • สุ่มเดินไร้เดียงสา (เช่นการสังเกตครั้งสุดท้ายที่ใช้เป็นการคาดการณ์)
  • สุ่มเดินตามฤดูกาล (เช่นการสังเกตจากหนึ่งปีหลัง)
  • การปรับให้เรียบแบบเอกซ์โปเนนเชียลเดี่ยว

ดีกว่าวิธีการที่ซับซ้อนมากขึ้น นั่นคือเหตุผลที่คุณควรทดสอบวิธีการของคุณเทียบกับมาตรฐานที่เรียบง่ายเหล่านี้

ใบเสนอราคาจาก George Athanosopoulos และ Rob Hyndman (ซึ่งเป็นผู้เชี่ยวชาญในสาขา):

วิธีการพยากรณ์บางอย่างง่ายและมีประสิทธิภาพอย่างน่าประหลาดใจ

โปรดสังเกตว่าพวกเขาพูดอย่างชัดเจนว่าพวกเขาจะใช้วิธีการง่าย ๆ บางอย่างเป็นเกณฑ์มาตรฐาน

อันที่จริงหนังสือแนะนำแบบออนไลน์เปิดฟรีทั้งเล่มของพวกเขาเกี่ยวกับการพยากรณ์เป็นอย่างมาก

แก้ไข: หนึ่งในข้อผิดพลาดการคาดการณ์ที่ดีขึ้นเป็นที่ยอมรับข้อผิดพลาดค่าเฉลี่ยสัมบูรณ์ (MASE) โดยHyndman & Koehler (ดูเพิ่มเติมที่นี่ ) วัดว่าการคาดการณ์ที่กำหนดให้ดีขึ้นมากเพียงใดในการคาดการณ์การเดินแบบไร้เดียงสา <1 การคาดการณ์ของคุณดีกว่าการเดินสุ่มในตัวอย่าง คุณคาดหวังว่าสิ่งนี้จะถูกผูกไว้อย่างง่ายดายใช่มั้ย

ไม่เช่นนั้นบางครั้งแม้แต่วิธีการพยากรณ์มาตรฐานที่ดีที่สุดหลายวิธีเช่น ARIMA หรือ ETS จะให้ค่า MASE ที่ 1.38 เท่านั้นนั่นคือแย่กว่า (จากตัวอย่าง) กว่าการคาดการณ์การเดินแบบสุ่มในตัวอย่าง นี่เป็นสิ่งที่ไม่เหมาะสมพอที่จะสร้างคำถามที่นี่ (คำถามนั้นไม่ซ้ำกันของคำถามนี้เนื่องจาก MASE จะเปรียบเทียบความถูกต้องแบบนอกตัวอย่างกับความแม่นยำในตัวอย่างของวิธีการที่ไร้เดียงสา แต่มันก็เป็นความกระจ่างสำหรับคำถามปัจจุบันด้วย)


1
ขอบคุณที่ยอมรับ แต่บางทีคุณอาจต้องการรอหนึ่งวัน - หากคำถามได้ตอบรับคำตอบแล้วมีคนน้อยกว่าที่จะอ่านได้ให้ข้อคิดเห็นหรือคำตอบเพียงอย่างเดียว และคนอื่นอาจมีความแตกต่างในเรื่องนี้ อย่าลังเลที่จะยอมรับ ;-)
S. Kolassa - Reinstate Monica

ความซื่อสัตย์ในตัวคุณมาก :) ฉันจะให้มันวันเดียว ขอบคุณ
Andy T

9
"complex" เป็นญาติสนิทของ "overfitted"
shadowtalker

1
+1 คำตอบที่ดี หากการคาดการณ์เป็นสาขาที่มีหลักฐานเช่นยาวิธี ARIMA จะเป็นประวัติศาสตร์
พยากรณ์

2
ARIMA ที่เรียบง่ายและเป็นกันเองโดยไม่ต้องตรวจสอบข้อสันนิษฐานของเกาส์เซียนเป็นประวัติศาสตร์สำหรับพวกเราส่วนใหญ่แล้ว แต่ดูเหมือนจะไม่ใช่สำหรับทุกคน!
IrishStat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.