การทำนายอนุกรมเวลาโดยใช้ ARIMA กับ LSTM


10

ปัญหาที่ฉันจัดการคือการทำนายค่าอนุกรมเวลา ฉันกำลังดูซีรีส์ครั้งเดียวในแต่ละครั้งและตามตัวอย่างเช่น 15% ของข้อมูลอินพุตฉันต้องการทำนายค่าในอนาคต จนถึงตอนนี้ฉันเจอสองรุ่น:

  • LSTM (หน่วยความจำระยะสั้นระยะยาวคลาสของเครือข่ายประสาทที่เกิดขึ้นอีก)
  • ARIMA

ฉันลองทั้งสองและอ่านบทความเกี่ยวกับพวกเขา ตอนนี้ฉันพยายามทำความเข้าใจให้ดีขึ้นเกี่ยวกับวิธีเปรียบเทียบทั้งสอง สิ่งที่ฉันได้พบจนถึง:

  1. LSTM ทำงานได้ดีขึ้นถ้าเราจัดการกับข้อมูลจำนวนมากและมีข้อมูลการฝึกอบรมเพียงพอในขณะที่ ARIMA จะดีกว่าสำหรับชุดข้อมูลขนาดเล็ก (ถูกต้องหรือไม่?)
  2. ARIMA ต้องการชุดพารามิเตอร์(p,q,d)ที่ต้องคำนวณตามข้อมูลในขณะที่ LSTM ไม่ต้องการตั้งค่าพารามิเตอร์ดังกล่าว อย่างไรก็ตามมีพารามิเตอร์หลายอย่างที่เราต้องปรับแต่งสำหรับ LSTM

นอกเหนือจากคุณสมบัติที่กล่าวถึงข้างต้นฉันไม่สามารถหาจุดหรือข้อเท็จจริงอื่นใดที่จะช่วยให้ฉันเลือกโมเดลที่ดีที่สุดได้ ฉันจะขอบคุณจริง ๆ ถ้ามีคนช่วยฉันค้นหาบทความเอกสารหรือสิ่งอื่น ๆ (ไม่มีโชคจนถึงตอนนี้มีเพียงความคิดเห็นทั่วไปบางส่วนที่นี่และที่นั่นและไม่มีอะไรจากการทดลอง)

ฉันต้องพูดถึงว่าตอนแรกฉันจัดการกับข้อมูลสตรีมมิ่ง แต่ตอนนี้ฉันกำลังใช้ชุดข้อมูล NABซึ่งรวมถึง 50 ชุดข้อมูลที่มีขนาดสูงสุด 20k จุดข้อมูล


1
ทำไมคุณไม่ลองรุ่นทั้งสองในส่วนของข้อมูลของคุณดูว่าอันไหนดีกว่าในการพยากรณ์และเลือกมัน หรือใช้ทั้งสองโมเดลและรวมการคาดการณ์ของพวกเขา ชุดค่าพยากรณ์มักจะมีประสิทธิภาพสูงกว่าการคาดการณ์รายบุคคล
Richard Hardy

@RichardHardy ฉันได้ทำไปแล้วและตระหนักถึงประสิทธิภาพของชุดข้อมูลเหล่านั้นแล้ว ฉันพยายามทำความเข้าใจทั้งสองอย่างดีขึ้นโดยเฉพาะข้อเสียของพวกเขาเพื่อดูว่าใครจะเป็นผู้สมัครที่ดีที่สุดในการจัดการตัวอย่างข้อมูลที่กำลังจะมาถึง
ahajib


โปรดอ่านศูนย์ช่วยเหลือ - โดยเฉพาะอย่างยิ่งในย่อหน้าที่สามที่กล่าวว่า " โปรดทราบว่าการโพสต์ข้ามไม่ได้รับการสนับสนุนในเว็บไซต์ SE เลือกสถานที่ที่ดีที่สุดในการโพสต์คำถามของคุณในภายหลังถ้ามันเหมาะสมกว่า ไซต์อื่นสามารถย้ายข้อมูลได้ "
Glen_b

คำตอบ:


3

การเปรียบเทียบโครงข่ายประสาทเทียมและโมเดลอนุกรมเวลาสำหรับการพยากรณ์ราคาสินค้าโภคภัณฑ์เปรียบเทียบประสิทธิภาพของ ANN และ ARIMA ในการทำนายอนุกรมเวลาทางการเงิน ฉันคิดว่ามันเป็นจุดเริ่มต้นที่ดีสำหรับการทบทวนวรรณกรรมของคุณ

ในหลายกรณีเครือข่ายประสาทมีแนวโน้มที่จะดีกว่าแบบจำลอง AR-based อย่างไรก็ตามฉันคิดว่าข้อเสียเปรียบที่สำคัญอย่างหนึ่ง (ซึ่งไม่ได้กล่าวถึงในเรื่องคร่าวๆทางวิชาการ) ด้วยวิธีการเรียนรู้ด้วยเครื่องจักรที่ทันสมัยกว่าคือพวกเขาใช้กล่องดำ นี่เป็นปัญหาใหญ่หากคุณต้องอธิบายว่าแบบจำลองนี้ทำงานอย่างไรกับคนที่ไม่รู้จักโมเดลเหล่านี้มาก (ตัวอย่างเช่นใน บริษัท ) แต่ถ้าคุณทำการวิเคราะห์เช่นเดียวกับงานโรงเรียนฉันไม่คิดว่ามันจะเป็นปัญหา

แต่เช่นเดียวกับผู้วิจารณ์คนก่อนหน้ากล่าวว่าโดยปกติแล้ววิธีที่ดีที่สุดคือการสร้างตัวประเมินวงดนตรีที่คุณรวมโมเดลสองแบบขึ้นไป


7
ข้ออ้างอิงที่คุณอ้างถึงข้อเสนอด้วยอวนประสาทแบบป้อนไปข้างหน้าอย่างง่ายและมันเก่าเกินไปที่จะมีประโยชน์ (1990s คือศตวรรษที่ผ่านมา) คำถาม OP ถามเกี่ยวกับโครงข่ายประสาทที่เกิดขึ้นอีกด้วยสถาปัตยกรรม LSTM และบทความนี้ไม่ครอบคลุม
horaceT

1
ดังที่ @horaceT กล่าวถึงบทความนี้ล้าสมัยเล็กน้อยและหากคุณสามารถแนะนำบทความล่าสุดที่มีข้อมูลเกี่ยวกับ LSTM จะน่ากลัว ขอบคุณ
ahajib
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.