วิธีการพยากรณ์สำหรับอนุกรมเวลา


9

ฉันไม่คุ้นเคยกับการวิเคราะห์ข้อมูลอนุกรมเวลา อย่างไรก็ตามฉันมีสิ่งที่ฉันคิดว่าเป็นงานทำนายง่าย ๆ ที่อยู่

ฉันมีข้อมูลประมาณห้าปีจากกระบวนการสร้างทั่วไป ในแต่ละปีแสดงถึงฟังก์ชั่นที่เพิ่มขึ้นแบบ monotonically โดยมีองค์ประกอบที่ไม่ใช่เชิงเส้น ฉันนับในแต่ละสัปดาห์ในรอบ 40 สัปดาห์ในแต่ละปี กระบวนการเริ่มต้นฟังก์ชั่นเริ่มต้นที่ศูนย์เพิ่มขึ้นอย่างรวดเร็วในช่วงครึ่งแรกของฟังก์ชั่นชะลอตัวในช่วงครึ่งหลังก่อนที่จะปรับระดับในช่วงห้าสัปดาห์ที่ผ่านมา กระบวนการนี้มีความสอดคล้องกันตลอดหลายปีที่ผ่านมาซึ่งมีความแตกต่างกันเล็กน้อยในเรื่องอัตราการเปลี่ยนแปลงและปริมาณของเซ็กเมนต์ต่าง ๆ ในแต่ละปี

y1={0,Nt1,Nt2,...Nt39,Nt40}

y5={0,Nt1,Nt2,...Nt39,Nt40}

โดยที่เท่ากับจำนวน ณ เวลา xNtx

เป้าหมายคือการใช้ที่ (หรือดีกว่าเพื่อหรือลาดไปยังจุดนั้น) และคาดการณ์ที่t40ตัวอย่างเช่นถ้าคือ 5,000 ค่าที่คาดหวังของคืออะไรในปีนั้น ดังนั้นคำถามคือคุณจะสร้างแบบจำลองข้อมูลดังกล่าวอย่างไร ง่ายพอที่จะสรุปและมองเห็นได้ แต่ฉันต้องการแบบจำลองเพื่ออำนวยความสะดวกในการทำนายและรวมการวัดข้อผิดพลาดNtxt0txNt40Nt10Nt40


2
คุณแน่ใจหรือว่าต้องการ จำกัด ตัวเองอย่างรุนแรง? หากปัญหานี้มีแอปพลิเคชันที่ใช้งานได้จริงตามเวลาที่คุณทราบจำนวนครั้งที่ x คุณจะทราบจำนวนก่อนหน้านี้ทั้งหมด ทำไมไม่ใช้พวกเขาเพื่อช่วยในการทำนาย?
whuber

จริง คุณถูกต้อง ขอบคุณสำหรับการชี้ให้เห็นว่า
Brett

คำตอบ:


6

อาจเป็นวิธีที่ง่ายที่สุดตามที่ Andy W แนะนำให้ใช้โมเดลอนุกรมเวลาตามฤดูกาล ถ้าคุณใช้ R ลองอย่างใดอย่างหนึ่งauto.arima()หรือets()จากแพคเกจการคาดการณ์

ควรทำงานได้ดี แต่วิธีอนุกรมเวลาทั่วไปไม่ได้ใช้ข้อมูลทั้งหมดที่มีให้ โดยเฉพาะอย่างยิ่งดูเหมือนว่าคุณจะรู้ว่ารูปร่างของเส้นโค้งในแต่ละปีดังนั้นมันอาจจะดีกว่าที่จะใช้ข้อมูลนั้นโดยการสร้างแบบจำลองข้อมูลในแต่ละปีตามลำดับ สิ่งต่อไปนี้เป็นข้อเสนอแนะที่พยายามรวมข้อมูลนี้

ดูเหมือนว่าเส้นโค้ง sigmoidal บางชนิดจะทำเคล็ดลับ เช่นโลจิสติกส์แบบเลื่อน: สำหรับปีและสัปดาห์โดยที่ ,และเป็นพารามิเตอร์ที่ต้องประมาณ เป็นสูงสุด asymptotic,การควบคุมอัตราการเพิ่มขึ้นและเป็นจุดกลางเมื่อ 2 (จะต้องใช้พารามิเตอร์อื่นเพื่อให้ความไม่สมมาตรที่คุณอธิบายโดยที่อัตราการเพิ่มขึ้นเป็นเวลาเร็วกว่านั้นหลังจาก

ft,j=rteat(jbt)1+eat(jbt)
tjatbtrtrtatbtft,j=rt/2btbt. วิธีที่ง่ายที่สุดในการทำเช่นนี้คืออนุญาตให้รับค่าต่าง ๆ ก่อนและหลังเวลา .)atbt

พารามิเตอร์สามารถประมาณได้โดยใช้กำลังสองน้อยที่สุดในแต่ละปี พารามิเตอร์แต่ละครั้งรูปแบบซีรีส์: ,และr_n} สิ่งเหล่านี้สามารถพยากรณ์ได้โดยใช้วิธีอนุกรมเวลามาตรฐานแม้ว่าด้วยคุณอาจไม่สามารถแยกแยะค่าเฉลี่ยของแต่ละชุดเพื่อสร้างการพยากรณ์ได้ แล้วสำหรับปีที่ 6 การประเมินมูลค่าสัปดาห์เป็นเพียงที่คาดการณ์ของ ,และถูกนำมาใช้a1,,anb1,,bnr1,,rnn=5jf^(6,j)a6b6r6

เมื่อเริ่มสังเกตข้อมูลสำหรับปีที่ 6 คุณจะต้องอัปเดตการประมาณนี้ เมื่อได้รับการสังเกตใหม่แต่ละครั้งให้ประมาณเส้นโค้ง sigmoidal กับข้อมูลจากปีที่ 6 (คุณจะต้องมีการสังเกตอย่างน้อยสามครั้งเพื่อเริ่มต้นด้วยเนื่องจากมีพารามิเตอร์สามตัว) จากนั้นใช้ค่าเฉลี่ยถ่วงน้ำหนักของการคาดการณ์ที่ได้รับโดยใช้ข้อมูลจนถึงปีที่ 5 และการคาดการณ์ที่ได้รับจะใช้เฉพาะข้อมูลจากปีที่ 6 ซึ่งน้ำหนักเท่ากับและตามลำดับ . นั่นคือเฉพาะกิจมากและฉันแน่ใจว่ามันจะสามารถทำให้บรรลุวัตถุประสงค์ได้มากขึ้นโดยการวางไว้ในบริบทของแบบจำลองสโตแคสติกที่มีขนาดใหญ่ขึ้น อย่างไรก็ตามมันอาจจะใช้ได้สำหรับวัตถุประสงค์ของคุณ(40t)/36(t4)/36


4

สิ่งที่คุณถามคือการสร้างแบบจำลอง Box Jenkins ARIMA (วงจรรายปีของคุณจะถูกอ้างถึงเป็นส่วนประกอบตามฤดูกาล) นอกจากหาวัสดุด้วยตัวเองแล้วฉันขอแนะนำ

การวิเคราะห์อนุกรมเวลาประยุกต์สำหรับสังคมศาสตร์ 2523 โดย R McCleary; RA Hay; EE Meidinger; D McDowall

แม้ว่าฉันจะคิดเหตุผลที่สมเหตุสมผลว่าทำไมคุณต้องการคาดการณ์เพิ่มเติมในอนาคต (และประเมินข้อผิดพลาดเมื่อทำเช่นนั้น) มันมักจะยากในทางปฏิบัติ หากคุณมีส่วนประกอบตามฤดูกาลที่แข็งแกร่งมันจะเป็นไปได้มากขึ้น มิฉะนั้นการประมาณของคุณจะมีความสมดุลในช่วงเวลาอนาคตอันสั้น

หากคุณวางแผนที่จะใช้ R เพื่อให้เหมาะกับแบบจำลองของคุณคุณควรตรวจสอบเว็บไซต์ของ Rob Hyndman (หวังว่าเขาจะให้คำแนะนำที่ดีกว่าฉัน!)


-2

คุณมีข้อมูล 5 ปีและ 40 ข้อสังเกตต่อปี ทำไมคุณไม่โพสต์ไว้บนเว็บและอนุญาตให้เราตอบคำถามนี้ที่พื้นดินเป็นศูนย์แทนที่จะพูดไม่ออกที่ความสูง 500 ไมล์ ฉันหวังว่าจะได้ตัวเลข เราได้เห็นข้อมูลเช่นนี้เช่นจำนวนลูกค้าที่ซื้อขายแลกเปลี่ยนเวลาในแต่ละสัปดาห์เป็นรายสัปดาห์ ซีรีส์ในแต่ละปีเริ่มต้นที่ศูนย์และสะสมเป็นค่า จำกัด


1
-1 นี่ฟังดูเหมือนโฆษณาตัวเองมากกว่าคำตอบที่เป็นประโยชน์
whuber

@whuber: ไม่ได้ตั้งใจ เพียงแค่สะท้อนถึง "ปัญหาเหนียว" ที่คล้ายกันที่ฉันพบ
IrishStat

นั่นจะทำให้ความคิดเห็นที่น่าสนใจแล้ว ความคิดเห็นเป็นวิธีที่ดีในการแทรกประสบการณ์อันมีค่าบางอย่างที่เราดีใจที่คุณแบ่งปันให้เรา ควรสงวนการตอบกลับสำหรับการตอบคำถามจริง: พวกเขาจะได้รับการโหวตเก็บถาวรค้นหาได้ ฯลฯ และดังนั้นจึงจำเป็นต้องมีความเกี่ยวข้องโดยตรงมากขึ้นค่าถาวรและสามารถต้านทานการวิจารณ์ได้ดีขึ้น (แน่นอนว่านี่คือการทำให้เป็นอุดมคติ แต่เป็นสิ่งที่เรามุ่งมั่นเพื่อ :-)
whuber

@whuber: คุณสอน! ฉันเรียนรู้ ! ฉันจะจองความคิดเห็นสำหรับ "พื้นที่แสดงความคิดเห็น" เพื่อย้ำว่าไม่มีความตั้งใจที่จะส่งเสริมสิ่งใดหรือชิ้นส่วนใด ๆ ของซอฟต์แวร์ / การให้คำปรึกษาเพียงแค่มีความตั้งใจที่จะแบ่งปันประสบการณ์กับคนอื่น ๆ ในหมู่บ้าน ฉันค่อนข้างแน่ใจว่า OP คิดว่าความคิดเห็นของฉันมีประโยชน์ คุณพูดว่าเบรท
IrishStat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.