คำถามติดแท็ก arima

อ้างถึงโมเดลค่าเฉลี่ยเคลื่อนที่แบบรวมการลงทะเบียนอัตโนมัติที่ใช้ในการสร้างแบบจำลองอนุกรมเวลาทั้งสำหรับคำอธิบายข้อมูลและสำหรับการคาดการณ์ โมเดลนี้ทำให้โมเดล ARMA โดยทั่วไปรวมคำศัพท์สำหรับการหาอนุพันธ์ต่าง ๆ ซึ่งมีประโยชน์สำหรับการลบแนวโน้มและการจัดการกับความไม่แน่นอนบางประเภท

1
วิธีการบัญชีสำหรับผลกระทบของวันหยุดในการคาดการณ์
ฉันมีซีรีย์เวลารายวันที่สามารถคาดการณ์ได้ค่อนข้างมีฤดูกาลทุกสัปดาห์ ฉันสามารถหาคำทำนายที่ค่อนข้างแม่นยำ (ยืนยันโดยการตรวจสอบข้าม) เมื่อไม่มีวันหยุด อย่างไรก็ตามเมื่อมีวันหยุดฉันมีปัญหาดังต่อไปนี้: ฉันได้รับตัวเลขที่ไม่เป็นศูนย์สำหรับวันหยุดในการคาดการณ์ของฉันแม้ว่าวันหยุดประวัติศาสตร์ทั้งหมดจะเป็น 0 นี่ไม่ใช่ประเด็นหลักจริงๆ ปัญหาคือ ... เนื่องจากการประมวลผลที่ไม่ได้เกิดขึ้นในวันหยุด "หกล้นเกิน" ไปจนถึงวันถัดจากวันหยุดตัวแปรดัมมี่ที่เรียบง่ายไม่ได้ตัดมันเนื่องจากค่าผิดปกติเหล่านี้ดูเหมือนจะเป็นนวัตกรรมระยะสั้น หากไม่มีฤดูกาลประจำสัปดาห์ฉันอาจจะเกิดขึ้นกับการประมาณการสำหรับการกระจายข้อมูลที่ไม่ได้ประมวลผลในวันหยุดในช่วงห้าวันหรือมากกว่านั้นหลังจากวันหยุด (ดังที่แนะนำในวิธีทำคุณสร้างตัวแปรที่สะท้อนถึงโอกาสในการขาย ผลกระทบของปฏิทินในการวิเคราะห์อนุกรมเวลา? ) อย่างไรก็ตามการกระจายของ "การรั่วไหล" ขึ้นอยู่กับวันของสัปดาห์ที่เกิดขึ้นและไม่ว่าวันหยุดจะเป็นวันคริสต์มาสหรือวันขอบคุณพระเจ้าซึ่งคำสั่งซื้อจะถูกวางในอัตราที่ต่ำกว่าช่วงที่เหลือของปี ต่อไปนี้เป็นภาพรวมบางส่วนจากการตรวจสอบความถูกต้องไขว้ของฉันซึ่งแสดงผลลัพธ์ (สีน้ำเงิน) ที่คาดการณ์ไว้กับผลลัพธ์ที่แท้จริง (สีแดง) สำหรับวันหยุดที่ปรากฏในวันที่แตกต่างกันของสัปดาห์: ฉันยังกังวลว่าผลกระทบของคริสต์มาสจะขึ้นอยู่กับวันในสัปดาห์และฉันมีข้อมูลประวัติศาสตร์เพียงหกปีหรือมากกว่านั้น ไม่มีใครมีข้อเสนอแนะใด ๆ เกี่ยวกับวิธีจัดการกับค่าผิดปกติเชิงนวัตกรรมประเภทนี้ในบริบทของการพยากรณ์หรือไม่? (น่าเสียดายที่ฉันไม่สามารถแชร์ข้อมูลใด ๆ ได้)

4
ซีรีส์เครื่องเขียนเทรนด์สามารถใช้กับ ARIMA ได้หรือไม่?
ฉันมีคำถาม / ความสับสนเกี่ยวกับชุดเครื่องเขียนที่จำเป็นสำหรับการสร้างแบบจำลองด้วย ARIMA (X) ฉันคิดถึงสิ่งนี้มากขึ้นในแง่ของการอนุมาน (ผลของการแทรกแซง) แต่อยากรู้ว่าการคาดการณ์และการอนุมานนั้นสร้างความแตกต่างในการตอบสนองหรือไม่ คำถาม: แหล่งข้อมูลเบื้องต้นทั้งหมดที่ฉันได้อ่านระบุว่าซีรีส์ต้องหยุดนิ่งซึ่งทำให้ฉันรู้สึกว่าเหมาะสมและนั่นคือที่ "ฉัน" ใน arima เข้ามา (ต่างกัน) สิ่งที่ทำให้ฉันสับสนคือการใช้แนวโน้มและการล่องลอยใน ARIMA (X) และความหมาย (ถ้ามี) สำหรับข้อกำหนดที่อยู่กับที่ การใช้เทอมคงที่ / ดริฟท์และ / หรือตัวแปรเทรนด์เป็นตัวแปรภายนอก (เช่นการเพิ่ม 't' เป็น regressor) ลบล้างความต้องการของซีรีส์ที่อยู่กับที่หรือไม่? คำตอบนั้นแตกต่างกันไปหรือไม่ขึ้นอยู่กับว่าซีรี่ส์มีรูทยูนิต (เช่น adf test) หรือมีแนวโน้มที่กำหนดขึ้น แต่ไม่มีรูทยูนิตหรือไม่ หรือ ซีรีย์ต้องหยุดนิ่งอยู่เสมอโดยสร้างความแตกต่างและ / หรือทำให้เสียโฉมก่อนใช้ ARIMA (X)

1
เมื่อใดจึงต้องใช้ Exponential Smoothing vs ARIMA?
เมื่อไม่นานมานี้ฉันได้รับการฟื้นฟูความรู้ที่คาดการณ์ของฉันในขณะที่ทำงานกับการคาดการณ์รายเดือนในที่ทำงานและการอ่านหนังสือของ Rob Hyndman แต่ที่เดียวที่ฉันกำลังดิ้นรนคือเมื่อใช้แบบจำลองการทำให้เรียบชี้แจงแทน มีกฎง่ายๆที่คุณควรใช้วิธีการหนึ่งเทียบกับวิธีอื่นหรือไม่ นอกจากนี้เนื่องจากคุณไม่สามารถใช้ AIC เพื่อเปรียบเทียบทั้งสองคุณเพียงแค่ต้องไปโดย RMSE, MAE เป็นต้น? ขณะนี้ฉันเพิ่งสร้างแต่ละไม่กี่และเปรียบเทียบมาตรการข้อผิดพลาด แต่ฉันไม่แน่ใจว่ามีวิธีที่ดีกว่าที่จะใช้

2
การพยากรณ์อนุกรมเวลารายชั่วโมงโดยมีรายวันรายสัปดาห์และรายปี
การแก้ไขที่สำคัญ: ฉันต้องการจะพูดขอบคุณมากสำหรับเดฟและนิคจนถึงตอนนี้สำหรับคำตอบของพวกเขา ข่าวดีก็คือฉันได้วนไปทำงาน (หลักการยืมมาจากโพสต์ของศ. Hydnman ในการพยากรณ์ชุด) ในการรวมการสืบค้นที่คงค้าง: a) ฉันจะเพิ่มจำนวนการทำซ้ำสูงสุดสำหรับ auto.arima ได้อย่างไร - ดูเหมือนว่ามีตัวแปรภายนอกจำนวนมาก auto.arima กำลังกดปุ่มการทำซ้ำสูงสุดก่อนที่จะมาบรรจบกับรุ่นสุดท้าย โปรดแก้ไขฉันหากฉันเข้าใจผิด b) หนึ่งคำตอบจาก Nick เน้นว่าการคาดคะเนของฉันสำหรับช่วงเวลารายชั่วโมงนั้นมาจากช่วงเวลารายชั่วโมงเท่านั้นและไม่ได้รับอิทธิพลจากเหตุการณ์ที่เกิดขึ้นก่อนหน้านี้ในวันนั้น สัญชาตญาณของฉันจากการจัดการกับข้อมูลนี้บอกฉันว่าสิ่งนี้ไม่ควรทำให้เกิดปัญหาสำคัญ แต่ฉันเปิดรับข้อเสนอแนะเกี่ยวกับวิธีจัดการกับสิ่งนี้ c) เดฟชี้ให้เห็นว่าฉันต้องการวิธีการที่ซับซ้อนกว่านี้ในการระบุเวลารอคอย / เวลาล่าช้าโดยรอบตัวแปรตัวทำนายของฉัน ใครบ้างมีประสบการณ์กับวิธีการเขียนโปรแกรมนี้ใน R? ฉันคาดหวังว่าจะมีข้อ จำกัด แต่ฉันต้องการใช้โครงการนี้ให้ไกลที่สุดเท่าที่จะทำได้และฉันไม่สงสัยเลยว่าสิ่งนี้จะต้องใช้กับผู้อื่นที่นี่เช่นกัน d) แบบสอบถามใหม่ แต่เกี่ยวข้องกับงานที่ทำโดยอัตโนมัติ - auto.arima พิจารณาผู้จดทะเบียนเมื่อเลือกคำสั่งซื้อหรือไม่ ฉันพยายามที่จะคาดการณ์การเข้าชมร้านค้า ฉันต้องการความสามารถในการบัญชีสำหรับวันหยุดที่เคลื่อนไหวปีอธิกสุรทินและกิจกรรมประปราย บนพื้นฐานนี้ฉันรวบรวมว่า ARIMAX เป็นทางออกที่ดีที่สุดของฉันโดยใช้ตัวแปรภายนอกเพื่อลองและจำลองแบบฤดูกาลตามฤดูกาลรวมถึงปัจจัยต่างๆดังกล่าวข้างต้น ข้อมูลจะถูกบันทึกตลอด 24 ชั่วโมงทุก ๆ ชั่วโมง นี่เป็นการพิสูจน์ว่าเป็นปัญหาเนื่องจากจำนวนศูนย์ในข้อมูลของฉันโดยเฉพาะอย่างยิ่งในช่วงเวลาของวันที่เห็นปริมาณการเข้าชมต่ำมากบางครั้งก็ไม่มีเลยเมื่อเปิดร้าน นอกจากนี้เวลาเปิดทำการค่อนข้างไม่แน่นอน นอกจากนี้เวลาในการคำนวณยังมีขนาดใหญ่มากเมื่อทำการคาดการณ์ว่าเป็นอนุกรมเวลาที่สมบูรณ์หนึ่งชุดที่มีข้อมูลย้อนหลัง …

3
ความสัมพันธ์ระหว่างอนุกรมเวลาสอง: ARIMA
เมื่อพิจารณาจากอนุกรมเวลาสองแบบต่อไปนี้ ( x , y ; ดูด้านล่าง) วิธีใดที่ดีที่สุดในการสร้างแบบจำลองความสัมพันธ์ระหว่างแนวโน้มระยะยาวในข้อมูลนี้ อนุกรมเวลาทั้งสองมีการทดสอบ Durbin-Watson อย่างมีนัยสำคัญเมื่อทำตัวเป็นแบบของเวลาและไม่หยุดนิ่ง (อย่างที่ฉันเข้าใจคำศัพท์หรือสิ่งนี้หมายความว่ามันจะต้องอยู่นิ่งในที่เหลือเท่านั้น) ฉันได้รับการบอกว่านี่หมายความว่าฉันควรจะมีความแตกต่างลำดับที่หนึ่ง (อย่างน้อยอาจลำดับที่ 2) ของแต่ละชุดเวลาก่อนที่ฉันจะสามารถจำลองแบบหนึ่งเป็นหน้าที่ของอีกฝ่ายหนึ่งโดยใช้ arima เป็นหลัก (1,1,0 ), arima (1,2,0) เป็นต้น ฉันไม่เข้าใจว่าทำไมคุณต้องทำให้เสียโฉมก่อนที่คุณจะสามารถจำลองพวกเขา ฉันเข้าใจถึงความจำเป็นในการสร้างแบบจำลองความสัมพันธ์อัตโนมัติ แต่ฉันไม่เข้าใจว่าทำไมต้องมีความแตกต่าง สำหรับฉันดูเหมือนว่าการทำลายล้างโดยการสร้างความแตกต่างคือการลบสัญญาณหลัก (ในกรณีนี้แนวโน้มระยะยาว) ในข้อมูลที่เราสนใจและปล่อยให้ "เสียง" ความถี่สูงขึ้น (โดยใช้เสียงรบกวนอย่างหลวม ๆ ) ที่จริงแล้วในสถานการณ์จำลองที่ฉันสร้างความสัมพันธ์ที่สมบูรณ์แบบเกือบระหว่างซีรีส์ครั้งหนึ่งกับอีกแบบหนึ่งโดยไม่มีการเชื่อมต่ออัตโนมัติการหาไทม์ไลน์ที่แตกต่างกันทำให้ฉันได้ผลลัพธ์ที่ตอบโต้เพื่อวัตถุประสงค์ในการตรวจจับความสัมพันธ์เช่น a = 1:50 + rnorm(50, sd = 0.01) b = a + rnorm(50, sd = …

2
วิธีใช้ auto.arima เพื่อใส่ค่าที่หายไป
ฉันมีสวนสัตว์ซีรีส์ที่มีค่าหายไปมากมาย ฉันอ่านที่auto.arimaสามารถระบุค่าที่หายไปเหล่านี้ได้หรือไม่ ทุกคนสามารถสอนฉันถึงวิธีการทำได้หรือไม่? ขอบคุณมาก! นี่คือสิ่งที่ฉันได้ลอง แต่ไม่ประสบความสำเร็จ: fit <- auto.arima(tsx) plot(forecast(fit))
12 arima 

2
การเป็นตัวแทนของพื้นที่รัฐของ ARMA (p, q) จากแฮมิลตัน
ฉันได้อ่านแฮมิลตันบทที่ 13 และเขามีตัวแทนพื้นที่ของรัฐต่อไปนี้สำหรับ ARMA (p, q) ให้นั้นกระบวนการ ARMA (p, q) จะเป็นดังนี้: \ start {aligned} y_t - \ mu & = \ phi_1 (y_ {t-1} - \ mu) + \ phi_2 (y_ {t-2} - \ mu) + ... + \ phi_3 (y_ {t-3} - \ mu) \\ & + \ epsilon_t …

3
ฟังก์ชันการแทรกแซงการถ่ายโอน ARIMA - วิธีการแสดงผล
ฉันมีชุดเวลารายเดือนที่มีการแทรกแซงและฉันต้องการที่จะหาปริมาณผลกระทบของการแทรกแซงนี้ในผล ฉันรู้ว่าซีรี่ส์ค่อนข้างสั้นและยังไม่ได้สรุปผล ข้อมูล cds <- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L, 2084L, 2031L, 2256L, 2401L, 3253L, 2881L, 2555L, 2585L, 3015L, 2608L, 3676L, 5763L, 4626L, 3848L, 4523L, 4186L, 4070L, 4000L, 3498L), .Dim=c(29L, 1L), .Dimnames=list(NULL, "CD"), .Tsp=c(2012, 2014.33333333333, 12), class="ts") วิธีการ 1) ซีรี่ส์ก่อนการแทรกแซง (จนถึงตุลาคม 2013) ถูกใช้กับauto.arimaฟังก์ชัน รูปแบบที่แนะนำคือ ARIMA …

1
ฉันควรทำอย่างไรเมื่อค่าของ AIC ต่ำและใกล้เคียงกัน?
Chris Chatfield ซึ่งมีหนังสือและเอกสารคุณภาพมากมายที่ฉันชอบอ่านใน (1) ให้คำแนะนำต่อไปนี้: ตัวอย่างเช่นควรเลือกตัวเลือกระหว่างรุ่นอนุกรมเวลาของ ARIMA ที่มีค่า AIC ต่ำและประมาณเท่ากันโดยไม่เกิดขึ้นกับ AIC ขั้นต่ำ แต่จะให้การคาดการณ์ที่ดีที่สุดสำหรับข้อมูลล่าสุดของปีที่ผ่านมา เหตุผลสำหรับคำแนะนำดังกล่าวคืออะไร? หากเป็นเสียงเหตุใดการคาดการณ์ :: auto.arima และรูทีนการพยากรณ์อื่นจึงไม่ทำตาม ยังไม่ได้ใช้งาน? มันได้รับการกล่าวถึงที่นี่ว่าจะมองหารูปแบบที่เกิดขึ้นเพียงเพื่อให้ขั้นต่ำ AIC อาจจะไม่ได้เป็นความคิดที่ดี เหตุใดตัวเลือกในการมีโมเดล ARIMA ที่มีค่าต่ำ แต่ประมาณเท่ากัน (เช่นภายใน 1 หรือ 2 ค่าของ AIC ขั้นต่ำ) ไม่ได้เป็นค่าเริ่มต้นในซอฟต์แวร์การพยากรณ์อนุกรมเวลาส่วนใหญ่n≥1n≥1n\ge1 (1) Chatfield, C. (1991) หลีกเลี่ยงข้อผิดพลาดทางสถิติ วิทยาศาสตร์สถิติ, 6 (3), 240–252 ออนไลน์ที่มีอยู่ URL: https://projecteuclid.org/euclid.ss/1177011686

3
การวิเคราะห์การแทรกแซงด้วยอนุกรมเวลาหลายมิติ
ฉันต้องการทำการวิเคราะห์การแทรกแซงเพื่อหาปริมาณผลลัพธ์ของการตัดสินใจเชิงนโยบายเกี่ยวกับการขายแอลกอฮอล์เมื่อเวลาผ่านไป อย่างไรก็ตามฉันค่อนข้างใหม่กับการวิเคราะห์อนุกรมเวลาดังนั้นฉันจึงมีคำถามเริ่มต้น จากการตรวจสอบวรรณกรรมพบว่านักวิจัยคนอื่นได้ใช้ ARIMA เพื่อจำลองการขายเครื่องดื่มแอลกอฮอล์ตามลำดับเวลาโดยมีตัวแปรหุ่นจำลองเป็นตัวแทนเพื่อจำลองผลกระทบของการแทรกแซง ในขณะที่สิ่งนี้ดูเหมือนจะเป็นวิธีการที่สมเหตุสมผล แต่ชุดข้อมูลของฉันก็ยิ่งดีกว่าที่ฉันเคยเขียนในวรรณคดี ประการแรกชุดข้อมูลของฉันถูกจำแนกตามประเภทเครื่องดื่ม (เช่นเบียร์ไวน์สุรา) แล้วแยกตามเขตภูมิศาสตร์ต่อไป ในขณะที่ฉันสามารถสร้างการวิเคราะห์ ARIMA แยกต่างหากสำหรับแต่ละกลุ่มที่ไม่ได้แยกจากกันแล้วเปรียบเทียบผลลัพธ์ แต่ฉันสงสัยว่ามีวิธีการที่ดีกว่าที่นี่ ใครบ้างที่คุ้นเคยกับข้อมูลอนุกรมเวลาหลายมิติมากขึ้นสามารถให้คำแนะนำหรือคำแนะนำได้?

1
การจำลองซีรี่ส์ ARIMA (1,1,0)
ฉันได้ติดตั้งโมเดล ARIMA กับซีรี่ส์เวลาดั้งเดิมและรุ่นที่ดีที่สุดคือ ARIMA (1,1,0) ตอนนี้ฉันต้องการจำลองซีรีส์จากโมเดลนั้น ฉันเขียนโมเดล AR (1) อย่างง่าย แต่ฉันไม่เข้าใจวิธีการปรับความแตกต่างภายในโมเดล ARI (1,1,0) รหัส R ต่อไปนี้สำหรับซีรีย์ AR (1) คือ: phi= -0.7048 z=rep(0,100) e=rnorm(n=100,0,0.345) cons=2.1 z[1]=4.1 for (i in 2:100) z[i]=cons+phi*z[i-1]+e[i] plot(ts(Y)) ฉันจะรวมคำต่าง ARI (1,1) ในรหัสข้างต้นได้อย่างไร คนใดคนหนึ่งช่วยฉันในเรื่องนี้
11 r  time-series  arima 

3
ใช้ Holt-Winters หรือ ARIMA หรือไม่
คำถามของฉันเกี่ยวกับความแตกต่างทางแนวคิดระหว่าง Holt-Winters และ ARIMA เท่าที่ฉันเข้าใจ Holt-Winters เป็นกรณีพิเศษของ ARIMA แต่เมื่อไรที่อัลกอริทึมหนึ่งต้องการมากกว่าอีกอันหนึ่ง? บางทีโฮลท์ - วินเทอร์เป็นแบบเพิ่มขึ้นดังนั้นจึงทำหน้าที่เป็นอัลกอริทึมแบบอินไลน์ (เร็วกว่า)? รอคอยที่จะเข้าใจบางอย่างที่นี่

1
การทำความเข้าใจสูตรที่แตกต่างแบบเศษส่วน
ฉันมีอนุกรมเวลาและฉันต้องการจำลองเป็นกระบวนการ ARFIMA (aka FARIMA) หากถูกรวมกับคำสั่ง (เศษส่วน)ฉันต้องการแยกความแตกต่างเล็กน้อยเพื่อทำให้เป็นแบบนิ่งytyty_tytyty_tddd คำถาม : สูตรต่อไปนี้กำหนดความแตกต่างของเศษส่วนถูกต้องหรือไม่ ΔdYเสื้อ: =Yเสื้อ- dYt - 1+d( d- 1 )2 !Yt - 2-d( d- 1 ) ( d- 2 )3 !Yt - 3+ . . . + ( - 1)k + 1d( d- 1 ) ⋅ . . ⋅ ( d- k )k …

2
ใช้โมเดล ARMA-GARCH เพื่อจำลองราคาแลกเปลี่ยนเงินตราต่างประเทศ
ฉันได้ติดตั้งแบบจำลอง ARIMA (1,1,1) -GARCH (1,1) เข้ากับช่วงเวลาของราคาบันทึกอัตราแลกเปลี่ยน AUD / USD ที่สุ่มตัวอย่างเป็นระยะเวลาหนึ่งนาทีตลอดระยะเวลาหลายปีทำให้ฉันมากกว่าสองปี ล้านจุดข้อมูลที่จะประเมินรูปแบบ ชุดข้อมูลที่สามารถใช้ได้ที่นี่ เพื่อความชัดเจนนี่เป็นรูปแบบ ARMA-GARCH ที่ติดตั้งเพื่อส่งคืนบันทึกเนื่องจากการรวมราคาบันทึกครั้งแรก ซีรี่ส์เวลา AUD / USD ดั้งเดิมมีลักษณะดังนี้: จากนั้นฉันพยายามจำลองอนุกรมเวลาตามโมเดลที่ติดตั้งให้ฉันดังนี้: ฉันคาดหวังและต้องการอนุกรมเวลาที่จำลองมานั้นจะแตกต่างจากซีรี่ส์ดั้งเดิม แต่ฉันไม่ได้คาดหวังว่าจะมีความแตกต่างที่มีนัยสำคัญ โดยเนื้อแท้แล้วฉันต้องการให้ซีรีย์ที่จำลองขึ้นมีลักษณะหรือกว้างเหมือนต้นฉบับ นี่คือรหัส R ที่ฉันใช้ประเมินโมเดลและจำลองซีรีย์: library(rugarch) rows <- nrow(data) data <- (log(data[2:rows,])-log(data[1:(rows-1),])) spec <- ugarchspec(variance.model = list(model = "sGARCH", garchOrder = c(1, 1)), mean.model = list(armaOrder = c(1, …

3
วิธีอ่าน p, d และ q ของ auto.arima () อย่างไร
ฉันจะรับp,d and qค่าในARIMA(p,d,q)แบบจำลองโดยประมาณได้auto.arima(mytimeseries)อย่างไร arima_model <- auto.arima (mytimeseries, ic = 'bic') ถ้าเราดูผลลัพธ์ของ arima_model $ ARMA เราได้รับ, [1] 1 0 0 0 1 2 0 ความหมายของตัวเลขที่ปรากฏในลำดับข้างต้นคืออะไร?
10 r  arima 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.