คำถามติดแท็ก forecasting

การทำนายเหตุการณ์ในอนาคต มันเป็นกรณีพิเศษของ [การทำนาย] ในบริบทของ [อนุกรมเวลา]

3
AIC กับการตรวจสอบความถูกต้องข้ามในอนุกรมเวลา: กรณีตัวอย่างขนาดเล็ก
ฉันสนใจในการเลือกรูปแบบในการตั้งค่าอนุกรมเวลา เพื่อความเป็นรูปธรรมสมมติว่าฉันต้องการเลือกรุ่น ARMA จากกลุ่มของรุ่น ARMA ที่มีคำสั่งซื้อล่าช้าต่างกัน สุดยอดความตั้งใจคือการคาดการณ์ การเลือกรุ่นสามารถทำได้โดย การตรวจสอบข้าม การใช้เกณฑ์ข้อมูล (AIC, BIC) ท่ามกลางวิธีอื่น ๆ ร็อบเจ Hyndman มีวิธีการทำการตรวจสอบข้ามอนุกรมเวลา สำหรับตัวอย่างที่มีขนาดค่อนข้างเล็กขนาดของตัวอย่างที่ใช้ในการตรวจสอบความถูกต้องไขว้อาจมีคุณภาพแตกต่างจากขนาดตัวอย่างดั้งเดิม ตัวอย่างเช่นหากขนาดตัวอย่างดั้งเดิมคือ 200 การสังเกตดังนั้นใครจะคิดว่าจะเริ่มการตรวจสอบข้ามโดยการสังเกต 101 ครั้งแรกและขยายหน้าต่างเป็น 102, 103, ... , 200 การสังเกตเพื่อให้ได้ 100 ผลการตรวจสอบข้าม เห็นได้ชัดว่าแบบจำลองที่มีเหตุผลพอสมควรสำหรับการสังเกต 200 ครั้งอาจใหญ่เกินไปสำหรับการสังเกต 100 ครั้งดังนั้นข้อผิดพลาดในการตรวจสอบจะมีขนาดใหญ่ ดังนั้นการตรวจสอบข้ามจึงมีแนวโน้มที่จะสนับสนุนรูปแบบที่ไม่สุภาพ นี่คือผลกระทบที่ไม่พึงประสงค์เกิดจากการไม่ตรงกันในขนาดตัวอย่าง ทางเลือกอื่นในการตรวจสอบข้ามคือการใช้เกณฑ์ข้อมูลสำหรับการเลือกแบบจำลอง เนื่องจากฉันสนใจเกี่ยวกับการคาดการณ์ฉันจะใช้ AIC ถึงแม้ว่า AIC นั้นจะเทียบเท่ากับ asymptotically ในการลดการคาดการณ์ MSE แบบขั้นตอนเดียวให้น้อยที่สุดสำหรับแบบจำลองอนุกรมเวลา (อ้างอิงจาก Rob …

1
วิธีการสลายอนุกรมเวลาที่มีองค์ประกอบตามฤดูกาลหลายรายการ
ฉันมีอนุกรมเวลาที่มีส่วนประกอบตามฤดูกาลสองเท่าและฉันต้องการแยกส่วนประกอบออกเป็นส่วนประกอบอนุกรมเวลาดังต่อไปนี้ (แนวโน้มองค์ประกอบตามฤดูกาล 1 องค์ประกอบตามฤดูกาล 2 และองค์ประกอบผิดปกติ) เท่าที่ฉันทราบขั้นตอน STL สำหรับการแยกย่อยซีรีย์ใน R อนุญาตเพียงหนึ่งองค์ประกอบตามฤดูกาลดังนั้นฉันจึงลองย่อยสลายซีรีส์สองครั้ง ขั้นแรกโดยการตั้งค่าความถี่ให้เป็นองค์ประกอบตามฤดูกาลแรกโดยใช้รหัสต่อไปนี้: ser = ts(data, freq=48) dec_1 = stl(ser, s.window="per") จากนั้นฉันแยกส่วนประกอบที่ผิดปกติของซีรี่ส์ที่ย่อยสลาย ( dec_1) โดยการตั้งค่าความถี่ให้เป็นองค์ประกอบตามฤดูกาลที่สองเช่น: ser2 = ts(dec_1$time.series[,3], freq=336) dec_2 = stl(ser2, s.window="per") ฉันไม่มั่นใจกับวิธีนี้มากนัก และฉันอยากรู้ว่ามีวิธีอื่นใดในการย่อยสลายซีรีส์ที่มีหลายฤดูกาล นอกจากนี้ฉันได้สังเกตเห็นว่าtbats()ฟังก์ชั่นในแพ็คเกจการคาดการณ์ R ช่วยให้ผู้ใช้สามารถปรับโมเดลให้เหมาะกับซีรี่ส์ที่มีหลายฤดูกาลได้ แต่ก็ไม่ได้บอกว่าจะสลายซีรีย์ด้วย

2
การแปลความหมายของข้อผิดพลาดแบบมาตราส่วนค่าเฉลี่ย (MASE)
Mean แน่นอนข้อผิดพลาดที่ปรับขนาด (MASE) เป็นตัวชี้วัดของความถูกต้องคาดการณ์ที่เสนอโดยซานโตสและ Hyndman (2006) MSE= MEMEฉันn - s a m p l e ,n a i v eMASE=MAEMAEผมn-saม.พีล.อี,naผมโวลต์อีMASE=\frac{MAE}{MAE_{in-sample, \, naive}} โดยที่คือข้อผิดพลาดแบบสัมบูรณ์ที่เกิดจากการคาดการณ์จริง ในขณะที่เป็นข้อผิดพลาดแบบสัมบูรณ์ที่เกิดจากการคาดการณ์ไร้เดียงสา (เช่นไม่มีการเปลี่ยนแปลงการคาดการณ์สำหรับอนุกรมเวลา ) ซึ่งคำนวณจากข้อมูลในตัวอย่างM E ฉันn - s มพีลิตรอี,MEMAEMAE I(1)MEฉันn - s a m p l e ,n a i v eMAEผมn-saม.พีล.อี,naผมโวลต์อีMAE_{in-sample, \, naive}ผม( 1 )ผม(1)I(1) (ตรวจสอบกระดาษKoehler …

1
ฉันจะทำนายค่าจากอินพุตใหม่ของโมเดลเชิงเส้นใน R ได้อย่างไร?
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันได้สร้างโมเดลเชิงเส้นตรงใน mod = lm(train_y ~ train_x)R: ฉันต้องการส่งรายการของ X และรับการคาดการณ์ / ประเมิน / คาดการณ์ Y ฉันดูpredict()แต่ฉันคิดว่ามันมีไว้สำหรับอย่างอื่นหรือฉันไม่รู้ว่าจะใช้มันอย่างไร ฉันคาดเดาด้วยการใช้สัมประสิทธิ์ของแบบจำลองของฉันฉันสามารถปลั๊กอินตัวแปร test_x แบบตัวต่อตัวและทำนายค่า Y ได้ แต่ฉันเดาว่าจะมีวิธีที่มีประสิทธิภาพมากกว่านี้

6
นักอุตุนิยมวิทยาของฉันถูกต้องหรือไม่?
คำถามที่รบกวนฉันในบางครั้งซึ่งฉันไม่รู้วิธีการแก้ไข: ทุกวันนักอุตุนิยมวิทยาของฉันให้โอกาสเปอร์เซ็นต์ฝนตก (สมมติว่าคำนวณเป็นตัวเลข 9000 และเขาไม่เคยซ้ำตัวเลข) ทุกวันต่อมาฝนหรือฝนไม่ตก ฉันมีข้อมูลหลายปี - โอกาสที่จะเกิดฝนหรือไม่ จากประวัติศาสตร์ของนักอุตุนิยมวิทยานี้ถ้าเขาบอกว่าคืนนี้โอกาสในวันพรุ่งนี้ของฝนคือ X แล้วสิ่งที่ฉันคาดเดาได้ดีที่สุดว่าโอกาสฝนตกจริงๆคืออะไร?

2
ทำไมการย่อขนาดแม่ให้เล็กที่สุดนำไปสู่การคาดการณ์ค่ามัธยฐานไม่ใช่ค่าเฉลี่ย?
จากการพยากรณ์: หลักการและแบบฝึกหัดโดย Rob J Hyndman และ George Athanasopoulosโดยเฉพาะในส่วนของการวัดความแม่นยำ : วิธีการพยากรณ์ที่ย่อขนาดเล็กที่สุดจะนำไปสู่การคาดการณ์ของค่ามัธยฐานในขณะที่การลด RMSE จะนำไปสู่การคาดการณ์ค่าเฉลี่ย บางคนสามารถให้คำอธิบายที่เข้าใจง่ายว่าทำไมการย่อขนาดแม่ให้เล็กที่สุดนำไปสู่การคาดคะเนค่ามัธยฐานไม่ใช่ค่าเฉลี่ย? และนี่หมายถึงอะไรในทางปฏิบัติ ฉันได้ถามลูกค้า: "สิ่งที่สำคัญกว่าสำหรับคุณคือการคาดการณ์หมายถึงแม่นยำยิ่งขึ้นหรือเพื่อหลีกเลี่ยงการคาดการณ์ที่ไม่ถูกต้องมาก" เขาบอกว่าการคาดหมายที่แม่นยำยิ่งกว่านั้นจะมีลำดับความสำคัญสูงกว่า ดังนั้นในกรณีนี้ฉันควรใช้ Mae หรือ RMSE หรือไม่ ก่อนที่ฉันจะอ่านหนังเรื่องนี้ฉันเชื่อว่าแม่จะดีขึ้นสำหรับเงื่อนไขดังกล่าว และตอนนี้ฉันสงสัย
19 forecasting  mean  median  rms  mae 

3
จะบอกได้อย่างไรว่าแฟนสามารถบอกอนาคต (เช่นทำนายสต๊อก)?
แฟนของฉันเพิ่งได้งานขายและการซื้อขายที่ธนาคารใหญ่ จากงานใหม่ของเธอเธอเชื่อว่าเธอสามารถทำนายได้ว่าหุ้นจะขึ้นหรือลงในช่วงสิ้นเดือนที่ยิ่งใหญ่กว่าโอกาส (เธอเชื่อว่าเธอสามารถทำได้ด้วยความแม่นยำ 80%!) ฉันสงสัยมาก เราได้ตกลงที่จะทำการทดสอบที่เธอจะเลือกจำนวนหุ้นและในเวลาที่กำหนดไว้เราจะตรวจสอบว่าพวกเขาจะขึ้นหรือลง คำถามของฉันคือ: เธอจะต้องเลือกหุ้นจำนวนเท่าไหร่และเธอจะต้องทำให้ถูกต้องเพื่อที่จะมีพลังทางสถิติเพียงพอที่จะบอกด้วยความมั่นใจว่าเธอสามารถทำนายหุ้นได้อย่างแม่นยำ? ตัวอย่างเช่นเธอจะเลือกหุ้นกี่หุ้นเพื่อบอกด้วยความมั่นใจ 95% ว่าเธอเลือกหุ้นที่มีความแม่นยำ 80% แก้ไข: สำหรับการทดสอบที่เราเห็นด้วยเธอไม่จำเป็นต้องคาดเดาว่าหุ้นจะขึ้นหรือลงเท่าไร แต่จะขึ้นหรือลงเท่านั้น

3
เราจะตัดสินความแม่นยำของการทำนายของ Nate Silver ได้อย่างไร
ประการแรกเขาให้ความน่าจะเป็นของผลลัพธ์ ตัวอย่างเช่นการคาดการณ์ของเขาสำหรับการเลือกตั้งสหรัฐปัจจุบัน 82% คลินตันเทียบกับ 18% ทรัมป์ ตอนนี้ถึงแม้ว่าทรัมป์ชนะฉันจะรู้ได้อย่างไรว่าไม่ใช่แค่ 18% ของเวลาที่เขาควรจะชนะ ปัญหาอื่นคือความน่าจะเป็นของเขาเปลี่ยนไปตามกาลเวลา ดังนั้นในวันที่ 31 กรกฎาคมมันเกือบ 50-50 ระหว่างทรัมป์และคลินตัน คำถามของฉันคือเนื่องจากเขามีโอกาสที่แตกต่างกันทุกวันสำหรับเหตุการณ์ในอนาคตเดียวกันกับผลลัพธ์เดียวกันฉันจะวัดความแม่นยำของเขาในแต่ละวันได้อย่างไรว่าเขาจะทำนายตามข้อมูลที่มีอยู่ในวันนั้นหรือไม่

3
วิธีใช้ DLM พร้อมตัวกรอง Kalman สำหรับการคาดการณ์
มีคนแนะนำฉันผ่านตัวอย่างเกี่ยวกับวิธีใช้ตัวกรอง DLM Kalman ใน R ในอนุกรมเวลา บอกว่าฉันมีค่าเหล่านี้ (ค่ารายไตรมาสที่มีฤดูกาลประจำปี); คุณจะใช้ DLM เพื่อทำนายค่าต่อไปอย่างไร และ BTW ฉันมีข้อมูลในอดีตเพียงพอหรือไม่ 89 2009Q1 82 2009Q2 89 2009Q3 131 2009Q4 97 2010Q1 94 2010Q2 101 2010Q3 151 2010Q4 100 2011Q1 ? 2011Q2 ฉันกำลังมองหาคำตอบแบบทีละขั้นตอนสำหรับวิธีทำทีละขั้นตอน ความแม่นยำในการทำนายไม่ใช่เป้าหมายหลักของฉันฉันแค่ต้องการเรียนรู้ลำดับของรหัสที่ให้ตัวเลขสำหรับไตรมาสที่ 2 ปี 2011 ถึงแม้ว่าฉันจะมีข้อมูลไม่เพียงพอ

2
วิธีการพยากรณ์ VAR
ฉันกำลังสร้างแบบจำลอง VAR เพื่อคาดการณ์ราคาของสินทรัพย์และต้องการทราบว่าวิธีการของฉันดีขึ้นหรือไม่ไม่ว่าการทดสอบที่ฉันได้รวมไว้นั้นมีความเกี่ยวข้องหรือไม่และจำเป็นต้องมีอีกหรือไม่ ด้านล่างนี้เป็นกระบวนการปัจจุบันของฉันเพื่อตรวจสอบหาสาเหตุของเกรนเจอร์และคาดการณ์รูปแบบ VAR ที่เลือก require("forecast") require("vars") #Read Data da=read.table("VARdata.txt", header=T) dac <- c(2,3) # Select variables x=da[,dac] plot.ts(x) summary(x) #Run Augmented Dickey-Fuller tests to determine stationarity and differences to achieve stationarity. ndiffs(x[, "VAR1"], alpha = 0.05, test = c("adf")) ndiffs(x[, "VAR2"], alpha = 0.05, test = c("adf")) #Difference …
19 r  forecasting  modeling  var 

1
ความขัดแย้งในการเลือกรูปแบบ (AIC, BIC, เพื่ออธิบายหรือทำนาย)
หลังจากอ่าน Galit Shmueli "เพื่ออธิบายหรือทำนาย" (2010) ฉันรู้สึกสับสนกับความขัดแย้งที่เห็นได้ชัด มีสามสถานที่ AIC- เมื่อเทียบกับ BIC ตามทางเลือกรูปแบบ (ในตอนท้ายของหน้า 300 - จุดเริ่มต้นของ P 301..) ใส่เพียง AIC ควรจะใช้สำหรับการเลือกรูปแบบที่มีไว้สำหรับการคาดการณ์ในขณะที่ BIC ควรจะใช้สำหรับการเลือกรูปแบบการหาคำอธิบาย นอกจากนี้ (ไม่ใช่ในกระดาษด้านบน) เรารู้ว่าภายใต้เงื่อนไขบางอย่าง BIC เลือกรูปแบบที่แท้จริงในชุดของแบบจำลองที่มีตัวเลือก; รูปแบบที่แท้จริงคือสิ่งที่เราแสวงหาในการสร้างแบบจำลองที่อธิบาย (ตอนท้ายของหน้า 293) Simple arithmetics: AIC จะเลือกแบบจำลองที่มีขนาดใหญ่กว่า BIC สำหรับตัวอย่างที่มีขนาด 8 หรือใหญ่กว่า (ที่น่าพอใจln(n)>2ln(n)>2\text{ln}(n)>2เนื่องจากการปรับความซับซ้อนแตกต่างกันใน AIC กับ BIC) "true"รูปแบบ (เช่นรุ่นที่มี regressors ที่ถูกต้องและรูปแบบการทำงานที่ถูกต้อง แต่ค่าสัมประสิทธิ์ประมาณไม่สมบูรณ์) อาจจะไม่เป็นแบบที่ดีที่สุดในการทำนาย (หน้า 307.) …

1
, จำลองสถานการณ์ในช่วงการพยากรณ์
ฉันมีข้อมูลอนุกรมเวลาและฉันใช้เป็นโมเดลเพื่อให้พอดีกับข้อมูล เอ็กซ์ทีเป็นตัวบ่งชี้ตัวแปรสุ่มที่เป็นทั้ง 0 (เมื่อฉันไม่เห็นเหตุการณ์ที่ยาก) หรือ 1 (เมื่อฉันเห็นเหตุการณ์ที่หายาก) จากการสังเกตก่อนหน้านี้ที่ฉันมีสำหรับX tฉันสามารถพัฒนาแบบจำลองสำหรับX tโดยใช้วิธีการแบบ Variable Length Markov Chain สิ่งนี้ทำให้ฉันสามารถจำลองX tตลอดช่วงเวลาการพยากรณ์และให้ลำดับของศูนย์และอัน เนื่องจากนี่เป็นเหตุการณ์ที่หายากฉันจะไม่เห็นARIMA(p,d,q)+XtARIMA(p,d,q)+XtARIMA(p,d,q)+X_tXtXtX_tXtXtX_tXtXtX_tXtXtX_tXt=1Xt=1X_t=1 บ่อยครั้ง ฉันสามารถคาดการณ์และได้รับการคาดการณ์ช่วงเวลาที่อยู่บนพื้นฐานของค่าจำลองสำหรับที XtXtX_t คำถาม: ฉันจะพัฒนาขั้นตอนการจำลองที่มีประสิทธิภาพที่จะคำนึงถึงการเกิดขึ้นของ 1 ในจำลองในช่วงคาดการณ์หรือไม่ ฉันต้องได้รับค่าเฉลี่ยและช่วงการพยากรณ์ XtXtX_t ความน่าจะเป็นของการสังเกต 1 นั้นน้อยเกินไปสำหรับฉันที่จะคิดว่าการจำลองแบบมอนติคาร์โลปกติจะทำงานได้ดีในกรณีนี้ บางทีฉันสามารถใช้“ การสุ่มตัวอย่างที่สำคัญ” แต่ฉันไม่แน่ใจอย่างแน่นอน ขอขอบคุณ.

1
Stepwise AIC - มีข้อโต้แย้งรอบ ๆ หัวข้อนี้หรือไม่?
ฉันได้อ่านโพสต์นับไม่ถ้วนในเว็บไซต์นี้ซึ่งต่อต้านการเลือกตัวแปรแบบขั้นตอนโดยใช้เกณฑ์ใด ๆ ไม่ว่าจะเป็นค่า p ตาม AIC, BIC เป็นต้น ฉันเข้าใจว่าทำไมขั้นตอนเหล่านี้โดยทั่วไปค่อนข้างยากจนสำหรับการเลือกตัวแปร โพสต์ที่มีชื่อเสียงอาจเป็นของ gung ที่นี่แสดงให้เห็นอย่างชัดเจนว่าทำไม; ท้ายที่สุดเรากำลังตรวจสอบสมมติฐานบนชุดข้อมูลเดียวกับที่เราเคยทำกับสมมติฐานซึ่งเป็นเพียงการขุดลอกข้อมูล นอกจากนี้ค่า p จะได้รับผลกระทบจากปริมาณเช่น collinearity และค่าผิดปกติซึ่งทำให้ผลลัพธ์เบ้หนักเป็นต้น แต่ผมได้รับการศึกษาการพยากรณ์อนุกรมเวลาไม่น้อยเมื่อเร็ว ๆ นี้และได้เจอตำรานับหน้าถือตา Hyndman ของที่เขากล่าวถึงที่นี่ใช้ตัวเลือกแบบขั้นตอนที่จะหาคำสั่งซื้อที่เหมาะสมของแบบจำลอง ARIMA โดยเฉพาะอย่างยิ่ง ในความเป็นจริงในforecastแพคเกจใน R อัลกอริทึมที่รู้จักกันดีที่รู้จักกันเป็นauto.arimaค่าเริ่มต้นใช้การเลือกแบบขั้นตอน (กับ AIC ไม่ใช่ค่า p) นอกจากนี้เขายังวิจารณ์การเลือกคุณสมบัติตามค่า p ซึ่งสอดคล้องกับโพสต์หลายรายการในเว็บไซต์นี้ ในที่สุดเราควรข้ามการตรวจสอบในบางวิธีในตอนท้ายถ้าเป้าหมายคือการพัฒนาแบบจำลองที่ดีสำหรับการพยากรณ์ / การทำนาย อย่างไรก็ตามแน่นอนว่านี่เป็นสิ่งที่ไม่เห็นด้วยที่นี่เมื่อพูดถึงขั้นตอนการประเมินตัวชี้วัดอื่น ๆ นอกเหนือจากค่า p ไม่มีใครมีความคิดเห็นใด ๆ เกี่ยวกับการใช้ AIC แบบขั้นตอนในบริบทนี้ แต่โดยทั่วไปยังอยู่นอกบริบทนี้ด้วย ฉันได้รับการสอนให้เชื่อว่าการเลือกตามขั้นตอนใด ๆ …

5
การล้างข้อมูลสามารถทำให้ผลการวิเคราะห์เชิงสถิติแย่ลงได้หรือไม่?
การเพิ่มจำนวนผู้ป่วยและการเสียชีวิตเกิดขึ้นในช่วงที่มีการระบาดของโรค (เพิ่มจำนวนขึ้นอย่างกะทันหัน) เนื่องจากการไหลเวียนของไวรัส (เช่น West Nile Virus ในสหรัฐอเมริกาในปี 2545) หรือลดความต้านทานของผู้คนหรือการปนเปื้อนของอาหารหรือน้ำ ยุง โรคระบาดเหล่านี้จะปรากฏเป็นค่าผิดปกติซึ่งสามารถเกิดขึ้นได้ทุก 1 ถึง 5 ปี การลบค่าผิดปกติเหล่านี้ทำให้เราลบหลักฐานการระบาดซึ่งเป็นส่วนสำคัญในการพยากรณ์และการทำความเข้าใจเกี่ยวกับโรค การทำความสะอาดข้อมูลจำเป็นหรือไม่เมื่อต้องรับมือกับผู้ผิดที่เกิดจากโรคระบาด? มันจะปรับปรุงผลลัพธ์หรือทำให้แย่ลงจากการวิเคราะห์ทางสถิติ?

2
เป็นไปได้ไหมที่จะทำการพยากรณ์อนุกรมเวลาโดยอัตโนมัติ
ฉันต้องการสร้างอัลกอริทึมที่สามารถวิเคราะห์อนุกรมเวลาใด ๆ และ "อัตโนมัติ" เลือกวิธีการพยากรณ์แบบดั้งเดิม / สถิติที่ดีที่สุด (และพารามิเตอร์) สำหรับข้อมูลอนุกรมเวลาที่วิเคราะห์ เป็นไปได้ไหมที่จะทำอะไรแบบนี้ ถ้าใช่คุณสามารถให้คำแนะนำกับฉันเกี่ยวกับวิธีการนี้ได้หรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.