คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

2
ขั้นตอนและวิธีวิเคราะห์ Timeseries โดยใช้ R
ฉันกำลังทำงานในโครงการขนาดเล็กที่เราพยายามคาดการณ์ราคาสินค้า (น้ำมันอลูมิเนียมดีบุก ฯลฯ ) ในอีก 6 เดือนข้างหน้า ฉันมีตัวแปรดังกล่าว 12 ตัวที่จะทำนายและฉันมีข้อมูลตั้งแต่ เม.ย. 2551 - พ.ค. 2556 ฉันจะทำนายอย่างไรดี? ฉันทำสิ่งต่อไปนี้แล้ว: นำเข้าข้อมูลเป็นชุดข้อมูล Timeseries ฤดูกาลทั้งหมดของตัวแปรมีแนวโน้มที่จะแปรผันตามเทรนด์ดังนั้นฉันจะเป็นแบบจำลองแบบคูณ ฉันนำ log ของตัวแปรมาแปลงเป็นสารเติมแต่ง สำหรับแต่ละตัวแปรที่ย่อยสลายข้อมูลโดยใช้ STL ฉันวางแผนที่จะใช้การทำให้เรียบแบบเลขชี้กำลังของโฮลท์วินเทอร์ ARIMA และโครงข่ายใยประสาทเทียมในการคาดการณ์ ฉันแบ่งข้อมูลเป็นการฝึกอบรมและทดสอบ (80, 20) วางแผนที่จะเลือกรุ่นที่มีแม่, MPE, MAPE และ MASE น้อยลง ฉันทำถูกไหม? อีกคำถามหนึ่งที่ฉันเคยมีก่อนที่จะส่งต่อไปยัง ARIMA หรือโครงข่ายประสาทฉันควรทำให้ข้อมูลราบรื่นหรือไม่? ถ้าใช่ใช้อะไร? ข้อมูลแสดงทั้งฤดูกาลและแนวโน้ม แก้ไข: การแนบพล็อตชุดข้อมูลและข้อมูล Year <- c(2008, 2008, 2008, …

1
ทดสอบ cointegration ระหว่างอนุกรมเวลาสองชุดโดยใช้ Engle – Granger วิธีสองขั้นตอน
ฉันพยายามที่จะทดสอบ cointegration ระหว่างสองชุดเวลา ทั้งสองซีรี่ส์มีข้อมูลครอบคลุมทุกสัปดาห์ ~ 3 ปี ฉันกำลังพยายามทำวิธีสองขั้นตอนของ Engle-Granger คำสั่งของฉันของการดำเนินการดังต่อไปนี้ ทดสอบแต่ละชุดเวลาสำหรับรูทยูนิตผ่าน Augmented Dickey-Fuller สมมติว่าทั้งคู่มีรูทหน่วยจากนั้นหาการประมาณเชิงเส้นตรงของความสัมพันธ์ผ่าน OLS จากนั้นสร้างชุดของส่วนที่เหลือ ทดสอบส่วนที่เหลือสำหรับรูทยูนิตผ่าน Augmented Dickey-Fuller สรุป cointegration (หรือไม่) โดยผลของ 3 คำถาม: วิธีนี้ดูใช้ได้ไหม? (ฉันเป็นระดับปริญญาตรีและฉันกำลังมองหาการวิเคราะห์ข้อมูลของฉันในแบบที่ถูกต้องไม่จำเป็นต้องวิเคราะห์ข้อมูลด้วยวิธีการที่เข้มงวดที่สุด) หากชุดหนึ่งไม่สามารถปฏิเสธสมมติฐานว่างด้วย ADF (และดังนั้นจึงไม่มีหน่วยรูท) ในขั้นตอนที่ 1 มีเหตุผลหรือไม่ที่จะสรุปว่าทั้งสองชุดไม่ได้ถูกรวมเข้าด้วยกันเพราะชุดข้อมูลหนึ่งไม่ใช่ชุดข้อมูล? ฉันจะไม่คิดอย่างนั้น แต่ฉันต้องการให้แน่ใจ ชุดข้อมูลทั้งสองมีลักษณะ "สุ่ม" ดังนั้นฉันจึงสงสัยว่าเหมาะสมหรือไม่ที่จะใช้ OLS เพื่อวัดความสัมพันธ์เพื่อรับส่วนที่เหลือ

3
ค่าเบี่ยงเบนมาตรฐานของการวัดหลายครั้งพร้อมความไม่แน่นอน
ฉันมีข้อมูล GPS สองชั่วโมงสองชั่วโมงด้วยอัตราการสุ่มตัวอย่าง 1 Hz (การวัด 7200) ข้อมูลจะได้รับในรูปแบบโดยที่คือความไม่แน่นอนในการวัด(X,Xσ,Y,Yσ,Z,Zσ)(X,Xσ,Y,Yσ,Z,Zσ)(X, X_\sigma, Y, Y_\sigma, Z, Z_\sigma)NσNσN_\sigma เมื่อฉันใช้ค่าเฉลี่ยของการวัดทั้งหมด (เช่นค่า Z เฉลี่ยของสองชั่วโมงนั้น) ค่าเบี่ยงเบนมาตรฐานคืออะไร? แน่นอนว่าฉันสามารถคำนวณค่าเบี่ยงเบนมาตรฐานจากค่า Z ได้ แต่จากนั้นฉันก็เพิกเฉยต่อความจริงที่ว่ามีความไม่แน่นอนในการวัดที่รู้จัก ... แก้ไข: ข้อมูลทั้งหมดมาจากสถานีเดียวกันและพิกัดทั้งหมดจะถูกคำนวณใหม่ทุกวินาที เนื่องจากกลุ่มดาวบริวาร ฯลฯ ทุกการวัดมีความไม่แน่นอนที่แตกต่างกัน จุดประสงค์ของการวิเคราะห์ของฉันคือการค้นหาการกระจัดเนื่องจากเหตุการณ์ภายนอก (เช่นแผ่นดินไหว) ฉันต้องการที่จะใช้ค่าเฉลี่ยสำหรับการวัด 7200 (2h) ก่อนเกิดแผ่นดินไหวและค่าเฉลี่ยอีก 2h หลังจากเกิดแผ่นดินไหวจากนั้นคำนวณความแตกต่างที่เกิดขึ้น (เช่นความสูง) ในการระบุค่าเบี่ยงเบนมาตรฐานของความแตกต่างนี้ฉันต้องรู้ค่าเบี่ยงเบนมาตรฐานของทั้งสองค่านี้

2
ARIMA vs ARMA ในซีรี่ส์ที่ต่างกัน
ใน R (2.15.2) ฉันติดตั้ง ARIMA หนึ่งครั้ง (3,1,3) ในอนุกรมเวลาหนึ่งครั้งและ ARMA (3,3) หนึ่งครั้งในช่วงเวลาที่ต่างกัน พารามิเตอร์ที่ติดตั้งแตกต่างกันซึ่งฉันอ้างถึงวิธีการติดตั้งใน ARIMA นอกจากนี้การติดตั้ง ARIMA (3,0,3) ในข้อมูลเดียวกันกับ ARMA (3,3) จะไม่ส่งผลให้มีพารามิเตอร์เหมือนกันไม่ว่าวิธีการฟิตติ้งที่ฉันใช้จะเป็นอย่างไร ฉันสนใจที่จะระบุว่าความแตกต่างนั้นมาจากไหนและด้วยพารามิเตอร์ใดที่ฉันสามารถทำได้ (ถ้าหากทั้งหมด) พอดีกับ ARIMA เพื่อให้ได้ค่าสัมประสิทธิ์ของความพอดีเหมือนกับ ARMA รหัสตัวอย่างที่จะสาธิต: library(tseries) set.seed(2) #getting a time series manually x<-c(1,2,1) e<-c(0,0.3,-0.2) n<-45 AR<-c(0.5,-0.4,-0.1) MA<-c(0.4,0.3,-0.2) for(i in 4:n){ tt<-rnorm(1) t<-x[length(x)]+tt+x[i-1]*AR[1]+x[i-2]*AR[2]+x[i-3]*AR[3]+e[i-1]*MA[1]+e[i-2]*MA[2]+e[i-3]*MA[3] x<-c(x,t) e<-c(e,tt) } par(mfrow=c(2,1)) plot(x) plot(diff(x,1)) …
13 r  time-series  arima  fitting  arma 

4
มีการระบุรูปแบบโดย auto.arima () อย่างชัดเจนไหม?
ฉันพยายามเรียนรู้และนำแบบจำลอง ARIMA มาใช้ ฉันได้อ่านข้อความยอดเยี่ยมเกี่ยวกับ ARIMA โดย Pankratz - การพยากรณ์ด้วย Univariate Box - โมเดลเจนกินส์: แนวคิดและคดีต่างๆ ในข้อความที่ผู้เขียนเน้นเป็นพิเศษในการเลือกรูปแบบ ARIMA ผมเริ่มเล่นกับauto.arima()ฟังก์ชั่นในRแพคเกจการคาดการณ์ นี่คือสิ่งที่ผมทำผมจำลอง ARIMA auto.arima()และนำไปใช้แล้ว ด้านล่างเป็น 2 ตัวอย่าง อย่างที่คุณเห็นในตัวอย่างทั้งสองauto.arima()ระบุรูปแบบที่ชัดเจนว่าหลายคนอาจมองว่าไม่ใช้คำพูด โดยเฉพาะอย่างยิ่งในตัวอย่างที่ 2 ซึ่งauto.arima()ระบุ ARIMA (3,0,3) เมื่อจริง ๆ แล้ว ARIMA (1,0,1) น่าจะเพียงพอแล้ว ด้านล่างเป็นคำถามของฉัน ฉันขอขอบคุณข้อเสนอแนะและคำแนะนำใด ๆ มีคำแนะนำใดบ้างในการใช้ / แก้ไขโมเดลที่ระบุโดยใช้อัลกอริทึมอัตโนมัติเช่นauto.arima()? มีหลุมใดที่ใช้เพียง AIC (ซึ่งเป็นสิ่งที่ฉันคิดว่าauto.arima()ใช้) เพื่อระบุรูปแบบ? อัลกอริทึมอัตโนมัติที่สร้างขึ้นนั้นสามารถใช้จองหรือไม่? โดยวิธีที่ฉันใช้auto.arima()เป็นเพียงตัวอย่าง สิ่งนี้จะนำไปใช้กับอัลกอริทึมอัตโนมัติใด ๆ ด้านล่างคือตัวอย่าง …

3
การเปลี่ยนแปลงอัตโนมัติของกระบวนการ ARMA (2,1) - ได้รับแบบจำลองการวิเคราะห์สำหรับ
ฉันต้องได้รับนิพจน์การวิเคราะห์สำหรับฟังก์ชัน autocovarianceของกระบวนการ ARMA (2,1) แสดงโดย:γ(k)γ(k)\gamma\left(k\right) yt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵtyt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵty_t=\phi_1y_{t-1}+\phi_2y_{t-2}+\theta_1\epsilon_{t-1}+\epsilon_t ดังนั้นฉันรู้ว่า: γ(k)=E[yt,yt−k]γ(k)=E[yt,yt−k]\gamma\left(k\right) = \mathrm{E}\left[y_t,y_{t-k}\right] ดังนั้นฉันสามารถเขียน: γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]\gamma\left(k\right) = \phi_1 \mathrm{E}\left[y_{t-1}y_{t-k}\right]+\phi_2 \mathrm{E}\left[y_{t-2}y_{t-k}\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_{t-k}\right]+\mathrm{E}\left[\epsilon_{t}y_{t-k}\right] จากนั้นเพื่อให้ได้รุ่นวิเคราะห์ของฟังก์ชัน autocovariance ฉันต้องแทนที่ค่า - 0, 1, 2 ... จนกว่าฉันจะได้รับการสอบถามซ้ำที่ถูกต้องสำหรับทั้งหมดที่มากกว่าจำนวนเต็มบางส่วนkkkkkk ดังนั้นฉันแทนและทำงานผ่านเพื่อรับ:k=0k=0k=0 γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt]γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt] \gamma \left(0\right) = \mathrm{E}\left[y_t,y_t\right] = \phi_1 \mathrm{E}\left[y_{t-1}y_t\right] + \phi_2 \mathrm{E}\left[y_{t-2}y_t\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_t\right]+\mathrm{E}\left[\epsilon_ty_t\right]\\ ตอนนี้ฉันสามารถลดความซับซ้อนของคำศัพท์สองคำแรกจากนั้นให้แทนที่เหมือนเมื่อก่อน:ytyty_t γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)] \gamma\left(0\right) = \phi_1 \gamma\left(1\right) + \phi_2 \gamma\left(2\right)\\ + \theta_1 …

2
กระบวนการ AR (1) ที่มีข้อผิดพลาดในการวัดที่ต่างกัน
1. ปัญหา ฉันมีการวัดตัวแปรโดยที่ซึ่งฉันมีการแจกแจงได้รับผ่าน MCMC ซึ่งสำหรับความเรียบง่ายฉันจะถือว่าเป็น gaussian ของค่าเฉลี่ยและความแปรปรวน 2 T = 1 , 2 , . , n f y t ( y t ) μ t σ 2 tytyty_tt=1,2,..,nt=1,2,..,nt=1,2,..,nfyt(yt)fyt(yt)f_{y_t}(y_t)μtμt\mu_tσ2tσt2\sigma_t^2 ฉันมีแบบจำลองทางกายภาพสำหรับการสังเกตเหล่านั้นพูดแต่ส่วนที่เหลือดูเหมือนจะมีความสัมพันธ์; โดยเฉพาะอย่างยิ่งผมมีเหตุผลทางกายภาพที่จะคิดว่าขั้นตอนจะพอเพียงที่จะคำนึงถึงความสัมพันธ์และผมวางแผนที่จะได้รับค่าสัมประสิทธิ์ของความพอดีผ่าน MCMC ซึ่งฉันต้องการโอกาส ฉันคิดว่าวิธีการแก้ปัญหาค่อนข้างง่าย แต่ฉันไม่แน่ใจ (ดูเหมือนง่ายมากที่ฉันคิดว่าฉันขาดอะไรไป)r t = μ t - g ( t ) A R ( 1 )g(t)g(t)g(t)rt=μt−g(t)rt=μt−g(t)r_t …

1
ตัวแปรตามมาตรฐานภายในกลุ่มในโมเดลข้อมูลพาเนล?
การกำหนดมาตรฐานของตัวแปรตามภายในกลุ่มที่ระบุเหมาะสมหรือไม่? เอกสารการทำงานต่อไปนี้ (การชะลอการตัดไม้ทำลายป่าในกฎหมาย Amazon ราคาหรือนโยบาย, PDF ) ใช้ตัวแปรตามมาตรฐานเพื่อวิเคราะห์ผลของการเปลี่ยนแปลงนโยบายทั่วไปในบราซิลในการทำลายป่า การทำให้เป็นมาตรฐานมีดังนี้: Ynewit=Yit−Yi¯¯¯¯¯sd(Yit)Yitnew=Yit−Yi¯sd(Yit) Y^{new}_{it} = \frac{Y_{it} - \overline{Y_i}}{sd(Y_{it})} ผู้เขียนโต้เถียงสิ่งนี้ทำหน้าที่ "พิจารณาการเปลี่ยนแปลงที่สัมพันธ์กันในการเพิ่มขึ้นของการทำลายป่าในเขตเทศบาล" ผู้เขียนใช้การประมาณค่า FE (หน้า 12) สำหรับข้อมูลพาเนล รวมถึงการโพสต์นโยบายหลอกตาสำหรับแต่ละปีต่อไปนี้หลังจากที่กฎหมายใหม่ ควรตีความค่าสัมประสิทธิ์อย่างไรถ้าตัวแปรตามเป็นมาตรฐานในวิธีนี้ การสร้างมาตรฐานไม่ใช่การแหกคอกเนื่องจากมันให้คุณค่าสูงกว่าในการสังเกตที่กลุ่ม / เทศบาลมีประสบการณ์การเปลี่ยนแปลงที่ลดลงเมื่อเวลาผ่านไป?

4
การแก้ไขข้อมูลไข้หวัดใหญ่ที่รักษาค่าเฉลี่ยรายสัปดาห์
แก้ไข ฉันได้พบกระดาษอธิบายขั้นตอนที่ฉันต้องการ ความแตกต่างเพียงอย่างเดียวคือกระดาษ interpolates ข้อมูลค่าเฉลี่ยรายเดือนเพื่อรายวันในขณะที่รักษาค่าเฉลี่ยรายเดือน Rฉันมีปัญหาในการดำเนินการวิธีการใน คำแนะนำใด ๆ ที่ชื่นชม เป็นต้นฉบับ สำหรับแต่ละสัปดาห์ฉันมีข้อมูลนับต่อไปนี้ (หนึ่งค่าต่อสัปดาห์): จำนวนที่ปรึกษาแพทย์ จำนวนผู้ป่วยไข้หวัดใหญ่ เป้าหมายของฉันคือการได้รับข้อมูลรายวันโดยการแก้ไข (ฉันคิดว่าเส้นโค้งเชิงเส้นหรือตัดทอน) สิ่งสำคัญคือฉันต้องการประหยัดค่าเฉลี่ยรายสัปดาห์นั่นคือค่าเฉลี่ยของข้อมูลที่ถูกแก้ไขทุกวันควรเท่ากับค่าที่บันทึกไว้ของสัปดาห์นี้ นอกจากนี้การแก้ไขควรจะราบรื่น ปัญหาหนึ่งที่อาจเกิดขึ้นคือหนึ่งสัปดาห์มีเวลาน้อยกว่า 7 วัน (เช่นตอนต้นหรือปลายปี) ฉันจะขอบคุณสำหรับคำแนะนำในเรื่องนี้ ขอบคุณมาก. นี่คือชุดข้อมูลตัวอย่างสำหรับปี 1995 ( อัพเดท ): structure(list(daily.ts = structure(c(9131, 9132, 9133, 9134, 9135, 9136, 9137, 9138, 9139, 9140, 9141, 9142, 9143, 9144, 9145, 9146, 9147, 9148, 9149, …

2
การจัดการกับความสัมพันธ์อัตโนมัติคืออะไร
เพื่อนำหน้าสิ่งนี้ฉันมีพื้นฐานทางคณิตศาสตร์ค่อนข้างลึก แต่ฉันไม่เคยจัดการกับอนุกรมเวลาหรือการสร้างแบบจำลองทางสถิติ ดังนั้นคุณไม่ต้องอ่อนโยนกับฉัน :) ฉันกำลังอ่านกระดาษนี้เกี่ยวกับการสร้างแบบจำลองการใช้พลังงานในอาคารพาณิชย์และผู้เขียนทำให้การเรียกร้องนี้: [สถานะของความสัมพันธ์อัตโนมัติเกิดขึ้น] เนื่องจากตัวแบบได้รับการพัฒนาจากข้อมูลอนุกรมเวลาของการใช้พลังงานซึ่งมีความสัมพันธ์โดยอัตโนมัติ รูปแบบที่กำหนดอย่างหมดจดสำหรับข้อมูลอนุกรมเวลาจะมีความสัมพันธ์อัตโนมัติ พบว่าความสัมพันธ์อัตโนมัติลดลงหากรวมค่าสัมประสิทธิ์ฟูริเยร์มากขึ้นในโมเดล อย่างไรก็ตามในกรณีส่วนใหญ่แบบจำลองฟูริเยร์มี CV ต่ำดังนั้นแบบจำลองจึงอาจเป็นที่ยอมรับได้สำหรับวัตถุประสงค์ในทางปฏิบัติที่ (sic) ไม่ต้องการความแม่นยำสูง 0. ) "รูปแบบใด ๆ ที่กำหนดอย่างหมดจดสำหรับข้อมูลอนุกรมเวลาจะมีความสัมพันธ์อัตโนมัติ" หมายความว่าอะไร? ฉันสามารถเข้าใจความหมายของสิ่งนี้ได้อย่างชัดเจน - ตัวอย่างเช่นคุณคาดหวังว่าจะทำนายประเด็นต่อไปในอนุกรมเวลาของคุณอย่างไรถ้าคุณมี 0 ความสัมพันธ์อัตโนมัติ? นี่ไม่ใช่อาร์กิวเมนต์ทางคณิตศาสตร์เพื่อให้แน่ใจว่าเป็นเพราะเหตุใดนี่คือ 0 :) 1. ) ฉันอยู่ภายใต้การแสดงความคิดเห็นที่ความสัมพันธ์อัตโนมัติฆ่าโมเดลของคุณโดยทั่วไป แต่เมื่อคิดถึงมันฉันไม่เข้าใจว่าทำไมจึงเป็นเช่นนั้น ดังนั้นความสัมพันธ์อัตโนมัติทำไมจึงเป็นสิ่งที่ไม่ดี (หรือดี) 2. ) วิธีแก้ปัญหาที่ฉันเคยได้ยินเกี่ยวกับออโตคอร์เรชั่นคือการแตกต่างของอนุกรมเวลา หากไม่ได้พยายามอ่านใจผู้เขียนเหตุใดจึงไม่แตกต่างกันถ้าความสัมพันธ์อัตโนมัติที่ไม่มีความสำคัญมีอยู่จริง 3. ) ข้อ จำกัด อะไรที่ทำให้ไม่มีข้อมูลที่เกี่ยวข้องโดยอัตโนมัติในโมเดล? นี่เป็นข้อสันนิษฐานบางแห่งหรือไม่ (เช่นปกติจะมีการกระจายของเสียเมื่อสร้างโมเดลด้วยการถดถอยเชิงเส้นอย่างง่าย) หรือไม่? อย่างไรก็ตามขออภัยหากคำถามเหล่านี้เป็นคำถามพื้นฐานและขอบคุณล่วงหน้าสำหรับความช่วยเหลือ


2
ขั้นตอนที่ถูกต้องในการเลือกความล่าช้าเมื่อทำการทดสอบตัวนับ Johansen คืออะไร?
เมื่อทำการ preforming Johansen Cointegration test สำหรับ 2 time series (ในกรณีง่าย ๆ ) คุณจำเป็นต้องตัดสินใจว่าความล่าช้าที่คุณต้องการใช้ การทดสอบความล่าช้าที่แตกต่างกันให้ผลลัพธ์ที่แตกต่างกัน: สำหรับบางระดับความล่าช้าสมมติฐานว่างสามารถถูกปฏิเสธ แต่สำหรับคนอื่นมันไม่สามารถทำได้ คำถามของฉันคือวิธีการที่ถูกต้องโดยอิงจากข้อมูลอินพุตเพื่อตัดสินใจว่าฉันต้องใช้ความล่าช้าอะไรเมื่อทำการทดสอบ Johansen ล่วงหน้า ป.ล. ฉันส่งคำถามนี้ไปที่ quant.stackexchange แต่บางคนก็แนะนำว่ามันเหมาะสมกับกลุ่มนี้มากกว่า

3
การถดถอยปกติกับการถดถอยเมื่อตัวแปรต่างกัน
ฉันแค่พยายามที่จะเข้าใจว่าความสัมพันธ์ระหว่างการถดถอยแบบพหุ / แบบธรรมดากับการถดถอยแบบพหุ / แบบง่ายเมื่อตัวแปรแตกต่างกัน ตัวอย่างเช่นฉันกำลังวิเคราะห์ความสัมพันธ์ระหว่างยอดเงินฝาก ( ) เทียบกับอัตราตลาด ( ) ถ้าฉันเรียกใช้การถดถอยเชิงเส้นอย่างง่ายความสัมพันธ์นั้นเป็นค่าลบและค่อนข้างสำคัญ (ประมาณ -.74) อย่างไรก็ตามถ้าฉันใช้บันทึกและ ความแตกต่างของตัวแปรตามและความแตกต่างของตัวแปรอิสระดังนั้นสมการของฉันคือที่ถดถอยด้วย , สหสัมพันธ์ของฉันและ R ^ 2 ไม่มีความหมายเลย ( )R T dYTYTY_TRTRTR_TddLN( YT)dln⁡(YT)d\, \ln(Y_T)R 2 = .004dR ( T)dR(T)d\, R(T)R2= .004R2=.004R^2 = .004 ฉันแค่สงสัยว่าต่ำหมายถึงอะไร? นั่นหมายความว่าแบบจำลองของฉันไม่เหมาะสมหรือฉันไม่สนใจเมื่อฉันดูข้อมูลที่แตกต่างกันหรือไม่? ฉันรู้จากข้อมูลว่ามีความสัมพันธ์อย่างมีนัยสำคัญระหว่างตัวแปรดั้งเดิมสองตัว แต่สำหรับแบบจำลองของฉันฉันต้องดูตัวแปรที่แตกต่างกันดังนั้นเพียงแค่สงสัยว่าจะทำอย่างไรกับเรื่องนี้R 2R2R2R^2R2R2R^2

1
การคำนวณข้อผิดพลาดการคาดการณ์ด้วยการตรวจสอบความถูกต้องข้ามเวลา
ฉันมีแบบจำลองการพยากรณ์สำหรับอนุกรมเวลาและฉันต้องการคำนวณข้อผิดพลาดการทำนายนอกตัวอย่าง ในขณะนี้กลยุทธ์ที่ฉันติดตามคือสิ่งที่แนะนำในบล็อกของ Rob Hyndman (ใกล้ด้านล่างของหน้า) ซึ่งเป็นไปตามนี้ (สมมติว่าเป็นอนุกรมเวลาและชุดฝึกอบรมขนาด )y1,…,yny1,…,yny_1,\dots,y_nkkk ปรับโมเดลให้พอดีกับข้อมูลyt,…,yt+k−1yt,…,yt+k−1y_t,\dots,y_{t+k-1}และให้y^t+ky^t+k\hat{y}_{t+k}เป็นตัวพยากรณ์สำหรับการสังเกตการณ์ครั้งต่อไป คำนวณผิดพลาดการคาดการณ์เป็นet=y^t+k−yt+ket=y^t+k−yt+ke_{t} = \hat{y}_{t+k} - y_{t+k}K} ทำซ้ำสำหรับt=1,…,n−kt=1,…,n−kt=1,\dots,n-k คำนวณข้อผิดพลาดกำลังสองเฉลี่ยเป็นMSE=1n−k∑n−kt=1e2tMSE=1n−k∑t=1n−ket2\textrm{MSE}=\frac{1}{n-k}\sum_{t=1}^{n-k} e_t^2 คำถามของฉันคือฉันต้องกังวลเกี่ยวกับสหสัมพันธ์เนื่องจากชุดการฝึกอบรมที่ทับซ้อนกันของฉัน โดยเฉพาะอย่างยิ่งบอกว่าฉันต้องการคาดการณ์ไม่เพียง แต่ค่าถัดไป แต่ค่าmถัดไปmmmดังนั้นฉันจึงมีการคาดการณ์y^t+k,…,y^t+k+m−1y^t+k,…,y^t+k+m−1\hat{y}_{t+k},\dots,\hat{y}_{t+k+m-1}และข้อผิดพลาดet,1,…,et,met,1,…,et,me_{t,1},\dots,e_{t,m}และฉันต้องการสร้างโครงสร้างคำของข้อผิดพลาดในการทำนาย ฉันจะยังคงหมุนหน้าต่างของชุดฝึกซ้อมไปข้างหน้าทีละ 1 ครั้งหรือฉันควรหมุนไปข้างหน้าด้วยmmm ? คำตอบของคำถามเหล่านี้จะเปลี่ยนไปอย่างไรหากมีการตอบรับอัตโนมัติอย่างมีนัยสำคัญในซีรีส์ที่ฉันคาดการณ์ (อาจเป็นกระบวนการหน่วยความจำที่ยาวนานนั่นคือฟังก์ชั่น autocorrelation สลายตัวเป็นกฎพลังงานแทนที่จะอธิบายแทน) ฉันขอขอบคุณคำอธิบายทั้งที่นี่หรือลิงก์ไปยังที่ซึ่งฉันสามารถค้นหาผลลัพธ์ทางทฤษฎีเกี่ยวกับช่วงความมั่นใจรอบ MSE (หรือมาตรการข้อผิดพลาดอื่น ๆ )

1
การถดถอยอนุกรมเวลาด้วยข้อมูลที่ทับซ้อนกัน
ฉันเห็นรูปแบบการถดถอยซึ่งกำลังถดถอยผลตอบแทนดัชนีปีต่อปีจากความล่าช้า (12 เดือน) ผลตอบแทนปีต่อปีของดัชนีหุ้นเดียวกันการกระจายเครดิต (ความแตกต่างระหว่างค่าเฉลี่ยรายเดือนของพันธบัตรปลอดความเสี่ยงและพันธบัตรองค์กร อัตราผลตอบแทน) อัตราเงินเฟ้อ YoY และดัชนีการผลิตอุตสาหกรรม ดูเหมือนว่า (แม้ว่าคุณจะให้ข้อมูลเฉพาะกับอินเดียในกรณีนี้) SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) + b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2) SP500YOY คือผลตอบแทนปีต่อปีสำหรับดัชนี SP500 เพื่อคำนวณสิ่งนี้ค่าเฉลี่ยรายเดือนของค่า SP500 จะถูกคำนวณแล้วแปลงเป็นผลตอบแทนปีต่อปีสำหรับแต่ละเดือน (เช่น Jan'10-Jan'11, Feb'10 - Feb'11, Mar'10-Mar'11,..) ในด้านตัวแปรอธิบายค่าที่ล่าช้า 12 เดือนของ SP500YOY ถูกนำมาใช้พร้อมกับ CREDITSPREAD ณ เวลาที่ T และอัตราเงินเฟ้อและอุตสาหกรรมนำสองช่วง AHEAD INFLATIONASYMM เป็นตัวอย่างว่าอัตราเงินเฟ้อสูงกว่าค่าเกณฑ์ 5.0% …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.