คำศัพท์เกี่ยวกับข้อผิดพลาดของโมเดลค่าเฉลี่ยเคลื่อนที่


17

นี่เป็นคำถามพื้นฐานสำหรับรุ่น Box-Jenkins MA ตามที่ผมเข้าใจแบบจำลอง MA เป็นพื้นถดถอยเชิงเส้นของอนุกรมเวลาค่าที่Yกับก่อนหน้านี้เงื่อนไขข้อผิดพลาดet,...,etn n นั่นคือการสังเกตYจะถดถอยครั้งแรกกับค่าก่อนหน้านี้Yt1,...,Ytnแล้วหนึ่งหรือมากกว่าYY^ค่าจะถูกใช้เป็นเงื่อนไขข้อผิดพลาดสำหรับรุ่นซาชูเซตส์

แต่ข้อผิดพลาดถูกคำนวณในรูปแบบ ARIMA (0, 0, 2) อย่างไร หากใช้โมเดล MA โดยไม่มีชิ้นส่วนตอบรับอัตโนมัติและไม่มีค่าโดยประมาณฉันจะมีคำผิดได้อย่างไร


1
ไม่ฉันคิดว่าคุณกำลังสับสนกับคำจำกัดความของแบบจำลอง MA (n) ซึ่งการถดถอยมีเฉพาะในรูปของด้วยการประมาณค่าของมันโดยที่e t - iถูกประเมินจากข้อมูล . etieti
ซีอาน

1
ปัญหาหลักในคำถามของคุณคือคุณบอกว่าแบบจำลอง MA นั้นเป็นการถดถอยเชิงเส้น สิ่งนี้ไม่เป็นความจริงเนื่องจากเราไม่ปฏิบัติตามข้อกำหนดข้อผิดพลาด
mpiktas

ผมคิดว่าคำข้อผิดพลาดเป็นจริงที่YคือE ( Y | Y T , . . . , T - n )หรือเพียงแค่Y T - Y T - 1 นั่นคือเหตุผลที่การประมาณค่าพารามิเตอร์ตัวแบบ MA นั้นได้มาจากรูปแบบที่เกิดซ้ำในฟังก์ชั่น autocorrelation บางส่วนของYซึ่งเป็นพฤติกรรมของส่วนที่เหลือ การประมาณค่าพารามิเตอร์ AR แทนจะขึ้นอยู่กับรูปแบบที่เกิดขึ้นประจำของ acf (Y)YtYt^Y^E(Y|Yt,...,tn)YtYt1Y
โรเบิร์ตคูบริก

คำตอบ:


20

การประมาณค่ารุ่น MA:

ให้เราสมมติอนุกรมที่มี 100 เวลาและบอกว่านี่เป็นลักษณะของโมเดล MA (1) ที่ไม่มีการสกัดกั้น จากนั้นแบบจำลองจะถูกกำหนดโดย

yt=εtθεt1,t=1,2,,100(1)

ไม่พบข้อผิดพลาดที่นี่ เพื่อให้ได้สิ่งนี้Box et al การวิเคราะห์อนุกรมเวลา: การพยากรณ์และการควบคุม (ฉบับที่ 3) ,หน้า 228แสดงให้เห็นว่าระยะข้อผิดพลาดคือการคำนวณซ้ำโดย

εt=yt+θεt1

ดังนั้นระยะข้อผิดพลาดสำหรับคือ ε 1 = Y 1 + θ ε 0 ตอนนี้เราไม่สามารถคำนวณนี้โดยไม่ทราบว่าค่าของθ ดังนั้นเพื่อให้ได้สิ่งนี้เราจำเป็นต้องคำนวณการประมาณค่าเริ่มต้นหรือเบื้องต้นของโมเดลอ้างอิงที่ Box และคณะ จากหนังสือดังกล่าวt=1

ε1=y1+θε0
θมาตรา 6.3.2 หน้า 202ระบุว่า

มันแสดงให้เห็นว่าครั้งแรกที่ autocorrelations ของซาชูเซตส์ ( Qกระบวนการ) เป็นภัณฑ์และสามารถเขียนได้ในแง่ของพารามิเตอร์ของแบบจำลองเป็น ρ k = - θ k + θ 1 θ k + 1 + θ 2 θ k + 2 + + θ q - k θ qqqสำนวนข้างต้นสำหรับ ρ 1 , ρ 2, ρ Q ในแง่ θ 1 , θ 2 , , θ Q , อุปกรณ์ Qสมการ Qราชวงศ์ ประมาณการเบื้องต้นของ θ s สามารถรับได้โดยการแทนประมาณการ r kสำหรับ ρ kในสมการข้างต้น

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρqθ1,θ2,,θqqqθrkρk

โปรดทราบว่าคือค่าสัมพันธ์อัตโนมัติโดยประมาณ มีการอภิปรายเพิ่มเติมในหัวข้อ 6.3 - การประมาณค่าเริ่มต้นสำหรับพารามิเตอร์โปรดอ่าน ตอนนี้สมมติว่าเราได้รับการประมาณการเบื้องต้นθ = 0.5 จากนั้น ε 1 = y 1 + 0.5 ε 0 ทีนี้ปัญหาอื่นคือเราไม่มีค่าสำหรับε 0เพราะtเริ่มที่ 1 และเราไม่สามารถคำนวณε 1ได้ โชคดีที่มีสองวิธีที่สองได้รับนี้rkθ=0.5

ε1=y1+0.5ε0
ε0tε1
  1. ความน่าจะเป็นเงื่อนไข
  2. โอกาสที่ไม่มีเงื่อนไข

อ้างอิงจาก Box et al. ส่วนที่ 7.1.3 หน้า 227ค่าของสามารถทดแทนให้เป็นศูนย์ได้โดยประมาณหากnอยู่ในระดับปานกลางหรือใหญ่วิธีนี้เป็นความน่าจะเป็นตามเงื่อนไข มิฉะนั้นโอกาสที่ไม่มีเงื่อนไขที่จะใช้นั้นค่าของε 0คือได้รับกลับโดยการคาดการณ์กล่อง et al, แนะนำวิธีนี้ อ่านเพิ่มเติมเกี่ยวกับหลังการคาดการณ์ที่มาตรา 7.1.4 หน้า 231ε0nε0

หลังจากได้รับการประมาณการเบื้องต้นและมูลค่าของแล้วในที่สุดเราสามารถดำเนินการกับการคำนวณ recursive คำข้อผิดพลาด ขั้นตอนสุดท้ายคือการประมาณค่าพารามิเตอร์ของแบบจำลอง( 1 )ε0(1)โปรดจำไว้ว่านี่ไม่ใช่การประมาณการเบื้องต้นอีกต่อไป

ในการประมาณค่าพารามิเตอร์θฉันใช้ขั้นตอนการประมาณค่าแบบไม่เชิงเส้นโดยเฉพาะอัลกอริทึม Levenberg-Marquardt เนื่องจากตัวแบบ MA ไม่เชิงเส้นบนพารามิเตอร์

โดยรวมแล้วฉันขอแนะนำให้คุณอ่านBox และคณะ การวิเคราะห์อนุกรมเวลา: การพยากรณ์และการควบคุม (ฉบับที่ 3)


rk

4

Yt=i=1qϑieti+σet,etiidN(0,1)
so the MA(q) model is a "pure" error model, the degree q defining how far the correlation goes back.

1
I'm still not clear on where et comes from. Is et a random variable? I don't think so, otherwise why to bother looking for q correlations?
Robert Kubrick

1
Why is there a minus in your formula? Usually the minus is for AR models. Mathematically is not an issue, I'm just curious, since I've never seen minus in MA models.
mpiktas

3
@RobertKubrick, are you aware of Wold decomposition theorem? Each stationary process has its corresponding innovation process, that is from where terms et come.
mpiktas

1
@mpiktas Thanks, that gives some background on the error term, but I am still not clear on where the innovation process comes from, for an innovation to exist there's got to be a forecast somewhere (en.wikipedia.org/wiki/Innovation_(signal_processing)). Is the optimal Y forecast simply E(Y), that is the mean of the series?
Robert Kubrick

1

You say "the observation Y is first regressed against its previous values Yt1,...,Ytn and then one or more YY^ values are used as the error terms for the MA model." What I say is that Y is regressed against two predictor series et1 and et2 yielding an error process et which will be uncorrelated for all i=3,4,,,,t .We then have two regression coefficients: θ1 representing the impact of et1 and θ2 representing the impact of et2. Thus et is a white noise random series containing n-2 values. Since we have n-2 estimable relationships we start with the assumption that e1 and e2 are equal to 0.0 . Now for any pair of θ1 and θ2 we can estimate the t-2 residual values. The combination that yields the smallest error sum of squares would then be the best estimates of θ1 and θ2.


What are the 2 other predictor series? I am asking because when I look at the literature I have it's never clearly specified. Are these 2 other series unrelated to Y? I had the impression that all ARIMA formulation is limited to the Y series.
Robert Kubrick

1
The 2 predictors are the lags of the error terms. Since these are not known a priori since we do not know the error terms before we begin is why this has to be treated by non-linear estimation.The confusion you are having is that a model that is finite in the past ( i.e. an AR MODEL ) is potentially infinite in the errors AND a model that is finite in the errors ( i.e. an MA MODEL) is potentially infinite in the past of Y.The reason one selects an AR MODEL versus an MA MODEL is for parsimony. Sometimes we construct an ARMA MODEL which blends both the history of Y and the history of the errors.
IrishStat

1
As I commented in the other answer, what I am still missing is what's the optimal forecast for Y, which is used to calculate the innovation etn.
Robert Kubrick

1

See my post here for an explanation of how to understand the disturbance terms in a MA series.

You need different estimation techniques to estimate them. This is because you cannot first get the residuals of a linear regression and then include the lagged residual values as explanatory variables because the MA process uses the residuals of the current regression. In your example you are making two regression equations and using residuals from one into the other. This is not what an MA process is. It cannot be estimated with OLS.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.