มีสามประเด็นเล็ก ๆ น้อย ๆ อยู่ในtseries::arma
เมื่อเทียบกับstats::arima
นำไปสู่ผลที่แตกต่างกันเล็กน้อยในรูปแบบ ARMA สำหรับชุด differenced ใช้ที่tseries::arma
และ ARIMA stats::arima
ใน
ค่าเริ่มต้นของสัมประสิทธิ์: stats::arima
ตั้งค่าสัมประสิทธิ์AR และ MA เริ่มต้นเป็นศูนย์ในขณะที่tseries::arma
ใช้ขั้นตอนที่อธิบายไว้ใน Hannan และ Rissanen (1982) เพื่อรับค่าเริ่มต้นของสัมประสิทธิ์
ขนาดของฟังก์ชั่นวัตถุประสงค์: ฟังก์ชั่นวัตถุประสงค์ในการtseries::arma
ส่งกลับค่าของผลรวมของเงื่อนไขของสี่เหลี่ยม, RSS; ผลตอบแทนstats::arima
0.5*log(RSS/(n-ncond))
อัลกอริธึมการปรับให้เหมาะสม: โดยค่าเริ่มต้นจะใช้ Nelder-Mead ในtseries::arma
ขณะที่stats::arima
ใช้อัลกอริทึม BFGS
อันสุดท้ายสามารถเปลี่ยนแปลงได้ผ่านการโต้แย้งoptim.method
ในstats::arima
แต่คนอื่น ๆ จะต้องแก้ไขรหัส ด้านล่างฉันแสดงเวอร์ชั่นย่อของซอร์สโค้ด (โค้ดขั้นต่ำสำหรับรุ่นนี้โดยเฉพาะ) stats::arima
ซึ่งมีการแก้ไขปัญหาสามข้อที่กล่าวถึงด้านบนเพื่อให้เหมือนกันกับสิ่งtseries::arma
ต่อไปนี้ หลังจากแก้ไขปัญหาเหล่านี้tseries::arma
จะได้รับผลลัพธ์เช่นเดียวกับใน
เวอร์ชันขั้นต่ำของstats::arima
(ด้วยการเปลี่ยนแปลงที่กล่าวถึงข้างต้น):
# objective function, conditional sum of squares
# adapted from "armaCSS" in stats::arima
armaCSS <- function(p, x, arma, ncond)
{
# this does nothing, except returning the vector of coefficients as a list
trarma <- .Call(stats:::C_ARIMA_transPars, p, arma, FALSE)
res <- .Call(stats:::C_ARIMA_CSS, x, arma, trarma[[1L]], trarma[[2L]], as.integer(ncond), FALSE)
# return the conditional sum of squares instead of 0.5*log(res),
# actually CSS is divided by n-ncond but does not relevant in this case
#0.5 * log(res)
res
}
# initial values of coefficients
# adapted from function "arma.init" within tseries::arma
arma.init <- function(dx, max.order, lag.ar=NULL, lag.ma=NULL)
{
n <- length(dx)
k <- round(1.1*log(n))
e <- as.vector(na.omit(drop(ar.ols(dx, order.max = k, aic = FALSE, demean = FALSE, intercept = FALSE)$resid)))
ee <- embed(e, max.order+1)
xx <- embed(dx[-(1:k)], max.order+1)
return(lm(xx[,1]~xx[,lag.ar+1]+ee[,lag.ma+1]-1)$coef)
}
# modified version of stats::arima
modified.arima <- function(x, order, seasonal, init)
{
n <- length(x)
arma <- as.integer(c(order[-2L], seasonal$order[-2L], seasonal$period, order[2L], seasonal$order[2L]))
narma <- sum(arma[1L:4L])
ncond <- order[2L] + seasonal$order[2L] * seasonal$period
ncond1 <- order[1L] + seasonal$period * seasonal$order[1L]
ncond <- as.integer(ncond + ncond1)
optim(init, armaCSS, method = "Nelder-Mead", hessian = TRUE, x=x, arma=arma, ncond=ncond)$par
}
ตอนนี้เปรียบเทียบทั้งสองโพรซีเดอร์และตรวจสอบว่าให้ผลลัพธ์เดียวกัน (ต้องการซีรีย์ที่x
สร้างโดย OP ในเนื้อความของคำถาม)
ใช้ค่าเริ่มต้นที่เลือกในtseries::arima
:
dx <- diff(x)
fit1 <- arma(dx, order=c(3,3), include.intercept=FALSE)
coef(fit1)
# ar1 ar2 ar3 ma1 ma2 ma3
# 0.33139827 0.80013071 -0.45177254 0.67331027 -0.14600320 -0.08931003
init <- arma.init(diff(x), 3, 1:3, 1:3)
fit2.coef <- modified.arima(x, order=c(3,1,3), seasonal=list(order=c(0,0,0), period=1), init=init)
fit2.coef
# xx[, lag.ar + 1]1 xx[, lag.ar + 1]2 xx[, lag.ar + 1]3 ee[, lag.ma + 1]1
# 0.33139827 0.80013071 -0.45177254 0.67331027
# ee[, lag.ma + 1]2 ee[, lag.ma + 1]3
# -0.14600320 -0.08931003
all.equal(coef(fit1), fit2.coef, check.attributes=FALSE)
# [1] TRUE
การใช้ค่าเริ่มต้นที่เลือกในstats::arima
(ศูนย์):
fit3 <- arma(dx, order=c(3,3), include.intercept=FALSE, coef=rep(0,6))
coef(fit3)
# ar1 ar2 ar3 ma1 ma2 ma3
# 0.33176424 0.79999112 -0.45215742 0.67304072 -0.14592152 -0.08900624
init <- rep(0, 6)
fit4.coef <- modified.arima(x, order=c(3,1,3), seasonal=list(order=c(0,0,0), period=1), init=init)
fit4.coef
# [1] 0.33176424 0.79999112 -0.45215742 0.67304072 -0.14592152 -0.08900624
all.equal(coef(fit3), fit4.coef, check.attributes=FALSE)
# [1] TRUE
fit1
มีเพียง 1 MA & 1 AR พารามิเตอร์: คุณหมายถึงfit1<-arma(diff(x,1,lag=1),c(3,3),include.intercept=F)
อะไร