เป็นตัวอย่างที่ดีที่ซีรีส์ที่ไม่มีรูทยูนิตไม่ใช่เครื่องเขียน


18

ฉันเคยเห็นหลายครั้งที่ผู้คนปฏิเสธโมฆะในการทดสอบเพิ่ม Dickey-Fullerแล้วอ้างว่ามันแสดงให้เห็นว่าซีรี่ส์ของพวกเขานั้นอยู่กับที่ (แต่น่าเสียดายที่ฉันไม่สามารถแสดงแหล่งที่มาของการอ้างสิทธิ์เหล่านี้ได้ วารสารหนึ่งฉบับหรืออีกฉบับหนึ่ง)

ฉันยืนยันว่ามันเป็นความเข้าใจผิด (การปฏิเสธโมฆะของหน่วยรากนั้นไม่จำเป็นต้องเป็นแบบเดียวกับที่มีชุดเครื่องเขียนโดยเฉพาะอย่างยิ่งเนื่องจากรูปแบบทางเลือกที่ไม่เป็นทางเลือกจะไม่ค่อยถูกตรวจสอบหรือพิจารณาเมื่อทำการทดสอบเช่นนั้น)

สิ่งที่ฉันค้นหาคือ:

a) ตัวอย่างที่ชัดเจนที่ชัดเจนเกี่ยวกับการอ้างสิทธิ์ (ฉันนึกภาพออกได้สองสามคนตอนนี้ แต่ฉันพนันได้ว่าคนอื่นที่ไม่ใช่ฉันจะมีสิ่งที่ดีกว่าที่ฉันคิดไว้) มันอาจเป็นคำอธิบายของสถานการณ์ที่เฉพาะเจาะจงอาจมีข้อมูล (จำลองหรือจริงทั้งสองมีข้อดี) หรือ

b) ข้อโต้แย้งที่น่าเชื่อถือว่าทำไมการปฏิเสธในส่วนที่เพิ่มขึ้นของ Dickey-Fuller ควรถูกมองว่าเป็นการสร้างความคงที่

(หรือแม้กระทั่งทั้งคู่ (ก) และ (ข) หากคุณรู้สึกฉลาด)


3
มีความน่าจะเป็น 1Xn=(1)n
พระคาร์ดินัล

@ cardinal ดีที่แน่นอนจะได้รับการปฏิเสธโดยการทดสอบ ADF (แก้ไข: ใช่แล้ว) และมันไม่ใช่ nonstationary อย่างชัดเจน (รากในวงกลมหน่วย แต่ไม่รากเท่ากับ 1 ซึ่ง ADF ตรวจจับ); เพื่อที่จะนับ
Glen_b

โปรดทราบว่าการทดสอบ ADF มีตัวแปรที่รวมเทรนด์ไว้ด้วย หากโมฆะถูกปฏิเสธซีรีส์นี้จะเป็นเทรนด์นิ่งซึ่งหยุดนิ่งถ้าเทรนด์นั้นถูกลบ แต่ไม่ใช่นิ่งอย่างไรก็ตาม
mpiktas

+1 Glen_b, แนวโน้มเชิงเส้น + เสียงคงที่ AR (1) จะนับรวมเป็นตัวอย่างหรือไม่?
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


15

นี่คือตัวอย่างของซีรี่ส์ที่ไม่หยุดนิ่งที่ไม่มีแม้แต่การทดสอบเสียงสีขาวที่สามารถตรวจจับได้ (นับเป็นการทดสอบประเภท Dickey-Fuller):

นี่ไม่ใช่เสียงสีขาว

ใช่มันอาจจะแปลกใจ แต่นี่ไม่ใช่เสียงสีขาวนี้ไม่ได้เป็นเสียงสีขาว

ตัวอย่างที่ไม่เกี่ยวกับเครื่องเขียนส่วนใหญ่จะขึ้นอยู่กับการละเมิดเงื่อนไขสองประการแรกของเครื่องเขียน: แนวโน้มที่กำหนดขึ้น (ค่าเฉลี่ยไม่คงที่) หรืออนุกรมเวลาของรูท / heteroskedastic (ความแปรปรวนคงที่) อย่างไรก็ตามคุณยังสามารถมีกระบวนการที่ไม่หยุดนิ่งที่มีค่าเฉลี่ยและความแปรปรวนคงที่ แต่พวกเขาละเมิดเงื่อนไขที่สาม: ฟังก์ชัน autocovariance (ACVF) ควรคงที่ตลอดเวลาและฟังก์ชันของ| s - t | เท่านั้นcov(xs,xเสื้อ)|s-เสื้อ|

อนุกรมเวลาด้านบนเป็นตัวอย่างของซีรี่ส์ดังกล่าวซึ่งมีค่าเฉลี่ยเป็นศูนย์ความแปรปรวนของหน่วย แต่ ACVF ขึ้นอยู่กับเวลา แม่นยำมากขึ้นกระบวนการข้างต้นเป็นกระบวนการ MA นิ่ง (1) นิ่งกับพารามิเตอร์เช่นว่ามันจะกลายเป็นเสียงสีขาวปลอม (ดูอ้างอิงด้านล่าง): พารามิเตอร์ของกระบวนการ MA การเปลี่ยนแปลงมากกว่า เวลาxเสื้อ=εเสื้อ+θ1εเสื้อ-1

θ1(u)=0.51u,

โดยที่เป็นเวลาปกติ สาเหตุที่ทำให้เกิดเสียงรบกวนสีขาว (แม้ว่าตามคำจำกัดความทางคณิตศาสตร์จะไม่ชัดเจน) ก็คือเวลาที่เปลี่ยนแปลง ACVF รวมกันเป็นศูนย์ในช่วงเวลาหนึ่ง เนื่องจาก ACVF ตัวอย่างแปลงเป็น ACVF เฉลี่ยนี่หมายความว่าตัวอย่างการเปลี่ยนแปลงอัตโนมัติ (และ autocorrelation (ACF)) จะมาบรรจบกันเป็นฟังก์ชันที่ดูเหมือนเสียงสีขาว ดังนั้นแม้แต่การทดสอบ Ljung-Box ก็ไม่สามารถตรวจจับสิ่งที่ไม่อยู่นิ่งได้ กระดาษ (ข้อจำกัดความรับผิดชอบ: ฉันเป็นผู้เขียน) เกี่ยวกับการทดสอบเสียงสีขาวกับทางเลือกที่อยู่กับที่u=t/Tเสนอส่วนขยายของการทดสอบกล่องเพื่อจัดการกับกระบวนการคงที่ในท้องถิ่นดังกล่าว

สำหรับรหัส R เพิ่มเติมและรายละเอียดเพิ่มเติมโปรดดูที่โพสต์บล็อกนี้นี้

อัปเดตหลังจากความคิดเห็นของ mpiktas :

มันเป็นความจริงที่ว่าสิ่งนี้อาจดูเหมือนเป็นกรณีที่น่าสนใจในทางทฤษฎีซึ่งไม่ได้เห็นในทางปฏิบัติ ฉันยอมรับว่าไม่น่าจะเห็นเสียงสีขาวลวงตาในชุดข้อมูลในโลกแห่งความเป็นจริงโดยตรง แต่คุณจะเห็นสิ่งนี้ในเกือบทุกรูปแบบพอดีกับเครื่องเขียน โดยไม่ต้องไปลงในรายละเอียดทางทฤษฎีมากเกินไปเพียงแค่คิดเวลาที่แตกต่างกันโดยทั่วไปรูปแบบ กับเวลาที่แตกต่างกันฟังก์ชั่นความแปรปรวนแกมมาθ ( k , U ) หากคุณให้พอดีกับรูปแบบคงที่θแล้วประมาณนี้จะใกล้เคียงกับค่าเฉลี่ยของเวลาของรูปแบบที่แท้จริงθ ( U ) ; และโดยธรรมชาติแล้วส่วนที่เหลือจะใกล้เคียงθ(u)γθ(k,u)θ^θ(u)ซึ่งโดยการก่อสร้าง θจะบูรณาการให้เป็นศูนย์ (โดยประมาณ) ดูรายละเอียดที่ Goerg (2012)θ(u)θ^θ^

ลองดูตัวอย่าง

library(fracdiff)
library(data.table)

tree.ring <- ts(fread(file.path(data.path, "tree-rings.txt"))[, V1])
layout(matrix(1:4, ncol = 2))
plot(tree.ring)
acf(tree.ring)
mod.arfima <- fracdiff(tree.ring)
mod.arfima$d


## [1] 0.236507

ดังนั้นเราจึงพอดีกับเสียงเศษส่วนกับพารามิเตอร์d = 0.23 (ตั้งแต่d < 0.5เราคิดว่าทุกอย่างดีและเรามีรูปแบบนิ่ง) ตรวจสอบส่วนที่เหลือ:d^=0.23d^<0.5

arfima.res <- diffseries(tree.ring, mod.arfima$d)
plot(arfima.res)
acf(arfima.res)

อนุกรมเวลาและพล็อต acf

ดูดีใช่มั้ย ดีที่เป็นปัญหาที่เหลือเป็นเสียงสีขาวปลอม ฉันจะรู้ได้อย่างไร ก่อนอื่นฉันสามารถทดสอบได้

Box.test(arfima.res, type = "Ljung-Box")
## 
##  Box-Ljung test
## 
## data:  arfima.res
## X-squared = 1.8757, df = 1, p-value = 0.1708

Box.test.ls(arfima.res, K = 4, type = "Ljung-Box")
## 
##  LS Ljung-Box test; Number of windows = 4; non-overlapping window
##  size = 497
## 
## data:  arfima.res
## X-squared = 39.361, df = 4, p-value = 5.867e-08

และประการที่สองเรารู้จากวรรณกรรมว่าข้อมูลเสียงต้นไม้อยู่ในความเป็นจริงเสียงเศษส่วนคงที่ในพื้นที่: ดูGoerg (2012)และFerreira, Olea และ Palma (2013)(2013)

นี่แสดงให้เห็นว่าตัวอย่างของฉันที่เป็นที่ยอมรับในทางทฤษฎีกำลังเกิดขึ้นจริงในตัวอย่างโลกแห่งความเป็นจริงส่วนใหญ่


+1 เป็นตัวอย่างที่ดีมาก! ฉันสนใจ แต่มีตัวอย่างชีวิตจริงของซีรี่ส์นี้หรือไม่?
mpiktas

@mpiktas ฉันได้เพิ่มการอัปเดตในโพสต์ที่ควรตอบคำถามของคุณ
Georg M. Goerg

γ1(u)=θ(u)σ(u)σ(u1/T)θ(u)γ^101θ(u)du=001θ(u)σ2(u)du=0σ(u)θ(u)εt

ตัวอย่างที่ให้ไว้ของคุณบอกว่าเมื่อเรามีรูปแบบที่แตกต่างกันตามเวลารูปแบบที่แตกต่างกันที่ไม่ใช่เวลาที่เหมาะสมจะนำไปสู่การอนุมานที่ไม่ถูกต้อง แต่นี่ก็ไม่ได้หมายความว่าจะสามารถสร้างแบบจำลองเรียลไทม์แต่ละแบบด้วยโมเดลที่เปลี่ยนแปลงตามเวลาได้ ในทางตรงกันข้ามการทดสอบของคุณสามารถนำไปใช้ในการทดสอบสำหรับการปรากฏตัวของเวลาที่เปลี่ยนแปลง ขอขอบคุณอีกครั้งสำหรับข้อมูลเชิงลึกที่น่าสนใจ
mpiktas

σ(u)20.5T

7

ตัวอย่างที่ 1

กระบวนการรูทยูนิตที่มีส่วนประกอบ MA ลบที่แข็งแกร่งนั้นเป็นที่รู้กันว่านำไปสู่การทดสอบ ADF ที่มีขนาดเชิงประจักษ์สูงกว่าขนาดที่ระบุเล็กน้อย (เช่นSchwert, JBES 1989 )

Yt=Yt1+ϵt+θϵt1,
ด้วยθ-1รากของชิ้นส่วน AR และ MA เกือบจะยกเลิกเพื่อให้กระบวนการมีลักษณะคล้ายกับสัญญาณรบกวนสีขาวในตัวอย่างที่ จำกัด ทำให้มีการปฏิเสธโมฆะจำนวนมากเนื่องจากกระบวนการยังคงมีหน่วยรูท

ด้านล่างนี้เป็นตัวอย่างสำหรับการทดสอบ ADF ที่คุณกล่าวถึง [Schwert จำลองว่าขนาดเชิงประจักษ์สุดขั้วสามารถสร้างขึ้นได้ด้วยโครงสร้าง MA ที่น้อยลงมากหากคุณดูสถิติสัมประสิทธิ์T(ρ^-1) หรือการทดสอบ Phillips-Perron แทนดูตารางที่ 5-10]

library(urca)
reps <- 1000
n <- 100
rejections <- matrix(NA,nrow=reps)

for (i in 1:reps){
  y <- cumsum(arima.sim(n = n, list(ma = -0.98)))
  rejections[i] <- (summary(ur.df(y, type = "drift", selectlags="Fixed",lags=12*(n/100)^.25))@teststat[1] < -2.89)
}
mean(rejections)

ตัวอย่างที่ 2

กระบวนการที่กำลังเปลี่ยนค่าเฉลี่ย แต่ไม่คงที่ ตัวอย่างเช่น,Yเสื้ออาจเป็นกระบวนการ AR (1) ที่มีค่าสัมประสิทธิ์ AR น้อยกว่าหนึ่งในค่าสัมบูรณ์ แต่ด้วยกระบวนการนวัตกรรมที่ความแปรปรวนเปลี่ยนแปลงอย่างถาวรในบางจุดในเวลา ("heteroskedasticity ที่ไม่มีเงื่อนไข") จากนั้นกระบวนการจะไม่มีรูทยูนิต แต่ก็ยังไม่หยุดนิ่งเนื่องจากการกระจายแบบไม่มีเงื่อนไขจะเปลี่ยนแปลงตลอดเวลา

การทดสอบ ADF จะยังคงปฏิเสธอยู่ทั้งนี้ขึ้นอยู่กับประเภทของการเปลี่ยนแปลงความแปรปรวน ในตัวอย่างของฉันด้านล่างเรามีการแตกแปรปรวนลดลงซึ่งทำให้การทดสอบ "เชื่อ" ว่าชุดมาบรรจบนำไปสู่การปฏิเสธโมฆะของหน่วยราก

library(urca)
reps <- 1000
n <- 100
rejections <- matrix(NA,nrow=reps)

for (i in 1:reps){
  u_1 <- rnorm(n/2,sd=5)
  u_2 <- rnorm(n/2,sd=1)
  u <- c(u_1,u_2)
  y <- arima.sim(n=n,list(ar = 0.8),innov=u)
  rejections[i] <- (summary(ur.df(y, type = "drift"))@teststat[1] < -2.89)      
}
mean(rejections)

(นอกเหนือจากนั้นการทดสอบ ADF "สูญเสีย" การแจกแจงโมฆะทางซีมโทติคเป็นหัวใจในการปรากฏตัวของ heteroskedasticity ที่ไม่มีเงื่อนไข)


@Glen_b นั้น (ฉันหวังว่า) อาจเป็นคำตอบสำหรับย่อหน้าแรกของคุณ แต่ไม่ใช่ชื่อคำถามของคุณจริงๆ - มีความแตกต่างหรือขาดความเข้าใจในส่วนของฉันหรือไม่
Christoph Hanck

"That" = ตัวอย่างที่ 1
Christoph Hanck

มันขึ้นอยู่กับสิ่งที่ "หน่วยราก" ถูกกำหนดให้เป็น ฉันเดิมได้เรียนรู้ว่ามันเป็น "รากในวงกลมหน่วย" (รากของโมดูลัสที่ 1) แต่ตอนนี้ดูเหมือนว่าจะเป็น (และในบริบทของการทดสอบ ADF ที่เกี่ยวข้องกับ) รากของพหุนามลักษณะจริงเท่ากับ 1 แม้ว่าฉันจะมีความรู้สึกผิดในชื่อเรื่องคำตอบของคุณตอบคำถามที่ตั้งใจไว้ดังนั้นคิดว่ามันโอเค
Glen_b

จุดของฉันอาจไม่ชัดเจนถ้อยคำ: ในชื่อที่คุณมองหาตัวอย่างของซีรีส์ "โดยไม่มีหน่วยราก" ในขณะที่ย่อหน้าแรก (สำหรับฉัน) ดูเหมือนจะมองหาตัวอย่างที่การปฏิเสธเป็นสิ่งที่ผิด ตัวอย่างแรกของฉันคือตัวอย่างสำหรับกรณีหลังซึ่ง ADF มีแนวโน้มที่จะปฏิเสธแม้ว่ากระบวนการจะมีหน่วยรูท
Christoph Hanck

อาขอโทษฉันไม่ได้คิดอย่างถูกต้อง ใช่อย่างเคร่งครัดมันไม่ได้เป็นไปตามการตีความชื่อ แต่มันยังคงตอบคำถามที่กว้างขึ้นในร่างกาย (ชื่อเรื่องจำเป็นต้องมีความเหมาะสมน้อยกว่าดังนั้นนี่ไม่ใช่ปัญหา) ... ฉันคิดว่ามันเป็นคำตอบที่น่าสนใจมากและหากมีสิ่งใดที่ตรงกับวัตถุประสงค์ที่แท้จริงของฉันดีกว่าชื่อที่ขอ
Glen_b -Reinstate Monica

7

การทดสอบรูทยูนิตนั้นทำได้ยาก การใช้การทดสอบหนึ่งครั้งนั้นไม่เพียงพอและคุณจะต้องระมัดระวังเกี่ยวกับสมมติฐานที่แน่นอนที่ใช้ในการทดสอบ

วิธีการสร้าง ADF ทำให้เกิดความเสี่ยงต่อซีรีย์ซึ่งเป็นแนวโน้มที่ไม่ใช่เชิงเส้นอย่างง่ายพร้อมสัญญาณรบกวนสีขาว นี่คือตัวอย่าง:

library(dplyr)
library(tseries)
set.seed(1000)
oo <- 1:1000  %>% lapply(function(n)adf.test(exp(seq(0, 2, by = 0.01)) + rnorm(201)))
pp <- oo %>% sapply("[[","p.value")

> sum(pp < 0.05)
[1] 680

ที่นี่เรามีแนวโน้มแบบทวีคูณและเราเห็นว่า ADF ทำงานได้ค่อนข้างแย่ จะยอมรับค่าว่างของรูทยูนิต 30% ของเวลาและปฏิเสธ 70% ของเวลา

โดยปกติแล้วผลการวิเคราะห์ใด ๆ จะไม่อ้างว่าซีรีส์นั้นอยู่กับที่หรือไม่ หากวิธีการที่ใช้ในการวิเคราะห์ต้องใช้ความคงที่การสันนิษฐานที่ผิด ๆ ว่าซีรีส์เป็นแบบนิ่งเมื่อไม่จริงมักปรากฏในลักษณะใด ๆ ดังนั้นฉันจึงดูการวิเคราะห์ทั้งหมดไม่เพียง แต่ส่วนการทดสอบรูทยูนิต ตัวอย่างเช่น OLS และ NLS ทำงานได้ดีสำหรับข้อมูลที่ไม่คงที่โดยที่ค่าคงที่ไม่อยู่ในค่าเฉลี่ยนั่นคือแนวโน้ม ดังนั้นหากมีคนอ้างว่าซีรีส์นั้นหยุดนิ่งและใช้ OLS / NLS อย่างไม่ถูกต้องการอ้างสิทธิ์นี้อาจไม่เกี่ยวข้องกัน


1
(+1) ไม่เพียง แต่สำหรับวิธีที่เป็นระเบียบเพื่อหลีกเลี่ยงการวนซ้ำในการจำลอง! ไม่ใช่ว่ามันสำคัญสำหรับข้อสรุปโดยรวม แต่: ดูเหมือนว่ามี 320 จาก 1,000 ครั้งที่ยอมรับได้ (พี>0.05) ไม่
Christoph Hanck

อ่าใช่ฉันสับสนในสัญญาณ ฉันแก้ไขคำตอบตามนั้น ขอบคุณที่สังเกต!
mpiktas

ทำไมคุณไม่ใช้sapply(oo, "[[","p.value")?
germcd

ฉันใช้มันก็ต่อเมื่อมีไวยากรณ์ของไพพ์เท่านั้น ฉันชอบไปป์ :)
mpiktas

1
ฉันก็ชอบ dplyr ด้วย สำหรับโค้ดนี้มันไม่จำเป็นการโหลด magrittr ก็เพียงพอแล้ว
mpiktas
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.