การทดสอบ Dickey-Fuller ใดสำหรับซีรี่ส์เวลาที่มีการสกัดกั้น / ดริฟท์และแนวโน้มเชิงเส้น


17

เวอร์ชั่นสั้น:

ฉันมีอนุกรมเวลาของข้อมูลสภาพภูมิอากาศที่ฉันกำลังทดสอบหาอยู่กับที่ จากการวิจัยก่อนหน้านี้ฉันคาดหวังรูปแบบพื้นฐาน (หรือ "การสร้าง" เพื่อที่จะพูด) ข้อมูลที่จะมีคำดักจับและแนวโน้มเวลาเชิงเส้นเชิงบวก ในการทดสอบข้อมูลเหล่านี้สำหรับความคงที่ฉันควรใช้การทดสอบ Dickey-Fuller ที่มีการสกัดกั้นและแนวโน้มเวลาเช่นสมการ # 3หรือไม่

Yเสื้อ=α0+α1เสื้อ+δYเสื้อ-1+ยูเสื้อ

หรือฉันควรใช้การทดสอบ DF ที่มีเพียงการสกัดกั้นเพราะความแตกต่างแรกของสมการที่ฉันเชื่อว่าการจำลองนั้นมีเพียงการสกัดกั้น?

รุ่นยาว:

ตามที่ระบุไว้ข้างต้นฉันมีอนุกรมเวลาของข้อมูลสภาพภูมิอากาศที่ฉันกำลังทดสอบหาอยู่กับที่ จากการวิจัยก่อนหน้านี้ฉันคาดหวังว่าแบบจำลองที่อยู่ภายใต้ข้อมูลจะมีระยะเวลาการสกัดกั้นแนวโน้มเชิงเส้นเวลาเชิงบวกและคำผิดพลาดบางส่วนที่กระจายตามปกติ กล่าวอีกนัยหนึ่งฉันคาดหวังว่าแบบจำลองพื้นฐานจะมีลักษณะดังนี้:

Yเสื้อ=a0+a1เสื้อ+βYเสื้อ-1+ยูเสื้อ

ที่มีการกระจายตามปกติ เนื่องจากฉันสมมติว่าโมเดลพื้นฐานมีทั้งการสกัดกั้นและแนวโน้มเวลาเชิงเส้นฉันจึงทดสอบหาหน่วยรากด้วยสมการ # 3ของการทดสอบ Dickey-Fuller อย่างง่ายดังที่แสดง:ยูเสื้อ

Yเสื้อ=α0+α1เสื้อ+δYเสื้อ-1+ยูเสื้อ

การทดสอบนี้ส่งคืนค่าวิกฤตที่จะทำให้ฉันปฏิเสธสมมติฐานว่างและสรุปว่าแบบจำลองพื้นฐานไม่คงที่ แต่ผมคำถามถ้าฉันใช้นี้อย่างถูกต้องตั้งแต่แม้ว่ารูปแบบพื้นฐานจะถือว่ามีการตัดและแนวโน้มการครั้งนี้ไม่ได้หมายความว่าความแตกต่างครั้งแรกจะได้เป็นอย่างดี อันที่จริงแล้วถ้าคณิตศาสตร์ของฉันถูกต้องYเสื้อ

การคำนวณความแตกต่างแรกขึ้นอยู่กับสมการของโมเดลพื้นฐานที่สมมติให้: Yเสื้อ=Yเสื้อ-Yเสื้อ-1=[a0+a1เสื้อ+βYเสื้อ-1+ยูเสื้อ]-[a0+a1(เสื้อ-1)+βYเสื้อ-2+ยูเสื้อ-1]

Yเสื้อ=[a0-a0]+[a1เสื้อ-aเสื้อ(เสื้อ-1)]+β[Yเสื้อ-1-Yเสื้อ-2]+[ยูเสื้อ-ยูเสื้อ-1]

Yเสื้อ=a1+βYเสื้อ-1+ยูเสื้อ-ยูเสื้อ-1

ดังนั้นความแตกต่างครั้งแรกปรากฏเพียงมีการสกัดกั้นไม่ได้เป็นแนวโน้มเวลาYเสื้อ

ฉันคิดว่าคำถามของฉันคล้ายกับคำถามนี้ยกเว้นฉันไม่แน่ใจว่าจะใช้คำตอบนั้นกับคำถามของฉันอย่างไร

ข้อมูลตัวอย่าง:

นี่คือข้อมูลอุณหภูมิตัวอย่างบางส่วนที่ฉันทำงานด้วย

64.19749  
65.19011  
64.03281  
64.99111  
65.43837  
65.51817  
65.22061  
65.43191  
65.0221  
65.44038  
64.41756  
64.65764  
64.7486  
65.11544  
64.12437  
64.49148  
64.89215  
64.72688  
64.97553  
64.6361  
64.29038  
65.31076  
64.2114  
65.37864  
65.49637  
65.3289  
65.38394  
65.39384  
65.0984  
65.32695  
65.28  
64.31041  
65.20193  
65.78063  
65.17604  
66.16412  
65.85091  
65.46718  
65.75551  
65.39994  
66.36175  
65.37125  
65.77763  
65.48623  
64.62135  
65.77237  
65.84289  
65.80289  
66.78865  
65.56931  
65.29913  
64.85516  
65.56866  
64.75768  
65.95956  
65.64745  
64.77283  
65.64165  
66.64309  
65.84163  
66.2946  
66.10482  
65.72736  
65.56701  
65.11096  
66.0006  
66.71783  
65.35595  
66.44798  
65.74924  
65.4501  
65.97633  
65.32825  
65.7741  
65.76783  
65.88689  
65.88939  
65.16927  
64.95984  
66.02226  
66.79225  
66.75573  
65.74074  
66.14969  
66.15687  
65.81199  
66.13094  
66.13194  
65.82172  
66.14661  
65.32756  
66.3979  
65.84383  
65.55329  
65.68398  
66.42857  
65.82402  
66.01003  
66.25157  
65.82142  
66.08791  
65.78863  
66.2764  
66.00948  
66.26236  
65.40246  
65.40166  
65.37064  
65.73147  
65.32708  
65.84894  
65.82043  
64.91447  
65.81062  
66.42228  
66.0316  
65.35361  
66.46407  
66.41045  
65.81548  
65.06059  
66.25414  
65.69747  
65.15275  
65.50985  
66.66216  
66.88095  
65.81281  
66.15546  
66.40939  
65.94115  
65.98144  
66.13243  
66.89761  
66.95423  
65.63435  
66.05837  
66.71114 

1
ฉันไม่ทราบว่าสิ่งที่มีอยู่ในลิงค์นี้ ( tamino.wordpress.com/2010/03/11/not-a-random-walk ) ตอบคำถามของคุณ แต่ฉันคิดว่าคุณน่าจะสนใจมันอยู่ดี
Matt Albrecht

@MattAlbrecht นั่นคือลิงค์ที่น่าสนใจมาก ฉันยังสับสนว่าฉันควรใช้การทดสอบ Dickey-Fuller กับซีรี่ส์เวลาดั้งเดิมของฉันอย่างไร ฉันพยายามเพิ่มข้อมูลที่เกี่ยวข้องเพิ่มเติมในการแก้ไขล่าสุดของฉัน
Ricardo Altamirano

ขออภัยฉันไม่สามารถให้คำตอบที่ดีกว่าคุณ - ฉันไม่ได้อยู่ด้านบนของการวิเคราะห์อนุกรมเวลาของฉัน อย่างไรก็ตามคุณอาจสนใจคำถามนี้ที่ฉันถามเมื่อเร็ว ๆ นี้ ( stats.stackexchange.com/questions/27748 ) ซึ่งเป็นชุดอนุกรมเวลาของสภาพอากาศและมีการวิเคราะห์อย่างละเอียดเกี่ยวกับอุณหภูมิเทียบกับ CO2 จากชุดข้อมูลเวลาโปร มันอาจช่วยคนอื่น ๆ ถ้าคุณมีข้อมูลบางอย่างที่คุณสามารถโพสต์ได้?
Matt Albrecht

@MattAlbrecht ฉันเพิ่มข้อมูลตัวอย่างบางส่วน มีรูปแบบที่ดีกว่าสำหรับฉันที่จะรวมไว้ในหรือไม่
Ricardo Altamirano

คำตอบ:


20

คุณจำเป็นต้องพิจารณาแนวโน้มการดริฟท์และ (พารามิเตอร์ / เชิงเส้น) ในระดับของอนุกรมเวลาเพื่อระบุเงื่อนไขที่กำหนดไว้ในการถดถอยยิ่ง Dickey-Fuller ซึ่งเป็นความแตกต่างแรกของอนุกรมเวลา ความสับสนเกิดขึ้นจากการหาสมการความแตกต่างแรกในวิธีที่คุณทำ

(เพิ่มเติม) โมเดลการถดถอยของ Dickey-Fuller

สมมติว่าระดับของซีรีส์นั้นรวมถึงคำว่าดริฟท์และเทรนด์

Yเสื้อ=β0,ล.+β1,ล.เสื้อ+β2,ล.Yเสื้อ-1+εเสื้อ
H0:β2,ล.=1

ΔYเสื้อ=β1,ล.+β2,ล.ΔYเสื้อ-1+Δεเสื้อ

Yเสื้อ-1

ΔYเสื้อ=β0,ล.+β1,ล.เสื้อ+(β2,ล.-1)Yเสื้อ-1+εเสื้อβ0,d+β1,dเสื้อ+β2,dYเสื้อ-1+εเสื้อ
H0:β2,d=0β2,d

H0:[β2,d,β1,ล.]'=[0,0]'ur.dfurca

ให้เราพิจารณาตัวอย่างโดยละเอียด

ตัวอย่าง

1. การใช้ชุดการลงทุนของสหรัฐอเมริกา

ตัวอย่างแรกใช้ชุดลงทุนของสหรัฐซึ่งจะกล่าวถึงในLutkepohl และ Kratzig (2005, หน้า. 9) เนื้อเรื่องของซีรี่ส์และความแตกต่างแรกของมันได้รับด้านล่าง

ป้อนคำอธิบายรูปภาพที่นี่

ΔYเสื้อ=β0,d+β2,dYเสื้อ-1+ΣJ=13γJΔYเสื้อ-J+εเสื้อ
สังเกตจุดสำคัญที่ฉันได้ดูระดับเพื่อระบุสมการการถดถอยในความแตกต่าง

รหัส R เพื่อทำสิ่งนี้ได้รับด้านล่าง:

    library(urca)
    library(foreign)
    library(zoo)

    tsInv <- as.zoo(ts(as.data.frame(read.table(
      "http://www.jmulti.de/download/datasets/US_investment.dat", skip=8, header=TRUE)), 
                       frequency=4, start=1947+2/4))
    png("USinvPlot.png", width=6,
        height=7, units="in", res=100)
    par(mfrow=c(2, 1))
    plot(tsInv$USinvestment)
    plot(diff(tsInv$USinvestment))
    dev.off()

    # ADF with intercept
    adfIntercept <- ur.df(tsInv$USinvestment, lags = 3, type= 'drift')
    summary(adfIntercept)

ผลการวิจัยพบว่าสมมติฐานว่างของความไม่เสถียรสามารถปฏิเสธได้สำหรับชุดนี้โดยใช้การทดสอบทีขึ้นอยู่กับค่าสัมประสิทธิ์โดยประมาณ ข้อต่อ F-test ของจุดตัดแกนและค่าสัมประสิทธิ์ความชัน (H:[β2,d,β0,ล.]'=[0,0]' ) ยังปฏิเสธสมมติฐานว่างว่ามีหน่วยรากในซีรีย์

2. ใช้ชุดการใช้ภาษาเยอรมัน (บันทึก)

ตัวอย่างที่สองคือการใช้ซีรีย์เวลา (log) ที่ปรับเปลี่ยนตามฤดูกาลรายไตรมาสของเยอรมัน เนื้อเรื่องของซีรี่ส์และความแตกต่างได้รับด้านล่าง

ป้อนคำอธิบายรูปภาพที่นี่

ΔYเสื้อ=β0,d+β1,dเสื้อ+β2,dYเสื้อ-1+ΣJ=14γJΔYเสื้อ-J+εเสื้อ

รหัส R เพื่อทำสิ่งนี้คือ

# using the (log) consumption series
tsConsump <- zoo(read.dta("http://www.stata-press.com/data/r12/lutkepohl2.dta"), frequency=1)
png("logConsPlot.png", width=6,
    height=7, units="in", res=100)
par(mfrow=c(2, 1))
plot(tsConsump$ln_consump)
plot(diff(tsConsump$ln_consump))
dev.off()

# ADF with trend
adfTrend <- ur.df(tsConsump$ln_consump, lags = 4, type = 'trend')
summary(adfTrend)

ผลการวิจัยพบว่าไม่สามารถปฏิเสธโมฆะของความไร้เสถียรภาพโดยใช้การทดสอบทีขึ้นอยู่กับค่าสัมประสิทธิ์โดยประมาณ ข้อต่อ F-test ของค่าสัมประสิทธิ์แนวโน้มเชิงเส้นและค่าสัมประสิทธิ์ความชัน (H:[β2,d,β1,ล.]'=[0,0]' ) นอกจากนี้ยังระบุว่าไม่สามารถปฏิเสธค่า null ของความไม่เป็นขั้วได้

3. การใช้ข้อมูลอุณหภูมิที่กำหนด

ตอนนี้เราสามารถประเมินคุณสมบัติของข้อมูลของคุณ แปลงปกติในระดับและความแตกต่างแรกได้รับด้านล่าง

ป้อนคำอธิบายรูปภาพที่นี่

สิ่งเหล่านี้บ่งชี้ว่าข้อมูลของคุณมีการสกัดกั้นและเทรนด์ดังนั้นเราจึงทำการทดสอบ ADF (โดยไม่มีเงื่อนไขข้อแตกต่างแรกที่ล่าช้า) โดยใช้รหัส R ต่อไปนี้

# using the given data
tsTemp <- read.table(textConnection("temp 
64.19749  
65.19011  
64.03281  
64.99111  
65.43837  
65.51817  
65.22061  
65.43191  
65.0221  
65.44038  
64.41756  
64.65764  
64.7486  
65.11544  
64.12437  
64.49148  
64.89215  
64.72688  
64.97553  
64.6361  
64.29038  
65.31076  
64.2114  
65.37864  
65.49637  
65.3289  
65.38394  
65.39384  
65.0984  
65.32695  
65.28  
64.31041  
65.20193  
65.78063  
65.17604  
66.16412  
65.85091  
65.46718  
65.75551  
65.39994  
66.36175  
65.37125  
65.77763  
65.48623  
64.62135  
65.77237  
65.84289  
65.80289  
66.78865  
65.56931  
65.29913  
64.85516  
65.56866  
64.75768  
65.95956  
65.64745  
64.77283  
65.64165  
66.64309  
65.84163  
66.2946  
66.10482  
65.72736  
65.56701  
65.11096  
66.0006  
66.71783  
65.35595  
66.44798  
65.74924  
65.4501  
65.97633  
65.32825  
65.7741  
65.76783  
65.88689  
65.88939  
65.16927  
64.95984  
66.02226  
66.79225  
66.75573  
65.74074  
66.14969  
66.15687  
65.81199  
66.13094  
66.13194  
65.82172  
66.14661  
65.32756  
66.3979  
65.84383  
65.55329  
65.68398  
66.42857  
65.82402  
66.01003  
66.25157  
65.82142  
66.08791  
65.78863  
66.2764  
66.00948  
66.26236  
65.40246  
65.40166  
65.37064  
65.73147  
65.32708  
65.84894  
65.82043  
64.91447  
65.81062  
66.42228  
66.0316  
65.35361  
66.46407  
66.41045  
65.81548  
65.06059  
66.25414  
65.69747  
65.15275  
65.50985  
66.66216  
66.88095  
65.81281  
66.15546  
66.40939  
65.94115  
65.98144  
66.13243  
66.89761  
66.95423  
65.63435  
66.05837  
66.71114"), header=T)
tsTemp <- as.zoo(ts(tsTemp, frequency=1))

png("tempPlot.png", width=6,
    height=7, units="in", res=100)
par(mfrow=c(2, 1))
plot(tsTemp$temp)
plot(diff(tsTemp$temp))
dev.off()

# ADF with trend
adfTrend <- ur.df(tsTemp$temp, type = 'trend')
summary(adfTrend)

ผลลัพธ์สำหรับทั้ง t-test และ F-test ระบุว่าโมฆะของ nonstationarity สามารถถูกปฏิเสธสำหรับชุดอุณหภูมิ ฉันหวังว่าจะอธิบายเรื่องนี้ค่อนข้างชัดเจน


5
นี่เป็นหนึ่งในคำตอบที่ชัดเจนและเป็นประโยชน์ที่สุดที่ฉันได้รับในเครือข่าย Stack Exchange และมันทำให้ความสับสนของฉันเกี่ยวกับการทดสอบ DF ตรงขึ้น ขอขอบคุณ.
Ricardo Altamirano

@RicardoAltamirano ยินดีต้อนรับ ดีใจที่ฉันสามารถช่วย
tchakravarty

2
เห็นด้วยนี่เป็นคำตอบที่ดีมาก
RAH

0

สมมติฐานว่างในการทดสอบ Dickey-Fuller คือมีหน่วยรากในกระบวนการ ดังนั้นเมื่อคุณปฏิเสธโมฆะคุณจะเห็นว่ากระบวนการของคุณอยู่กับที่ (กับการทดสอบสมมติฐานทั่วไป)

Yเสื้อ=α0+α1เสื้อ+δYเสื้อ-1+ยูเสื้อ

Yเสื้อYเสื้อYเสื้อ-1Yเสื้อ-1Yเสื้อ-1


0

คำตอบก่อนหน้านั้นยอดเยี่ยม

คุณมักจะตัดสินใจเกี่ยวกับการทดสอบที่จะใช้ตามพล็อต ในกรณีนี้ข้อมูลดูเหมือนจะมีการสกัดกั้นและแนวโน้ม

หากคุณทดสอบหารูทยูนิตในระดับคุณจะต้องใช้โมเดลการสกัดกั้นและเทรนด์ หากคุณทำการทดสอบในความแตกต่างคุณจะใช้เพียงรูปแบบการสกัดกั้น

ฉันเพิ่งตอบคำถามนี้เพราะฉันต้องแนะนำให้คุณใช้การทดสอบตามฤดูกาลกับข้อมูลนี้ การทดสอบเหล่านี้ซับซ้อนมาก (การทำงานกับฤดูกาลไม่ใช่เรื่องง่าย) อย่างไรก็ตามลักษณะของข้อมูล (อุณหภูมิ) และเนื่องจากในโครงเรื่องคุณสามารถสังเกตเห็นพฤติกรรมตามฤดูกาลได้ จากนั้นคุณควรวิจัยเกี่ยวกับการทดสอบ HEGY และนำไปใช้หากคุณต้องการให้การประเมินของคุณมีความแข็งแกร่ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.