ความสับสนกับการทดสอบเพิ่มมากขึ้น Dickey Fuller


16

ฉันทำงานในชุดข้อมูลที่มีอยู่ในแพคเกจelectricity R TSAจุดประสงค์ของฉันคือการตรวจสอบว่าarimaแบบจำลองจะเหมาะสมกับข้อมูลนี้หรือไม่และในที่สุดก็พอดี ดังนั้นฉันจึงดำเนินการดังนี้:

1: พล็อตอนุกรมเวลาซึ่งส่งผลให้กราฟต่อไปนี้: ts plot1

2: ฉันต้องการที่จะใช้ log ของelectricityเพื่อรักษาความแปรปรวนและหลังจากนั้นซีรีส์ที่แตกต่างกันตามความเหมาะสม แต่ก่อนทำเช่นนั้น ชุดข้อมูลดั้งเดิมโดยใช้การทดสอบadf(เพิ่มยิ่งขึ้นดิกกี้) และน่าประหลาดใจมันส่งผลดังนี้:

รหัสและผลลัพธ์:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

ตามความคิดเกี่ยวกับอนุกรมเวลาของผู้เริ่มต้นของฉันฉันคิดว่ามันหมายความว่าข้อมูลนั้นเป็นข้อมูลนิ่ง (p-value ขนาดเล็กปฏิเสธสมมติฐานว่างของความไม่คงที่) แต่ดูพล็อตทีฉันไม่พบวิธีนี้สามารถนิ่ง ใครบ้างมีคำอธิบายที่ถูกต้องสำหรับเรื่องนี้?


5
ADF ทำการทดสอบเฉพาะกับรูทยูนิตที่อยู่นิ่งซึ่งอาจเป็นเทรนด์นิ่ง ดังนั้นคุณควรใช้การทดสอบ KPSS ดูที่stats.stackexchange.com/questions/30569/… โดยทั่วไปจะมีความแตกต่างระหว่างโมเดล DS (ความแตกต่างแบบนิ่ง) และแบบ TS (แนวโน้มคงที่) KPSS เป็นการทดสอบที่ดีกว่าในการแยกความแตกต่างระหว่างรุ่นเหล่านั้นดูลิงก์สำหรับรายละเอียดเพิ่มเติม
สถิติ Tistician

3
ดูเหมือนว่าซีรีส์จะมีฤดูกาลและเทรนด์ บูรณาการในการทดสอบ ADF แนวโน้มที่กำหนดขึ้น + หุ่นตามฤดูกาลและดำเนินการทดสอบ ตรวจสอบสิ่งที่เหลือโดยอัตโนมัติที่เกี่ยวข้องด้วย
Pantera

คำตอบ:


12

adf.testxเสื้อ-xเสื้อ-1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

2

สมมติว่า "adf.test" มาจากแพ็คเกจ "tseries" จริงๆ (ทั้งทางตรงและทางอ้อม) เหตุผลก็คือมันจะมีแนวโน้มเชิงเส้นเวลาโดยอัตโนมัติ จาก tseries doc (เวอร์ชั่น 0.10-35): "สมการการถดถอยทั่วไปที่รวมค่าคงที่และมีการใช้แนวโน้มเชิงเส้น [... ]" ดังนั้นผลการทดสอบบ่งชี้แนวโน้มความนิ่งแน่นอน (ซึ่งแม้ชื่อจะไม่อยู่นิ่ง)

ฉันเห็นด้วยกับ Pantera ว่าผลตามฤดูกาลอาจบิดเบือนผลลัพธ์ ในความเป็นจริงแล้วซีรีส์อาจเป็นแนวโน้มเวลา + ฤดูกาลที่กำหนดขึ้น + กระบวนการรูตหน่วยสุ่ม แต่การทดสอบ ADF อาจตีความความผันผวนของฤดูกาลในทางที่ผิดเนื่องจากการสลับสุ่มไปเป็นแนวโน้มที่กำหนดซึ่งจะแปลว่ารากมีขนาดเล็กกว่าเอกภาพ (ในทางกลับกันเนื่องจากคุณได้รวม lags เพียงพอแล้วสิ่งนี้ควรแสดงเป็นรูทหน่วย (ปลอม) ที่ความถี่ตามฤดูกาลไม่ใช่ความถี่ zero / long-run ที่การทดสอบ ADF ดูในกรณีใด ๆ ก็ตาม รูปแบบตามฤดูกาลจะดีกว่าหากจะรวมฤดูกาล)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.