เมื่อใดที่จะเข้าสู่การแปลงอนุกรมเวลาก่อนที่จะติดตั้งแบบจำลอง ARIMA


26

ก่อนหน้านี้ฉันเคยใช้โปรแกรมพยากรณ์อากาศเพื่อคาดการณ์อนุกรมเวลาที่ไม่เปลี่ยนแปลง แต่ฉันเปลี่ยนเวิร์กโฟลว์ของฉันไปเป็น R แพ็คเกจพยากรณ์สำหรับ R มีฟังก์ชั่นที่มีประโยชน์มากมาย แต่สิ่งหนึ่งที่มันไม่ได้ทำคือการแปลงข้อมูลชนิดใด ๆ .arima () ในบางกรณีการคาดการณ์โปรตัดสินใจที่จะเข้าสู่ระบบการแปลงข้อมูลก่อนที่จะทำการคาดการณ์ แต่ฉันยังไม่ได้หาสาเหตุ

ดังนั้นคำถามของฉันคือ: เมื่อใดที่ฉันควรเปลี่ยนชุดเวลาของฉันก่อนที่จะลองใช้วิธี ARIMA กับมัน

/ แก้ไข: หลังจากอ่านคำตอบของคุณฉันจะใช้สิ่งนี้โดยที่ x คืออนุกรมเวลาของฉัน:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

มันสมเหตุสมผลหรือไม่

คำตอบ:


21

คำเตือนบางอย่างก่อนดำเนินการต่อ ตามที่ฉันมักจะแนะนำให้นักเรียนของฉันใช้auto.arima()สิ่งต่าง ๆ เป็นเพียงการประมาณผลลัพธ์แรกของคุณเท่านั้นหรือหากคุณต้องการมีแบบจำลองทางศีลธรรมเมื่อคุณตรวจสอบว่าแบบจำลองเชิงทฤษฎีของคู่แข่งของคุณทำได้ดีกว่า

ข้อมูล

คุณต้องเริ่มต้นอย่างชัดเจนจากคำอธิบายของข้อมูลอนุกรมเวลาที่คุณทำงานด้วย ในเศรษฐศาสตร์มหภาคคุณมักจะทำงานกับข้อมูลที่รวบรวมและวิธีทางเรขาคณิต (น่าประหลาดใจ) มีหลักฐานเชิงประจักษ์มากขึ้นสำหรับข้อมูลอนุกรมเวลาแมโครอาจเป็นเพราะพวกมันส่วนใหญ่แตกสลายเป็นแนวโน้มที่เพิ่มขึ้นอย่างมาก

ตามคำแนะนำของ Rob "มองเห็น" ทำงานสำหรับอนุกรมเวลาที่มีส่วนตามฤดูกาลที่ชัดเจนเนื่องจากข้อมูลประจำปีที่เปลี่ยนแปลงช้านั้นไม่ชัดเจนสำหรับการเปลี่ยนแปลงที่เพิ่มขึ้น โชคดีที่มักจะเห็นแนวโน้มการเติบโตแบบทวีคูณ (หากดูเหมือนว่าจะเป็นแบบเชิงเส้นมากกว่าไม่จำเป็นต้องมีการบันทึก)

แบบ

Y(t)=X1α1(t)...Xkαk(t)ε(t)

ในบันทึกเศรษฐมิติทางการเงินเป็นเรื่องปกติเนื่องจากความนิยมในการส่งคืนบันทึกเนื่องจาก ...

การแปลงบันทึกมีคุณสมบัติที่ดี

αiY(t)Xi(t)

ในแบบจำลองการแก้ไขข้อผิดพลาดเรามีสมมติฐานที่ชัดเจนกว่าว่าสัดส่วนมีความเสถียรมากกว่า ( นิ่ง ) กว่าความแตกต่างแบบสัมบูรณ์

ในทางเศรษฐศาสตร์การเงินมันเป็นเรื่องง่ายที่จะรวมการเข้าสู่ระบบผลตอบแทนเมื่อเวลาผ่านไป

มีเหตุผลอื่น ๆ อีกมากมายที่ไม่ได้กล่าวถึงที่นี่

ในที่สุด

โปรดทราบว่าโดยปกติการแปลงไฟล์จะใช้กับตัวแปรที่ไม่เป็นลบ (ระดับ) หากคุณสังเกตเห็นความแตกต่างของอนุกรมเวลาสองรายการ (เช่นการส่งออกสุทธิ) คุณไม่สามารถแม้แต่จะทำการบันทึกคุณต้องค้นหาข้อมูลต้นฉบับในระดับหรือสมมติว่าเป็นรูปแบบของแนวโน้มทั่วไปที่ถูกลบออก

[ นอกจากนี้หลังจากแก้ไข ] หากคุณยังต้องการเกณฑ์ทางสถิติสำหรับเวลาที่จะทำการแปลงบันทึกการแก้ปัญหาที่เรียบง่ายจะเป็นการทดสอบใด ๆ สำหรับ heteroscedasticity ในกรณีของความแปรปรวนที่เพิ่มขึ้นฉันจะแนะนำการ ทดสอบ Goldfeld-Quandtหรือคล้ายกับมัน ใน R มันตั้งอยู่ในlibrary(lmtest)และถูกแสดงด้วยgqtest(y~1)ฟังก์ชั่น เพียงถอยกลับไปที่คำศัพท์ดักถ้าคุณไม่มีรูปแบบการถดถอยใด ๆyเป็นตัวแปรตามของคุณ


ขอบคุณสำหรับข้อมูล. ด้วยการทดสอบ GQ ค่า p ที่ต่ำลงมีโอกาสมากขึ้นที่การกระจายจะแตกต่างกันหรือไม่
Zach

@ Zach: แน่นอน 5% เช่นถ้าคุณไม่ได้วางแผนที่จะไปขุดข้อมูล โดยส่วนตัวแล้วผมเริ่มจากข้อสมมติฐานของแบบจำลอง
Dmitrij Celov

@Dmitrij ขอขอบคุณ. ฉันแค่ต้องการตรวจสอบให้แน่ใจว่าฉันกำลังตีความเอาต์พุตอย่างถูกต้อง
Zach

29

เขียนกราฟของข้อมูลเทียบกับเวลา หากดูเหมือนว่าการเปลี่ยนแปลงจะเพิ่มขึ้นตามระดับของซีรีส์ให้บันทึก มิเช่นนั้นสร้างโมเดลข้อมูลต้นฉบับ


3
นี่คือคำถาม: ผลกระทบอะไรถ้าคุณจดบันทึกและไม่ได้เรียกใช้ ฉันชอบมันเมื่อทำงานกับอนุกรมเวลาที่ต้องมีการแปลงบันทึกเพราะ (เท่าที่ฉันเข้าใจ) ค่าสัมประสิทธิ์เป็นอัตราส่วนและค่าเล็กเกือบร้อยละ (เช่น exp (0.05) = 1.051)
Wayne

4

โดยผลไม้ของพวกเขาพวกเจ้าจะได้รู้

ข้อสมมติฐาน (ที่จะทดสอบ) คือข้อผิดพลาดจากตัวแบบมีความแปรปรวนคงที่ หมายเหตุสิ่งนี้ไม่ได้หมายความว่าข้อผิดพลาดจากโมเดลที่สมมติขึ้น เมื่อคุณใช้การวิเคราะห์เชิงกราฟอย่างง่ายคุณจะต้องสมมติว่าเป็นโมเดลเชิงเส้นตรงเวลา

ดังนั้นหากคุณมีโมเดลไม่เพียงพอเช่นอาจมีการแนะนำโดยพล็อตชั่วคราวของข้อมูลเทียบกับเวลาคุณอาจสรุปได้อย่างไม่ถูกต้องเกี่ยวกับความต้องการการแปลงพลังงาน Box และ Jenkins ทำเช่นนั้นกับตัวอย่างข้อมูลสายการบินของพวกเขา พวกเขาไม่ได้คำนึงถึงค่าผิดปกติ 3 ตัวในข้อมูลล่าสุดดังนั้นพวกเขาจึงสรุปไม่ถูกต้องว่ามีความแปรปรวนสูงกว่าในระดับสูงสุดของซีรีส์

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้โปรดดูhttp://www.autobox.com/pdfs/vegas_ibf_09a.pdf


1

คุณอาจต้องการที่จะแปลงชุดเมื่อพวกเขามีรูปทรงทางเรขาคณิตตามธรรมชาติหรือที่ค่าเวลาของการลงทุนหมายถึงว่าคุณจะเปรียบเทียบกับพันธบัตรความเสี่ยงขั้นต่ำที่มีผลตอบแทนเชิงบวก สิ่งนี้จะทำให้พวกเขา "เชิงเส้น" มากขึ้นและเหมาะสำหรับความสัมพันธ์ที่เกิดซ้ำแบบง่าย ๆ


1
การเปลี่ยนแปลงเป็นเหมือนยาเสพติด: บางอย่างดีสำหรับคุณและบางอย่างก็ไม่ใช่ หากคุณไม่ได้สนใจในการทดสอบสมมติฐานทางสถิติคุณสามารถสมมติอะไรก็ได้ที่คุณต้องการ การทดสอบพารามิเตอร์ของสมมติฐานมีสมมติฐานเกี่ยวกับราคาที่ผิดพลาดไม่สนใจสิ่งเหล่านั้นที่เป็นอันตราย
IrishStat

1
จริงอยู่ ฉันบอกว่ากระบวนการนี้จำเป็นต้องมีรูปทรงเรขาคณิต ความล้มเหลวในการแปลงสามารถนำไปสู่ข้อผิดพลาดในการอนุมานเช่นกัน ฉันไม่เห็นว่าฉันกำลังแนะนำใครให้มองข้ามสมมติฐานที่เกี่ยวข้องกับเงื่อนไขของการอนุมานที่ถูกต้อง
DWIN

1
stats.stackexchange.com/questions/6498/…รวมการอภิปรายว่าเมื่อใดและทำไมต้องเปลี่ยน "ข้อเท็จจริง" ที่ต้นฉบับดั้งเดิมคือ "รูปทรงเรขาคณิต" ไม่ได้อนุมานว่าค่าที่เหลือจากแบบจำลองที่เพียงพอนั้นมีค่าเบี่ยงเบนมาตรฐานที่ได้สัดส่วนกับค่าเฉลี่ย มันสามารถ แต่จะต้องมีการพิสูจน์เชิงประจักษ์หรืออย่างน้อยทดสอบ
IrishStat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.