ประมาณค่าสัมประสิทธิ์ ARMA ผ่านการตรวจ ACF และ PACF


16

คุณประเมินแบบจำลองการพยากรณ์ที่เหมาะสมสำหรับอนุกรมเวลาอย่างไรโดยการตรวจสอบด้วยตาเปล่าของแผนการแปลง ACF และ PACF ตัวไหน (เช่น ACF หรือ PACF) บอก AR หรือ MA (หรือพวกเขาทั้งสอง)? กราฟใดที่บอกส่วนของฤดูกาลและไม่ใช่ฤดูกาลสำหรับ ARIMA ตามฤดูกาล

พิจารณาฟังก์ชั่น ACF และ PCF ที่แสดงด้านล่าง พวกเขามาจากบันทึกการเปลี่ยนชุดที่ได้รับการ differenced สองแตกต่างกันอย่างใดอย่างหนึ่งที่ง่ายและฤดูกาลหนึ่ง ( ข้อมูลเดิม , บันทึกข้อมูลเปลี่ยน ) คุณจะอธิบายลักษณะของซีรี่ส์อย่างไร แบบไหนที่เหมาะกับมันที่สุด?

ป้อนคำอธิบายรูปภาพที่นี่

คำตอบ:


12

คำตอบของฉันเป็นตัวย่อของ javlacelle แต่ยาวเกินไปสำหรับความคิดเห็นง่ายๆ แต่ไม่สั้นเกินไปที่จะไร้ประโยชน์

ในขณะที่การตอบสนองของ jvlacelle นั้นถูกต้องทางเทคนิคในระดับหนึ่งมัน "ลดความซับซ้อนมากเกินไป" เนื่องจากมี "สิ่ง" บางอย่างซึ่งปกติไม่เคยเป็นจริง สันนิษฐานว่าไม่มีโครงสร้างที่กำหนดขึ้นเช่นแนวโน้มเวลาหนึ่งช่วงหรือมากกว่าหนึ่งช่วงการเลื่อนระดับหรือพัลส์ตามฤดูกาลตั้งแต่หนึ่งช่วงขึ้นไปหรือพัลส์แบบครั้งเดียวขึ้นไป ยิ่งไปกว่านั้นมันสันนิษฐานว่าพารามิเตอร์ของตัวแบบที่ระบุนั้นไม่แปรเปลี่ยนไปตามกาลเวลาและกระบวนการข้อผิดพลาดที่อยู่ภายใต้ตัวแบบที่ไม่แน่นอนนั้นยังคงอยู่ตลอดเวลา การเพิกเฉยสิ่งใด ๆ ข้างต้นมักเป็น (ในความคิดของฉันเสมอ!) สูตรสำหรับภัยพิบัติหรือแม่นยำกว่า "โมเดลที่ระบุไม่ดี" กรณีคลาสสิกของเรื่องนี้คือการแปลงลอการิทึมที่ไม่จำเป็นสำหรับสายการบินและสำหรับซีรี่ส์ที่ OP แสดงในคำถามที่เขาแก้ไข ไม่จำเป็นต้องมีการแปลงลอการิทึมใด ๆ สำหรับข้อมูลของเขาเนื่องจากมีค่า "ผิดปกติ" เพียงไม่กี่ตัวที่ช่วงเวลา 198,207,218,219 และ 256 ซึ่งไม่เหลือค่าที่ไม่ถูกสร้างสร้างการแสดงผลที่ผิดพลาดซึ่งมีระดับความแปรปรวนผิดพลาดสูงกว่า โปรดทราบว่า "ค่าผิดปกติ" ถูกระบุโดยคำนึงถึงโครงสร้าง ARIMA ที่จำเป็นซึ่งมักจะหลบหนีออกมาจากดวงตาของมนุษย์การเปลี่ยนรูปนั้นจำเป็นเมื่อความแปรปรวนของข้อผิดพลาดนั้นไม่คงที่ตลอดเวลาไม่ใช่เมื่อความแปรปรวนของ Y สังเกตไม่คงที่ตลอดเวลา . ขั้นตอนดั้งเดิมยังคงทำให้เกิดข้อผิดพลาดทางยุทธวิธีของการเลือกการเปลี่ยนแปลงก่อนเวลาอันควรก่อนที่จะมีการเยียวยาดังกล่าวข้างต้น เราต้องจำไว้ว่ากลยุทธ์การระบุตัวตนแบบง่าย ๆ ของ ARIMA ได้รับการพัฒนาในช่วงต้นยุค 60 แต่มีการพัฒนา / ปรับปรุงจำนวนมากตั้งแต่นั้นมา 219 และ 256 ที่ไม่ได้รับการรักษาซ้ายสร้างการแสดงผลที่ผิดพลาดว่ามีความแปรปรวนข้อผิดพลาดที่สูงขึ้นกับระดับที่สูงขึ้น โปรดทราบว่า "ค่าผิดปกติ" ถูกระบุโดยคำนึงถึงโครงสร้าง ARIMA ที่จำเป็นซึ่งมักจะหลบหนีออกมาจากดวงตาของมนุษย์การเปลี่ยนรูปนั้นจำเป็นเมื่อความแปรปรวนของข้อผิดพลาดนั้นไม่คงที่ตลอดเวลาไม่ใช่เมื่อความแปรปรวนของ Y สังเกตไม่คงที่ตลอดเวลา . ขั้นตอนดั้งเดิมยังคงทำให้เกิดข้อผิดพลาดทางยุทธวิธีของการเลือกการเปลี่ยนแปลงก่อนเวลาอันควรก่อนที่จะมีการเยียวยาดังกล่าวข้างต้น เราต้องจำไว้ว่ากลยุทธ์การระบุตัวตนแบบง่าย ๆ ของ ARIMA ได้รับการพัฒนาในช่วงต้นยุค 60 แต่มีการพัฒนา / ปรับปรุงจำนวนมากตั้งแต่นั้นมา 219 และ 256 ที่ไม่ได้รับการรักษาซ้ายสร้างการแสดงผลที่ผิดพลาดว่ามีความแปรปรวนข้อผิดพลาดที่สูงขึ้นกับระดับที่สูงขึ้น โปรดทราบว่า "ค่าผิดปกติ" ถูกระบุโดยคำนึงถึงโครงสร้าง ARIMA ที่จำเป็นซึ่งมักจะหลบหนีออกมาจากดวงตาของมนุษย์การเปลี่ยนรูปนั้นจำเป็นเมื่อความแปรปรวนของข้อผิดพลาดนั้นไม่คงที่ตลอดเวลาไม่ใช่เมื่อความแปรปรวนของ Y สังเกตไม่คงที่ตลอดเวลา . ขั้นตอนดั้งเดิมยังคงทำให้เกิดข้อผิดพลาดทางยุทธวิธีของการเลือกการเปลี่ยนแปลงก่อนเวลาอันควรก่อนที่จะมีการเยียวยาดังกล่าวข้างต้น เราต้องจำไว้ว่ากลยุทธ์การระบุตัวตนแบบง่าย ๆ ของ ARIMA ได้รับการพัฒนาในช่วงต้นยุค 60 แต่มีการพัฒนา / ปรับปรุงจำนวนมากตั้งแต่นั้นมา มีการระบุโดยคำนึงถึงโครงสร้าง ARIMA ที่จำเป็นซึ่งมักจะหลบหนีออกมาจากสายตามนุษย์การเปลี่ยนแปลงมีความจำเป็นเมื่อความแปรปรวนของข้อผิดพลาดไม่คงที่ตลอดเวลาไม่เมื่อความแปรปรวนของ Y ที่สังเกตนั้นไม่คงที่ตลอดเวลา ขั้นตอนดั้งเดิมยังคงทำให้เกิดข้อผิดพลาดทางยุทธวิธีของการเลือกการเปลี่ยนแปลงก่อนเวลาอันควรก่อนที่จะมีการเยียวยาดังกล่าวข้างต้น เราต้องจำไว้ว่ากลยุทธ์การระบุตัวตนแบบง่าย ๆ ของ ARIMA ได้รับการพัฒนาในช่วงต้นยุค 60 แต่มีการพัฒนา / ปรับปรุงจำนวนมากตั้งแต่นั้นมา มีการระบุโดยคำนึงถึงโครงสร้าง ARIMA ที่จำเป็นซึ่งมักจะหลบหนีออกมาจากสายตามนุษย์การเปลี่ยนแปลงมีความจำเป็นเมื่อความแปรปรวนของข้อผิดพลาดไม่คงที่ตลอดเวลาไม่เมื่อความแปรปรวนของ Y ที่สังเกตนั้นไม่คงที่ตลอดเวลา ขั้นตอนดั้งเดิมยังคงทำให้เกิดข้อผิดพลาดทางยุทธวิธีของการเลือกการเปลี่ยนแปลงก่อนเวลาอันควรก่อนที่จะมีการเยียวยาดังกล่าวข้างต้น เราต้องจำไว้ว่ากลยุทธ์การระบุตัวตนแบบง่าย ๆ ของ ARIMA ได้รับการพัฒนาในช่วงต้นยุค 60 แต่มีการพัฒนา / ปรับปรุงจำนวนมากตั้งแต่นั้นมา ขั้นตอนดั้งเดิมยังคงทำให้เกิดข้อผิดพลาดทางยุทธวิธีของการเลือกการเปลี่ยนแปลงก่อนเวลาอันควรก่อนที่จะมีการเยียวยาดังกล่าวข้างต้น เราต้องจำไว้ว่ากลยุทธ์การระบุตัวตนแบบง่าย ๆ ของ ARIMA ได้รับการพัฒนาในช่วงต้นยุค 60 แต่มีการพัฒนา / ปรับปรุงจำนวนมากตั้งแต่นั้นมา ขั้นตอนดั้งเดิมยังคงทำให้เกิดข้อผิดพลาดทางยุทธวิธีของการเลือกการเปลี่ยนแปลงก่อนเวลาอันควรก่อนที่จะมีการเยียวยาดังกล่าวข้างต้น เราต้องจำไว้ว่ากลยุทธ์การระบุตัวตนแบบง่าย ๆ ของ ARIMA ได้รับการพัฒนาในช่วงต้นยุค 60 แต่มีการพัฒนา / ปรับปรุงจำนวนมากตั้งแต่นั้นมา

แก้ไขหลังจากโพสต์ข้อมูลแล้ว:

แบบจำลองที่สมเหตุสมผลได้รับการระบุโดยใช้http://www.autobox.com/cms/ซึ่งเป็นซอฟต์แวร์ชิ้นหนึ่งที่รวมเอาความคิดบางอย่างของฉันดังที่ฉันได้ช่วยพัฒนามันขึ้นมา ป้อนคำอธิบายรูปภาพที่นี่การทดสอบ Chow สำหรับความมั่นคงของพารามิเตอร์ชี้ให้เห็นว่าข้อมูลถูกแบ่งกลุ่มและการสังเกต 94 ครั้งสุดท้ายถูกนำมาใช้เป็นพารามิเตอร์ของแบบจำลองที่เปลี่ยนแปลงตลอดเวลา ป้อนคำอธิบายรูปภาพที่นี่. เหล่านี้ 94 ค่าล่าสุดให้สมการป้อนคำอธิบายรูปภาพที่นี่กับสัมประสิทธิ์ทั้งหมดที่มีนัยสำคัญ ป้อนคำอธิบายรูปภาพที่นี่. พล็อตของคลาดเคลื่อนแสดงให้เห็นการกระจายที่เหมาะสมป้อนคำอธิบายรูปภาพที่นี่มีดังต่อไป ACF ป้อนคำอธิบายรูปภาพที่นี่แนะนำการสุ่ม กราฟที่เกิดขึ้นจริงและทำความสะอาดกำลังส่องสว่างตามที่แสดงค่าผิดปกติเล็กน้อย แต่สำคัญ ป้อนคำอธิบายรูปภาพที่นี่. ในที่สุดพล็อตที่เกิดขึ้นจริงพอดีและการคาดการณ์สรุปการทำงานของเราทั้งหมดโดยไม่ต้องใช้ลอการิทึมป้อนคำอธิบายรูปภาพที่นี่. เป็นที่รู้จักกันดี แต่มักจะลืมไปว่าการแปลงพลังงานเป็นเหมือนยาเสพติด ในที่สุดสังเกตว่าโมเดลนั้นมี AR (2) แต่ไม่ใช่โครงสร้าง AR (1)


เหตุใดเราจึงไม่สามารถเปลี่ยนการบันทึกได้ โปรดดูชุดข้อมูล AirPassengers ใน R ซึ่งมีฤดูกาลแบบทวีคูณจดบันทึกเปลี่ยนเป็นซีซันตามฤดูกาล นอกจากนี้หากเราไม่บันทึกชุดข้อมูลจะมีความแปรปรวนเพิ่มขึ้นนั่นคือจะไม่หยุดนิ่ง ฉันจะจัดการกับชุดข้อมูลดังกล่าวโดยไม่เปลี่ยนการบันทึกได้อย่างไร คุณช่วยอธิบายได้มั้ย
user2338823

"ไม่จำเป็นต้องมีการแปลงลอการิทึมใด ๆ สำหรับข้อมูลของเขาเนื่องจากมีค่า" ผิดปกติ "เพียงไม่กี่ค่าในช่วงเวลาที่ไม่ได้รับการรักษาสร้างการแสดงผลที่ผิดพลาดซึ่งมีความแปรปรวนข้อผิดพลาดสูงกว่าในระดับที่สูงขึ้น" ข้อสมมุติคงที่ของความคงที่ของความแปรปรวนเป็นเรื่องเกี่ยวกับความแปรปรวนของข้อผิดพลาดที่ไม่เกี่ยวกับความแปรปรวนของชุดดั้งเดิมซอฟต์แวร์ R ไม่อนุญาตให้มีการระบุและรวมความผิดปกติโดยอัตโนมัติ ดูautobox.com/cms/index.php/blogการสนทนาในซีรีส์ AND autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat

การทดสอบ Box-Cox สำหรับการแปลงพลังงานถือว่าไม่มีค่าผิดปกติดังนั้นจึงสามารถเชื่อมโยงความแปรปรวนการเปลี่ยนแปลงที่ผิดพลาดโดยไม่ตั้งใจกับค่าที่คาดไว้ดังนั้นจึงแนะนำความต้องการการแปลงอย่างไม่ถูกต้อง ดูบทความdocplayer.net/ ของ Tsayจากนักเรียนคนหนึ่งใน Box ว่าเป็นเกริ่นนำในการจัดการกับโครงสร้างที่กำหนดแบบแฝงที่ไม่ได้รับการรักษาลาก่อนถ้าคุณไม่ / ไม่สามารถจัดการกับการละเมิดช่วงเวลาแรกที่คุณสามารถปรับได้อย่างไม่ถูกต้อง การเปลี่ยนแปลงความแปรปรวนทั้งผ่านการแปลงพลังงานหรือ GLS เมื่อ Tsay ชี้ให้เห็น
IrishStat

14

เพียงเพื่อล้างแนวคิดโดยการตรวจสอบด้วยตาเปล่าของ ACF หรือ PACF คุณสามารถเลือก (ไม่ประมาณ) โมเดล ARMA เบื้องต้น เมื่อเลือกแบบจำลองแล้วคุณสามารถประมาณแบบจำลองได้โดยการเพิ่มฟังก์ชั่นความน่าจะเป็นสูงสุดลดผลรวมของกำลังสองหรือในกรณีของแบบจำลอง AR โดยใช้วิธีการของช่วงเวลา

สามารถเลือกรุ่น ARMA เมื่อทำการตรวจสอบ ACF และ PACF วิธีการนี้ขึ้นอยู่กับข้อเท็จจริงต่อไปนี้: 1) ACF ของกระบวนการ AR แบบคงที่ของคำสั่ง p ไปที่ศูนย์ที่อัตราเอ็กซ์โพเนนเชียลในขณะที่ PACF กลายเป็นศูนย์หลังจาก lag p 2) สำหรับกระบวนการ MA ของการสั่งซื้อทางทฤษฎี ACF และ PACF แสดงพฤติกรรมย้อนกลับ (ACF ตัดทอนหลังจากความล่าช้า q และ PACF ไปที่ศูนย์ค่อนข้างรวดเร็ว)

ปกติแล้วจะชัดเจนในการตรวจสอบลำดับของแบบจำลอง AR หรือ MA อย่างไรก็ตามด้วยกระบวนการที่รวมทั้งส่วน AR และ MA ความล่าช้าที่พวกเขาถูกตัดทอนอาจเบลอเพราะทั้ง ACF และ PACF จะสลายตัวเป็นศูนย์

วิธีหนึ่งในการดำเนินการคือให้พอดีกับรุ่น AR หรือ MA แรก (อันที่ดูเหมือนชัดเจนมากขึ้นใน ACF และ PACF) ของลำดับต่ำ จากนั้นหากมีโครงสร้างเพิ่มเติมจะปรากฏในส่วนที่เหลือดังนั้น ACF และ PACF ของส่วนที่เหลือจะถูกตรวจสอบเพื่อพิจารณาว่าจำเป็นต้องใช้ข้อกำหนด AR หรือ MA เพิ่มเติมหรือไม่

โดยปกติคุณจะต้องลองและวิเคราะห์มากกว่าหนึ่งรุ่น คุณสามารถเปรียบเทียบพวกเขาได้โดยดูที่ AIC

ACF และ PACF ที่คุณโพสต์ครั้งแรกแนะนำ ARMA (2,0,0) (0,0,1) นั่นคือ AR ปกติ (2) และ MA ตามฤดูกาล (1) ส่วนตามฤดูกาลของตัวแบบถูกกำหนดในทำนองเดียวกันเป็นส่วนปกติ แต่ดูที่ความล่าช้าของคำสั่งตามฤดูกาล (เช่น 12, 24, 36, ... ในข้อมูลรายเดือน) หากคุณใช้ R ขอแนะนำให้เพิ่มจำนวนเริ่มต้นที่ล่าช้าที่ปรากฏacf(x, lag.max = 60)ขึ้น

พล็อตที่คุณแสดงในขณะนี้เผยให้เห็นความสัมพันธ์เชิงลบที่น่าสงสัย หากพล็อตนี้อิงจากพล็อตก่อนหน้าคุณอาจมีความแตกต่างมากเกินไป ดูโพสต์นี้

คุณจะได้รับรายละเอียดเพิ่มเติมในหมู่แหล่งข้อมูลอื่น ๆ ที่นี่: บทที่ 3 ในอนุกรมเวลา: ทฤษฎีและวิธีการโดยปีเตอร์เจ Brockwell และริชาร์ดเอเดวิสและที่นี่


คุณถูก. ฉันอาจจะมีความแตกต่างหนึ่งอย่างมากเกินไป ฉันมีข้อสงสัยอย่างหนึ่ง ฉันทำสิ่งที่แตกต่างง่าย ๆ ( i.imgur.com/1MjLzlX.png ) และตามฤดูกาล (12) หนึ่ง ( i.imgur.com/E64Sd7p.png ) ทั้งบนข้อมูลบันทึก ฉันควรดูอันไหนดี?
4everlearning

1
@ 4 สิทธิ์ในการรับผลประโยชน์หลังจากได้รับความแตกต่างตามฤดูกาล ACF และ PACF จะมองใกล้กับสิ่งที่เราคาดหวังสำหรับกระบวนการที่อยู่กับที่ คุณสามารถเริ่มต้นด้วยการปรับ ARIMA (2,0,0) (0,1,1) ใน R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))และแสดง ACF และ PACF ของส่วนที่เหลือ รับทราบถึงประเด็นอื่น ๆ ที่ IrishStat แจ้งให้คุณทราบด้วยในการวิเคราะห์
javlacalle

ขอบคุณ ฉันจะหาคำสั่งซื้อ AR และ MA เหล่านั้นได้อย่างไร นอกจากนี้เกณฑ์ข้อมูล Akaike ให้ค่าลบสำหรับแบบจำลองของฉัน ฉันเข้าใจว่าสิ่งนี้ไม่สำคัญแม้ว่าฉันจะไม่แน่ใจว่าจะเปรียบเทียบกับรุ่นอื่นได้อย่างไรพูด AIC = -797.74 และ AIC = -800.00 ข้อไหนดีกว่ากัน?
4everlearning

คุณสามารถกำหนดคำสั่งซื้อตามแนวคิดที่ให้ไว้ในคำตอบข้างต้น หากคุณเห็นว่า ACF ไปที่ศูนย์ค่อนข้างเร็วและ PACF ตัดทอนหลังจาก lag 2 อาจเป็นไปได้ว่าโครงสร้าง AR (2) มีอยู่ในข้อมูล แนวคิดย้อนกลับใช้กับการตรวจสอบ MA ตามคำแนะนำทั่วไปเริ่มต้นด้วยแบบจำลองที่มีลำดับต่ำและตรวจสอบส่วนที่เหลือที่กำลังมองหาโครงสร้าง AR หรือ MA ที่จะเพิ่มเข้ากับโมเดลเริ่มต้น
javlacalle

ตามกฎทั่วไป AIC ที่ต่ำกว่าจะดีกว่าโมเดลนี้ (สมมติว่าคุณกำลังใช้ข้อมูลในระดับเดียวกันในทั้งสองโมเดลนั่นคือซีรีส์ควรอยู่ในระดับหรือบันทึกในทุกรุ่นที่คุณกำลังเปรียบเทียบ )
javlacalle
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.