การเลือกโมเดล Box-Jenkins


14

ขั้นตอนการคัดเลือกแบบจำลอง Box-Jenkins ในการวิเคราะห์อนุกรมเวลาเริ่มต้นขึ้นโดยดูที่ฟังก์ชันการหาค่าความสัมพันธ์และฟังก์ชั่นความสัมพันธ์แบบกึ่งอัตโนมัติบางส่วนของชุดข้อมูล พล็อตเหล่านี้สามารถแนะนำและqที่เหมาะสมในโมเดลARMA ( p , q ) ขั้นตอนดำเนินการต่อโดยขอให้ผู้ใช้ใช้เกณฑ์ AIC / BIC เพื่อเลือกแบบจำลองที่เป็นทางเลือกมากที่สุดในบรรดารุ่นที่สร้างแบบจำลองที่มีเงื่อนไขข้อผิดพลาดของสัญญาณรบกวนสีขาวพีQ(พี,Q)

ฉันสงสัยว่าขั้นตอนเหล่านี้ของการตรวจสอบด้วยภาพและการเลือกแบบจำลองตามเกณฑ์นั้นมีผลต่อข้อผิดพลาดมาตรฐานโดยประมาณของรุ่นสุดท้ายอย่างไร ฉันรู้ว่าขั้นตอนการค้นหาจำนวนมากในโดเมนแบบตัดขวางอาจมีอคติข้อผิดพลาดมาตรฐานลดลงเช่น

ในขั้นตอนแรกการเลือกจำนวนล่าช้าที่เหมาะสมโดยการดูข้อมูล (ACF / PACF) ส่งผลต่อข้อผิดพลาดมาตรฐานสำหรับรุ่นอนุกรมเวลาอย่างไร

ฉันเดาว่าการเลือกรูปแบบตามคะแนน AIC / BIC จะมีผลกระทบคล้ายกับวิธีการแบบตัดขวาง จริง ๆ แล้วฉันไม่ทราบเกี่ยวกับพื้นที่นี้มากนักดังนั้นความคิดเห็นใด ๆ ก็จะได้รับการชื่นชมในจุดนี้เช่นกัน

สุดท้ายหากคุณจดบันทึกเกณฑ์ที่แม่นยำซึ่งใช้สำหรับแต่ละขั้นตอนคุณสามารถบูตกระบวนการทั้งหมดเพื่อประเมินข้อผิดพลาดมาตรฐานและกำจัดข้อกังวลเหล่านี้ได้หรือไม่


คืออคติในข้อผิดพลาดมาตรฐาน (ของพารามิเตอร์?) จึงสำคัญในรูปแบบ ARMA ทฤษฎี? แบบจำลอง ARMA ASFAIK ใช้สำหรับการพยากรณ์ระยะสั้นเป็นส่วนใหญ่ ปัญหาเกี่ยวกับการตีความพารามิเตอร์และคุณสมบัติมีความสำคัญน้อยกว่า (อย่างน้อย?) แน่นอนถ้าคุณไม่ได้หมายถึงลักษณะของกระบวนการนวัตกรรม (คำผิดพลาด) การวางแผนเพื่อสร้างช่วงการทำนายที่เกี่ยวข้อง
Dmitrij Celov

@Dmitrij มีสองเหตุผลหลักที่ฉันกังวลเกี่ยวกับความลำเอียงในข้อผิดพลาดมาตรฐานของสัมประสิทธิ์ อย่างแรกที่คุณพูดถึงคือการสร้างช่วงการทำนาย ประการที่สองคือการทดสอบการแตกโครงสร้างในแบบจำลองคำถามทั่วไปที่นักเศรษฐศาสตร์จะสนใจในการตอบ ข้อผิดพลาดมาตรฐานที่สร้างขึ้นโดยใช้ขั้นตอนการเลือกควรมีขนาดเล็กเกินไปทำให้กำหนดช่วงเวลาการทำนายที่แคบเกินไปและสถิติการทดสอบที่ใหญ่เกินไป
Charlie

แต่ในแบบจำลองเชิงทฤษฎี (หมายถึงไม่มีทฤษฎี, ไม่มีโครงสร้าง), การแตกของโครงสร้างมีเพียงเล็กน้อยที่จะทำกับพารามิเตอร์ที่มันจะเป็นการทดสอบทั่วไป, เกี่ยวกับพฤติกรรมของเศษซากของแบบจำลอง ในกรณีนี้การประมาณค่าพารามิเตอร์ของแบบจำลองที่ไม่เอนเอียงมีความสำคัญน้อยกว่า ARMA ไม่มีการตีความแบบจำลองโครงสร้าง ดังนั้นแบบจำลองทางสันนิฐานจึงเป็นเครื่องทำนายที่ดีกว่าเนื่องจากมีความสมดุลของคุณสมบัติที่ไม่ดีของเครื่องมือประมาณการตัวอย่างขนาดเล็กและความแม่นยำของการทำนาย
Dmitrij Celov

โปรดทราบว่าแม้ว่าคุณจะรู้กระบวนการสร้างข้อมูลที่มีพารามิเตอร์จำนวนมาก แต่ในตัวอย่างขนาดเล็กตัวแบบที่เรียบง่ายอาจจะคาดการณ์ได้ดีกว่า แต่ในบริบทโครงสร้างพารามิเตอร์ของตัวแบบนั้นจะมีความลำเอียงมาก
Dmitrij Celov

คำตอบ:


5

ขั้นตอนการเลือกรุ่นใด ๆ จะมีผลต่อข้อผิดพลาดมาตรฐานและนี่เป็นสาเหตุที่แทบจะไม่เคยคาดคิดมาก่อน ตัวอย่างเช่นช่วงเวลาการทำนายถูกคำนวณแบบมีเงื่อนไขในแบบจำลองโดยประมาณและการประมาณค่าพารามิเตอร์และการเลือกแบบจำลองมักจะถูกละเว้น

มันควรจะเป็นไปได้ที่จะ bootstrap กระบวนการทั้งหมดเพื่อประเมินผลกระทบของกระบวนการเลือกรูปแบบ แต่จำไว้ว่า bootstrapping อนุกรมเวลานั้นยากกว่า bootstrapping ปกติเพราะคุณต้องรักษาความสัมพันธ์แบบอนุกรมไว้ block bootstrap เป็นวิธีการหนึ่งที่เป็นไปได้แม้ว่าจะสูญเสียความสัมพันธ์แบบอนุกรมเนื่องจากโครงสร้างบล็อก


6

ในความเห็นของฉันการเลือกจำนวนล่าช้าที่เหมาะสมนั้นไม่แตกต่างจากการเลือกจำนวนซีรีย์อินพุตในขั้นตอนการถดถอยไปข้างหน้าแบบขั้นตอน ความสำคัญที่เพิ่มขึ้นของ lags หรือซีรีย์อินพุตเฉพาะเป็นพื้นฐานสำหรับสเปคโมเดลเบื้องต้น

เนื่องจากคุณยืนยันว่า acf / pacf เป็นพื้นฐานสำหรับการเลือกรุ่น Box-Jenkins ให้ฉันบอกสิ่งที่ประสบการณ์สอนฉัน หากซีรีย์จัดแสดง acf ที่ไม่สลายตัววิธี Box-Jenkins (ประมาณปี 1965) แสดงให้เห็นถึงความแตกต่างของข้อมูล แต่ถ้าซีรีส์มีการเลื่อนระดับเช่นเดียวกับข้อมูลของไนล์ดังนั้น "ไม่ปรากฏชัดเจน" เป็นอาการของโครงสร้างที่จำเป็น แต่ความแตกต่างไม่ใช่วิธีการรักษา ชุดข้อมูล Nile นี้สามารถสร้างแบบจำลองโดยไม่แตกต่างกันเพียงระบุความต้องการในการเลื่อนระดับก่อน ในหลอดเลือดดำที่คล้ายกันเราได้รับการสอนโดยใช้แนวคิดปี 1960 ว่าหาก acf จัดแสดงโครงสร้างตามฤดูกาล ( เช่นค่าที่สำคัญที่ความล่าช้าของ s, 2s, 3s, ... ) จากนั้นเราควรรวมองค์ประกอบ ARIMA ตามฤดูกาล สำหรับจุดประสงค์ในการสนทนาให้พิจารณาซีรี่ส์ที่อยู่กับที่โดยเฉลี่ยและในช่วงเวลาคงที่พูดทุก ๆ เดือนมิถุนายนว่ามี "ค่าสูง" ซีรีย์นี้ได้รับการปฏิบัติอย่างเหมาะสมด้วยการรวมซีรีย์หุ่นแบบ "ล้าสมัย" ที่มีค่า 0 และ 1 (ในเดือนมิถุนายน) เพื่อรักษาโครงสร้างฤดูกาล โมเดล ARIMA ตามฤดูกาลจะใช้หน่วยความจำไม่ถูกต้องแทนที่จะเป็นตัวแปร X ที่ไม่ได้ระบุ แต่รอจนจะพบ ทั้งสองแนวคิดของการระบุ / รวมโครงสร้างการกำหนดที่ไม่ระบุเป็นโปรแกรมประยุกต์โดยตรงของงานของ I. ช้าง, William Bell, George Tiao, R.Tsay , Chen et al (เริ่มต้นในปี 1978) ภายใต้แนวคิดทั่วไปของการตรวจจับการแทรกแซง

แม้กระทั่งทุกวันนี้นักวิเคราะห์บางคนกำลังใช้กลยุทธ์การเพิ่มประสิทธิภาพหน่วยความจำอย่างไร้เหตุผลโดยเรียกพวกเขาว่า ARIMA อัตโนมัติโดยไม่ตระหนักว่า "การสร้างแบบจำลองหน่วยความจำแบบไม่มีเหตุผล" ถือว่าโครงสร้างที่กำหนดขึ้นเช่นพัลส์การเลื่อนระดับพัลส์ตามฤดูกาล บทบาทในการระบุรูปแบบ นี่เหมือนกับการเอาหัวลงไปในทราย IMHO


ขอขอบคุณสำหรับคำแนะนำที่ยอดเยี่ยมเกี่ยวกับการเลือกรุ่น แต่ฉันสนใจว่ากระบวนการนี้ส่งผลต่อการอนุมานของเราหลังจากนั้น
Charlie

Charlie: ฉันไม่เชื่อว่าการวิเคราะห์ข้อมูลล่วงหน้าเช่นการตรวจสอบความสัมพันธ์อัตโนมัติหรือสหสัมพันธ์ข้ามหรือกระบวนการระบุตัวแบบอื่น ๆ เช่นการนำเสนอแบบกราฟิกมีผลต่อความสำคัญทางสถิติของพารามิเตอร์ที่ประมาณไว้ใด ๆ นั่นคือความคิดเห็นของฉันและ "ที่นี่ฉันยืนอยู่ฉันไม่สามารถทำอะไรอื่นได้" ขอบคุณสำหรับความรุ่งโรจน์และถ้าฉันสามารถช่วยหนุ่มชาร์ลีในทางใด ๆ โปรดติดต่อกับฉันเพราะฉันชอบที่จะถูกระบุว่าเป็นทรัพยากรสนับสนุน (ยังไม่ได้ชำระ!) ในวิทยานิพนธ์ปริญญาเอก
IrishStat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.