เหตุใดโมเดล VAR ของฉันจึงทำงานได้ดีกว่ากับข้อมูลที่ไม่ใช่เครื่องเขียนมากกว่าข้อมูลที่อยู่กับที่?


9

ฉันใช้ไลบรารี่ VAR ของ Python ในการสร้างแบบจำลองข้อมูลอนุกรมเวลาการเงินและผลลัพธ์บางอย่างทำให้ฉันงงงวย ฉันรู้ว่าแบบจำลอง VAR ถือว่าข้อมูลอนุกรมเวลาอยู่กับที่ ฉันบังเอิญใส่ราคาล็อกที่ไม่คงที่สำหรับหลักทรัพย์สองชุดที่แตกต่างกันโดยไม่ตั้งใจและน่าประหลาดใจที่ค่าติดตั้งและการคาดการณ์ในตัวอย่างนั้นมีความแม่นยำมาก R2 ในการพยากรณ์ในตัวอย่างคือ 99% และค่าเบี่ยงเบนมาตรฐานของซีรีส์ส่วนที่เหลือที่คาดการณ์อยู่ที่ประมาณ 10% ของค่าการคาดการณ์

อย่างไรก็ตามเมื่อฉันแตกต่างราคาบันทึกและปรับให้พอดีกับอนุกรมเวลานั้นกับรุ่น VAR ค่าติดตั้งและการคาดการณ์จะอยู่ไกลจากเครื่องหมายซึ่งอยู่ในระยะที่แคบโดยรอบค่าเฉลี่ย เป็นผลให้ส่วนที่เหลือทำการคาดการณ์งานได้ดีกว่าค่าที่ติดตั้งพร้อมกับส่วนเบี่ยงเบนมาตรฐานของส่วนที่เหลือที่คาดการณ์ 15X ที่ใหญ่กว่าชุดข้อมูลที่ติดตั้งแล้วเป็น. 007R2 ค่าสำหรับชุดการคาดการณ์

ฉันตีความผิดกับสิ่งที่ติดอยู่กับรุ่น VAR หรือทำให้เกิดข้อผิดพลาดอื่น ๆ หรือไม่? เหตุใดอนุกรมเวลาที่ไม่หยุดนิ่งจะส่งผลให้การคาดการณ์มีความแม่นยำมากขึ้นกว่าอนุกรมที่อยู่กับที่โดยอ้างอิงจากข้อมูลพื้นฐานเดียวกัน ฉันทำงานได้ดีกับรุ่น ARMA จากคลังหลามเดียวกันและไม่เห็นอะไรเหมือนการสร้างแบบจำลองข้อมูลชุดเดียว


5
ข้อเท็จจริงสองประการ: (1) เมื่อคุณถอยหลังการเดินสุ่มครั้งเดียวในการเดินสุ่มอีกครั้งและถือว่าไม่ถูกต้องคุณจะได้รับผลลัพธ์ที่มีนัยสำคัญทางสถิติสูงแม้ว่ามันจะเป็นกระบวนการที่เป็นอิสระ! . (2) หากทั้งสองตัวแปรcointegratedคุณสามารถถอยหลังหนึ่งในที่อื่น ๆ และประมาณการของคุณจะมาบรรจบกันได้เร็วกว่าการถดถอยปกติผลที่เรียกว่าซุปเปอร์สอดคล้อง
Matthew Gunn

ขอบคุณมาก. ข้อเท็จจริง # 1 แน่นอนอธิบายผลลัพธ์สำหรับชุดที่ไม่หยุดนิ่ง ผลลัพธ์จากซีรีส์ที่อยู่กับที่จะทำหน้าที่เหมือนกับว่าพวกเขากำลังแสดงสิ่งที่คุณเรียกว่าความสอดคล้องระดับสูงยกเว้นว่าทั้งสองซีรีส์นั้นจะไม่ถูกรวมกันเท่าที่ฉันสามารถบอกได้ ฉันวิ่งการถดถอยเชิงเส้นในชุดราคาสองรายการและส่วนที่เหลืออยู่ไกลจากที่หยุดนิ่ง ดังนั้นฉันจะต้องสมมติว่าแบบจำลอง VAR นั้นคาดการณ์ได้ไม่ดีนักเนื่องจากชุดข้อมูลคืนสองชุดนั้นไม่สัมพันธ์กันอย่างอัตโนมัติ การทดสอบเครื่องย่างก็เป็นการยืนยันเช่นกัน
jpeginternet

@MatthewGunn ความคิดเห็นของคุณน่าจะเหมาะกับคำตอบ
Richard Hardy

คำตอบ:


9

ข้อเท็จจริงสองประการ:

  1. เมื่อคุณถอยหลังการเดินสุ่มครั้งละหนึ่งครั้งในการเดินสุ่มอีกครั้งและถือว่าไม่ถูกต้องซอฟต์แวร์ของคุณจะคายผลลัพธ์ที่มีนัยสำคัญทางสถิติกลับมาแม้ว่าพวกเขาจะเป็นกระบวนการอิสระก็ตาม ตัวอย่างเช่นดูบันทึกการบรรยายเหล่านี้ (Google สำหรับการเดินสุ่มและการเชื่อมโยงมากมายจะเกิดขึ้น) เกิดอะไรขึ้น ประมาณการ OLS ปกติและข้อผิดพลาดมาตรฐานขึ้นอยู่กับสมมติฐานที่ไม่เป็นจริงในกรณีของการเดินสุ่ม

    การสมมติสมมติฐาน OLS ตามปกตินำไปใช้และการถดถอยการเดินสุ่มแบบอิสระสองครั้งซึ่งกันและกันโดยทั่วไปจะนำไปสู่การถดถอยด้วยขนาดใหญ่ R2สัมประสิทธิ์ที่มีนัยสำคัญสูงมากและมันก็เป็นการหลอกลวงทั้งหมด! เมื่อมีการเดินสุ่มและคุณเรียกใช้การถดถอยในระดับที่สมมติฐานปกติสำหรับ OLS ถูกละเมิดการประมาณการของคุณจะไม่มาบรรจบกันเป็นเสื้อที่เซ็นทรัล จำกัด ทฤษฎีบทปกติไม่ได้ใช้และ t-สถิติและ P-ค่าถ่มน้ำลายถดถอยของคุณออกมาทุกคนที่ไม่ถูกต้อง

  2. หากตัวแปรสองตัวถูกรวมเข้าด้วยกันคุณสามารถถอยหลังหนึ่งตัวแปรตัวอื่นและตัวประมาณของคุณจะมาบรรจบกันเร็วกว่าการถดถอยแบบปกติผลลัพธ์ที่ได้คือความมั่นคงขั้นสูง เช่น. ชำระเงินซีรี่ส์เวลาของ John Cochrane ออนไลน์และค้นหาคำว่า "superconsistent"

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.