ฉันมีอนุกรมเวลาที่ฉันพยายามคาดการณ์ซึ่งฉันใช้ ARIMA ตามฤดูกาล (0,0,0) (0,1,0) [12] โมเดล (= fit2) มันแตกต่างจากสิ่งที่ R แนะนำกับ auto.arima (R คำนวณ ARIMA (0,1,1) (0,1,0) [12] น่าจะเหมาะกว่าฉันตั้งชื่อมันว่า fit1) อย่างไรก็ตามในช่วง 12 เดือนสุดท้ายของซีรีส์เวลาของฉันโมเดลของฉัน (พอดี 2) ดูเหมือนจะดีกว่าเมื่อปรับแล้ว (มันมีอคติเรื้อรังฉันได้เพิ่มค่าเฉลี่ยที่เหลือ นี่คือตัวอย่างของ 12 เดือนล่าสุดและ MAPE สำหรับ 12 เดือนล่าสุดสำหรับทั้งสองพอดี:
อนุกรมเวลามีลักษณะดังนี้:
จนถึงตอนนี้ดีมาก ฉันทำการวิเคราะห์ที่เหลือสำหรับทั้งสองรุ่นและนี่คือความสับสน
acf (ส่วนที่เหลือ (พอดี 1)) ดูดีมากเสียงดังมาก:
อย่างไรก็ตามการทดสอบ Ljung-Box นั้นดูไม่ดีเช่น 20 lags:
Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)
ฉันได้รับผลลัพธ์ต่อไปนี้:
X-squared = 26.8511, df = 19, p-value = 0.1082
เพื่อความเข้าใจของฉันนี่คือการยืนยันว่าส่วนที่เหลือไม่ได้เป็นอิสระ (ค่า p มีขนาดใหญ่เกินไปที่จะอยู่กับสมมติฐานความเป็นอิสระ)
อย่างไรก็ตามสำหรับความล่าช้า 1 ทุกอย่างยอดเยี่ยม:
Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)
ให้ผลลัพธ์:
X-squared = 0.3512, df = 0, p-value < 2.2e-16
ไม่ว่าฉันจะไม่เข้าใจการทดสอบหรือมันขัดแย้งกับสิ่งที่ฉันเห็นในพล็อต acf เล็กน้อย ความสัมพันธ์อัตโนมัติต่ำอย่างน่าหัวเราะ
จากนั้นฉันตรวจสอบพอดี 2 ฟังก์ชันความสัมพันธ์อัตโนมัติมีลักษณะเช่นนี้:
แม้จะมีความสัมพันธ์อัตโนมัติที่ชัดเจนในการล่าช้าครั้งแรกหลายครั้ง แต่การทดสอบ Ljung-Box นั้นให้ผลลัพธ์ที่ดีกว่าที่ 20 lags มากกว่า fit1:
Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)
ผลลัพธ์ใน:
X-squared = 147.4062, df = 20, p-value < 2.2e-16
ในขณะที่เพียงแค่ตรวจสอบความสัมพันธ์อัตโนมัติที่ lag1 ก็ให้การยืนยันสมมติฐานว่าง!
Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
X-squared = 30.8958, df = 1, p-value = 2.723e-08
ฉันเข้าใจการทดสอบอย่างถูกต้องหรือไม่ ค่า p ควรน้อยกว่า 0.05 เพื่อยืนยันสมมติฐานว่างของความเป็นอิสระ พอดีแบบไหนดีกว่าที่จะใช้สำหรับการพยากรณ์ fit1 หรือ fit2
ข้อมูลเพิ่มเติม: ส่วนที่เหลือของ fit1 แสดงการแจกแจงแบบปกติส่วนผู้ที่ fit2 ไม่แสดง
X-squared
มีขนาดใหญ่ขึ้นเมื่อกลุ่มตัวอย่างอัตโนมัติสัมพันธ์กันของส่วนที่เหลือมีขนาดใหญ่ขึ้น (ดูคำจำกัดความ) และ p-value ของมันคือความน่าจะเป็นที่จะได้ค่าตามที่ใหญ่กว่าหรือใหญ่กว่าค่าที่สังเกตได้ สมมติฐานที่ว่านวัตกรรมที่แท้จริงนั้นเป็นอิสระ ดังนั้น p-value ขนาดเล็กจึงเป็นหลักฐานว่าต่อต้านความเป็นอิสระ
fitdf
) ดังนั้นคุณทดสอบกับการแจกแจงแบบไคสแควร์ที่มีองศาอิสระ