AIC กับการตรวจสอบความถูกต้องข้ามในอนุกรมเวลา: กรณีตัวอย่างขนาดเล็ก


23

ฉันสนใจในการเลือกรูปแบบในการตั้งค่าอนุกรมเวลา เพื่อความเป็นรูปธรรมสมมติว่าฉันต้องการเลือกรุ่น ARMA จากกลุ่มของรุ่น ARMA ที่มีคำสั่งซื้อล่าช้าต่างกัน สุดยอดความตั้งใจคือการคาดการณ์

การเลือกรุ่นสามารถทำได้โดย

  1. การตรวจสอบข้าม
  2. การใช้เกณฑ์ข้อมูล (AIC, BIC)

ท่ามกลางวิธีอื่น ๆ

ร็อบเจ Hyndman มีวิธีการทำการตรวจสอบข้ามอนุกรมเวลา สำหรับตัวอย่างที่มีขนาดค่อนข้างเล็กขนาดของตัวอย่างที่ใช้ในการตรวจสอบความถูกต้องไขว้อาจมีคุณภาพแตกต่างจากขนาดตัวอย่างดั้งเดิม ตัวอย่างเช่นหากขนาดตัวอย่างดั้งเดิมคือ 200 การสังเกตดังนั้นใครจะคิดว่าจะเริ่มการตรวจสอบข้ามโดยการสังเกต 101 ครั้งแรกและขยายหน้าต่างเป็น 102, 103, ... , 200 การสังเกตเพื่อให้ได้ 100 ผลการตรวจสอบข้าม เห็นได้ชัดว่าแบบจำลองที่มีเหตุผลพอสมควรสำหรับการสังเกต 200 ครั้งอาจใหญ่เกินไปสำหรับการสังเกต 100 ครั้งดังนั้นข้อผิดพลาดในการตรวจสอบจะมีขนาดใหญ่ ดังนั้นการตรวจสอบข้ามจึงมีแนวโน้มที่จะสนับสนุนรูปแบบที่ไม่สุภาพ นี่คือผลกระทบที่ไม่พึงประสงค์เกิดจากการไม่ตรงกันในขนาดตัวอย่าง

ทางเลือกอื่นในการตรวจสอบข้ามคือการใช้เกณฑ์ข้อมูลสำหรับการเลือกแบบจำลอง เนื่องจากฉันสนใจเกี่ยวกับการคาดการณ์ฉันจะใช้ AIC ถึงแม้ว่า AIC นั้นจะเทียบเท่ากับ asymptotically ในการลดการคาดการณ์ MSE แบบขั้นตอนเดียวให้น้อยที่สุดสำหรับแบบจำลองอนุกรมเวลา (อ้างอิงจาก Rob J. Hyndman จากการโพสต์นี้ ) ฉันสงสัยว่ามันเกี่ยวข้องกันที่นี่ตั้งแต่ตัวอย่าง ขนาดที่ฉันสนใจไม่ใช่ขนาดใหญ่ ...

คำถาม:ฉันควรเลือก AIC เมื่อใช้การตรวจสอบความถูกต้องของอนุกรมข้ามเวลาสำหรับตัวอย่างขนาดเล็ก / ขนาดกลางหรือไม่

คำถามที่เกี่ยวข้องไม่กี่สามารถพบได้ที่นี่ , ที่นี่และที่นี่


1
ฉันคิดว่า BIC นั้นเทียบเท่ากับการคาดการณ์ "อีกต่อไป" (ขั้นตอน m ข้างหน้า) เนื่องจากมีลิงก์เพื่อให้การตรวจสอบความถูกต้องข้าม สำหรับการสังเกต 200 ครั้งอาจจะไม่ได้สร้างความแตกต่างมากนัก (การลงโทษ 5p แทนที่จะเป็น 2p)
ความน่าจะเป็นทาง

1
@CagdasOzgenc ฉันถาม Rob J. Hyndman เกี่ยวกับการตรวจสอบข้ามว่ามีแนวโน้มที่จะสนับสนุนแบบจำลองที่มีลักษณะคล้ายกันมากเกินไปในบริบทที่กำหนดใน OP และได้รับการยืนยันจึงเป็นสิ่งที่ค่อนข้างให้กำลังใจ ฉันหมายถึงความคิดที่ฉันพยายามอธิบายในการแชทดูเหมือนจะถูกต้อง
Richard Hardy

มีเหตุผลทางทฤษฎีสำหรับการสนับสนุน AIC หรือ BIC เพราะถ้าเริ่มด้วยความน่าจะเป็นและทฤษฎีข้อมูลแล้วการวัดซึ่งขึ้นอยู่กับผู้ที่มีคุณสมบัติทางสถิติที่รู้จักกันดี แต่บ่อยครั้งที่มันเป็นหนึ่งในการจัดการกับชุดข้อมูลที่ไม่ใหญ่มาก
นักวิเคราะห์

3
ฉันใช้เวลาพอสมควรในการพยายามทำความเข้าใจ AIC ความเท่าเทียมกันของคำแถลงนั้นขึ้นอยู่กับการประมาณจำนวนมากซึ่งเป็นเวอร์ชั่นของ CLT โดยส่วนตัวฉันคิดว่าสิ่งนี้ทำให้ AIC เป็นที่น่าสงสัยมากสำหรับกลุ่มตัวอย่างขนาดเล็ก
Meh

1
@ IsabellaGhement ทำไมต้องเป็นเช่นนั้น? ไม่มีเหตุผลที่จะ จำกัด ตัวเองให้ใช้การตรวจสอบข้ามโดยเฉพาะนี้ สิ่งนี้ไม่ได้หมายความว่าจะไม่สามารถใช้การตรวจสอบความถูกต้องไขว้สำหรับการประเมินแบบจำลองได้
Richard Hardy

คำตอบ:


2

การพิจารณาทางทฤษฎีนอกเหนือไปจากเกณฑ์ข้อมูล Akaike เป็นโอกาสเพียงลงโทษโดยองศาอิสระ สิ่งที่ตามมาคือ AIC มีความไม่แน่นอนในข้อมูล ( -2LL ) และทำให้สันนิษฐานว่าพารามิเตอร์มากขึ้นนำไปสู่ความเสี่ยงที่สูงขึ้นของการโอเวอร์โหลด ( 2k ) การตรวจสอบข้ามเพียงแค่ดูที่ชุดการทดสอบประสิทธิภาพของโมเดลโดยไม่มีข้อสมมติฐานเพิ่มเติม

หากคุณสนใจเกี่ยวกับการคาดการณ์เป็นส่วนใหญ่และคุณสามารถสันนิษฐานได้ว่าชุดทดสอบจะคล้ายกับข้อมูลในโลกแห่งความเป็นจริงคุณควรทำการตรวจสอบข้าม ปัญหาที่เป็นไปได้คือเมื่อข้อมูลของคุณมีขนาดเล็กจากนั้นโดยการแยกคุณจะจบลงด้วยการฝึกอบรมและชุดทดสอบขนาดเล็ก ข้อมูลที่น้อยกว่าสำหรับการฝึกอบรมไม่ดีและข้อมูลที่น้อยกว่าสำหรับชุดการทดสอบทำให้ผลการตรวจสอบไขว้มีความไม่แน่นอนมากขึ้น (ดูVaroquaux, 2018 ) หากตัวอย่างทดสอบของคุณไม่เพียงพอคุณอาจถูกบังคับให้ใช้ AIC แต่โปรดจำไว้ว่ามันใช้มาตรการอะไรและคาดเดาได้อย่างไร

ในอีกแง่หนึ่งดังที่ได้กล่าวไว้แล้วในความคิดเห็น AIC ให้การรับประกันแบบไม่มีอาการและไม่ใช่กรณีตัวอย่างขนาดเล็ก ตัวอย่างขนาดเล็กอาจทำให้เข้าใจผิดเกี่ยวกับความไม่แน่นอนในข้อมูลเช่นกัน


ขอบคุณสำหรับคำตอบ! คุณจะมีความคิดเห็นเฉพาะเกี่ยวกับผลที่ไม่พึงประสงค์ของขนาดตัวอย่างที่เล็กกว่ามากในการตรวจสอบข้ามเนื่องจากลักษณะอนุกรมเวลาของข้อมูลหรือไม่
Richard Hardy

1

หืม - ถ้าเป้าหมายสูงสุดของคุณคือการคาดการณ์ทำไมคุณถึงตั้งใจเลือกรูปแบบเลย? เท่าที่ฉันรู้มันได้รับการยอมรับเป็นอย่างดีทั้งในวรรณกรรมทางสถิติ "ดั้งเดิม" และวรรณกรรมการเรียนรู้ของเครื่องว่าค่าเฉลี่ยของแบบจำลองนั้นเหนือกว่าเมื่อมันมาถึงการทำนาย พูดง่ายๆคือการหาค่าเฉลี่ยของแบบจำลองหมายความว่าคุณประเมินแบบจำลองที่เป็นไปได้ทั้งหมดให้พวกเขาทำนายและเฉลี่ยการทำนายของพวกเขาด้วยน้ำหนักโดยใช้หลักฐานของแบบจำลองสัมพัทธ์

การอ้างอิงที่มีประโยชน์เพื่อเริ่มต้นคือ https://journals.sagepub.com/doi/10.1177/0049124104268644

พวกเขาอธิบายสิ่งนี้ค่อนข้างง่ายและอ้างถึงวรรณกรรมที่เกี่ยวข้อง

หวังว่านี่จะช่วยได้


-1

ความคิดของฉันคือทำทั้งสองอย่างและดู มันโดยตรงที่จะใช้ AIC AIC ที่เล็กกว่าดีกว่าโมเดล แต่ก็ไม่สามารถพึ่งพา AIC ได้และบอกว่ารูปแบบดังกล่าวดีที่สุด ดังนั้นถ้าคุณมีกลุ่มของแบบจำลอง ARIMA ให้นำแต่ละอันมาตรวจสอบการพยากรณ์ค่าที่มีอยู่และดูว่าตัวแบบใดทำนายค่าข้อมูลอนุกรมเวลาที่ใกล้เคียงที่สุด ตรวจสอบ AIC เป็นครั้งที่สองและพิจารณาทั้งสองอย่างมาเป็นทางเลือกที่ดี ไม่มีกฎที่ยากและรวดเร็ว เพียงไปสำหรับรุ่นที่ทำนายได้ดีที่สุด


ขอบคุณสำหรับคำตอบ! ฉันกำลังมองหาวิธีที่มีหลักการในการเลือกระหว่างวิธีการเลือกรุ่นที่แตกต่างกัน ในขณะที่คุณพูดถูกว่าไม่มีกฎเกณฑ์ที่ยากและรวดเร็วเราต้องการแนวทางที่ชัดเจนภายใต้เงื่อนไขในอุดมคติที่ตั้งสมมุติฐานเพื่อช่วยเราในสถานการณ์จริงที่ยุ่งเหยิง ดังนั้นในขณะที่ฉันเห็นด้วยกับมุมมองของคุณโดยทั่วไปฉันไม่พบคำตอบที่เป็นประโยชน์ของคุณ
Richard Hardy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.