เหตุใดจึงใช้เกณฑ์ข้อมูล (ไม่ได้ปรับ ) เพื่อเลือกลำดับความล่าช้าที่เหมาะสมในรุ่นอนุกรมเวลา


9

ในโมเดลอนุกรมเวลาเช่น ARMA-GARCH เพื่อเลือกความล่าช้าหรือลำดับของเกณฑ์ข้อมูลที่แตกต่างกันของโมเดลเช่น AIC, BIC, SIC เป็นต้น

คำถามของฉันง่ายมากเหตุใดเราจึงไม่ใช้การปรับเพื่อเลือกรุ่นที่เหมาะสม เราสามารถเลือกรูปแบบที่นำไปสู่มูลค่าที่สูงขึ้นของการปรับ 2 เนื่องจากทั้งสองปรับและเกณฑ์ข้อมูลลงโทษสำหรับจำนวน regressors เพิ่มเติมในรูปแบบที่ซึ่งอดีตลงโทษและต่อมาลงโทษค่าโอกาส R2R2R2R2


ฉันอาจจะพลาดอะไรบางอย่างในคำตอบ (ด้านล่าง) แต่ R-squares รวมถึง Adjusted R-squares นั้นเหมาะสมกับคลาสที่ค่อนข้าง จำกัด ของแบบจำลอง OLS โดยประมาณในขณะที่ AICs, BICs ฯลฯ เหมาะสมกับคลาสที่กว้างขึ้นของเส้นทั่วไป แบบจำลองที่ประมาณไว้อาจมี ML หรือตัวแปร
Mike Hunter

คำตอบ:


12

ฉันจะยืนยันว่าอย่างน้อยเมื่อพูดถึงโมเดลเชิงเส้น (เช่นรุ่น AR) การปรับและ AIC นั้นไม่แตกต่างกันR2

พิจารณาคำถามว่าควรรวมไว้ใน สิ่งนี้เทียบเท่ากับการเปรียบเทียบ แบบจำลอง โดยที่ 0 เรากล่าวว่าเป็นรูปแบบที่แท้จริงถ้า\ขอให้สังเกตว่า\รุ่นจึงซ้อนกัน โพรซีเดอร์การเลือกโมเดลเป็นกฎที่ขึ้นอยู่กับข้อมูลที่เลือกได้หลายรูปแบบX2

y=X1(n×K1)β1+X2(n×K2)β2+ϵ
M1:y=X1β1+uM2:y=X1β1+X2β2+u,
E(u|X1,X2)=0M2β20M1M2M^

เราพูดว่า นั้นสอดคล้องกันถ้า M^

limnP(M^=M1|M1)=1limnP(M^=M2|M2)=1

พิจารณาปรับ 2 นั่นคือเลือกถ้า\ในฐานะที่เป็นจะลดลง monotonicallyขั้นตอนนี้จะเทียบเท่ากับการลด 2 ในทางกลับกันนี้จะเทียบเท่ากับการลด2) สำหรับขนาดใหญ่พอหลังสามารถเขียนเป็น โดยที่R2M1R¯12>R¯22R¯2s2s2log(s2)n

log(s2)=log(σ^2nnK)=log(σ^2)+log(1+KnK)log(σ^2)+KnKlog(σ^2)+Kn,
σ^2เป็นตัวประมาณ ML ของความแปรปรวนข้อผิดพลาด เลือกรูปแบบขึ้นอยู่กับจึงเป็น asymptotically เทียบเท่ากับการเลือกรุ่นที่มีขนาดเล็กที่สุด n ขั้นตอนนี้ไม่สอดคล้องกันR¯2log(σ^2)+K/n

ข้อเสนอ :

limnP(R¯12>R¯22|M1)<1

หลักฐาน : โดยที่บรรทัดที่ 2 ถึงครั้งสุดท้ายต่อไปนี้เป็นเพราะสถิติเป็นสถิติ LR ในกรณีการถดถอยเชิงเส้นที่ตาม asymptoticการแจกแจง null QED

P(R¯12>R¯22|M1)P(log(s12)<log(s22)|M1)=P(nlog(s12)<nlog(s22)|M1)P(nlog(σ^12)+K1<nlog(σ^22)+K1+K2|M1)=P(n[log(σ^12)log(σ^22)]<K2|M1)P(χK22<K2)<1,
χK22

ตอนนี้ให้พิจารณาเกณฑ์ของ Akaike, ดังนั้น AIC ก็ทำการซื้อขายลดการ SSR โดยนัยโดย regressors เพิ่มเติมกับ "โทษระยะ" , "ซึ่งชี้ไปในทิศทางตรงกันข้าม ดังนั้นเลือกถ้า อื่นเลือก\

AIC=log(σ^2)+2Kn
M1AIC1<AIC2M2

จะเห็นได้ว่ายังไม่สอดคล้องกันโดยดำเนินการตามข้อพิสูจน์ในบรรทัดที่สามด้วย_1) การปรับและจึงเลือกรุ่น "ใหญ่"มีความเป็นไปได้ในเชิงบวกแม้ว่าเป็นแบบจำลองที่แท้จริงAICP(nlog(σ^12)+2K1<nlog(σ^22)+2(K1+K2)|M1)R2AICM2M1

เนื่องจากการลงโทษสำหรับความซับซ้อนใน AIC นั้นใหญ่กว่าการปรับเพียงเล็กน้อยจึงอาจมีแนวโน้มที่จะเลือกได้น้อยกว่า และมันก็มีคุณสมบัติที่ดีอื่น ๆ (การลดความแตกต่างของ KL ให้เหลือน้อยกว่ารุ่นจริงหากไม่ได้อยู่ในชุดของแบบจำลองที่พิจารณา) ที่ไม่ได้ระบุไว้ในบทความR2


1
คำตอบที่ดี: ไม่หนักเกินไป แต่ก็แน่นอน! หากเคยมีเมื่อวานนี้ฉันจะไม่โพสต์ของฉัน
Richard Hardy

แล้วกรณี ARMA-GARCH ล่ะ? วิธีจะทำที่เลือก amung MA และ GARCH แง่? Radj2
Zachary Blumenfeld

ฉันไม่กล้าพูด ในขณะที่คุณอธิบายมันยังไม่ชัดเจนว่า R2 หมายถึงอะไรสำหรับแบบจำลองดังกล่าว
Christoph Hanck

5

บทลงโทษในไม่ได้ให้คุณสมบัติที่ดีในแง่ของการเลือกรูปแบบตามที่ AIC หรือ BIC กำหนด บทลงโทษในนั้นเพียงพอที่จะทำให้เป็นตัวประมาณค่าที่ไม่ลำเอียงของประชากรเมื่อผู้ลงทะเบียนไม่มีจริง ๆ เป็นของโมเดล (ตามโพสต์บล็อกของ Dave Giles "In What Sense "ปรับ" R-Squared ไม่มีอคติคืออะไร "และ" เพิ่มเติมเกี่ยวกับคุณสมบัติของสัมประสิทธิ์ "ปรับ" ของการกำหนด " ); อย่างไรก็ตามไม่ใช่ตัวเลือกโมเดลที่ดีที่สุดRadj2Radj2Radj2R2Radj2

(อาจมีข้อพิสูจน์จากความขัดแย้ง: ถ้า AIC เหมาะสมที่สุดในแง่หนึ่งและ BIC นั้นเหมาะสมที่สุดในอีกแง่หนึ่งและไม่เทียบเท่ากับคู่ใดฝ่ายหนึ่งแล้วก็ไม่เหมาะที่สุด ของประสาทสัมผัสทั้งสองนี้)Radj2Radj2


ฉันจะพารามิเตอร์ GARCH จำนวนมากมีการเพิ่มก่อนเพิ่มขึ้น? :) .... ฉันเชื่อว่าการโต้แย้งที่คล้ายกันอาจเกิดขึ้นได้สำหรับการสันนิษฐานว่ามีข้อผิดพลาดที่สัมพันธ์กัน (เช่นเดียวกับในแบบจำลอง MA) แบบจำลอง GLS ไม่ได้ลดผลรวมของส่วนที่เป็นกำลังสอง ทั้งใน MA และ GARCH จะมีการเพิ่มพารามิเตอร์ (ไม่ใช่ตัวแปรอธิบายซึ่งถูกปรับสำหรับ) ถูกเพิ่มเข้ากับโมเดล แมสซาชูเซตและ GARCH พารามิเตอร์ที่ไม่ได้เพิ่มเพื่อลด , แต่พวกเขากำลังเพิ่มเพื่อเพิ่มโอกาสและ / หรือลดลงถ่วงน้ำหนักรวมของเหลือยกกำลังสองเพื่อสะท้อนให้เห็นถึงการขาดเงื่อนไขข้อผิดพลาด IID R2R2adjSSR
Zachary Blumenfeld

สิ่งนี้จริง ๆ แล้วเกี่ยวข้องกับโพสต์ดั้งเดิมหรือคำตอบของฉันหรือไม่? ไม่ว่าในกรณีใดฉันเห็นด้วยกับคะแนนของคุณ
Richard Hardy

สิ่งที่ฉันพยายามจะชี้ให้เห็นก็คือไม่สามารถใช้เพื่อเลือกส่วนประกอบ GARCH (และส่วนประกอบ MA ได้เช่นกัน) เนื่องจากมันใช้เศษส่วนของมากกว่าซึ่งเป็นตัวประมาณค่าแบบเอนเอียง ของความแปรปรวนเมื่อเงื่อนไขข้อผิดพลาดไม่ได้เป็น iid (นี่เป็นกรณีเฉพาะของอคติที่คุณพูดถึง) ในกรณีของ ARMA-GARCH คุณจะไม่เคยเลือกรุ่นที่มีส่วนประกอบ GARCH, แม้ว่าจะมีความผันผวนสุ่มในข้อมูลเพราะมันจะไม่เพิ่มขึ้น 2 โดยพื้นฐานแล้วฉันเห็นด้วยกับคุณโดยพยายามยกตัวอย่างเฉพาะ Radj2SSTSSRSSTR2
Zachary Blumenfeld
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.