จำนวน lags ที่ต้องใช้ในการทดสอบ Ljung-Box ของอนุกรมเวลา


20

หลังจากแบบจำลอง ARMA เหมาะสมกับอนุกรมเวลาเป็นเรื่องปกติที่จะตรวจสอบสิ่งตกค้างผ่านการทดสอบกระเป๋าหิอง - กล่อง (รวมถึงการทดสอบอื่น ๆ ) การทดสอบ Ljung-Box ส่งคืนค่า ap มันมีพารามิเตอร์, h , ซึ่งเป็นจำนวนของความล่าช้าที่จะทดสอบ บางตำราแนะนำให้ใช้h = 20; คนอื่น ๆ แนะนำให้ใช้h = ln (n); ส่วนใหญ่ไม่ได้พูดในสิ่งที่เอชกับการใช้งาน

แทนที่จะใช้ค่าเดียวสำหรับhสมมติว่าฉันทำการทดสอบ Ljung-Box สำหรับh <50 ทั้งหมดแล้วเลือกhซึ่งให้ค่า p ต่ำสุด วิธีการนี้เหมาะสมหรือไม่ ข้อดีและข้อเสียคืออะไร? (ข้อเสียอย่างหนึ่งที่เห็นได้ชัดคือเวลาในการคำนวณเพิ่มขึ้น แต่นั่นไม่ใช่ปัญหาที่นี่) มีวรรณกรรมเกี่ยวกับเรื่องนี้หรือไม่?

อธิบายอย่างละเอียดเล็กน้อย .... ถ้าการทดสอบให้ p> 0.05 สำหรับทุกชั่วโมงชัดว่าอนุกรมเวลา (ส่วนที่เหลือ) ผ่านการทดสอบ คำถามของฉันเกี่ยวกับวิธีตีความการทดสอบถ้า p <0.05 สำหรับบางค่าของhและไม่ใช่สำหรับค่าอื่น ๆ


1
@ user2875 ฉันได้ลบคำตอบของฉัน ความจริงก็คือสำหรับขนาดใหญ่ชั่วโมงการทดสอบไม่น่าเชื่อถือ ดังนั้นคำตอบจริงๆขึ้นอยู่ที่ชั่วโมง , พี<0.05 0.05 นอกจากนี้ค่าที่แน่นอนของพีคืออะไร? หากเราลดเกณฑ์ลงเหลือ0.01ผลลัพธ์ของการทดสอบจะเปลี่ยนไปหรือไม่ ส่วนตัวในกรณีที่มีสมมติฐานที่ขัดแย้งกันฉันมองหาตัวบ่งชี้อื่น ๆ ว่าแบบจำลองนั้นดีหรือไม่ รูปแบบที่เหมาะสมเป็นอย่างไร แบบจำลองเปรียบเทียบกับรุ่นอื่นได้อย่างไร แบบจำลองทางเลือกมีปัญหาเหมือนกันหรือไม่? สำหรับการละเมิดอื่น ๆ การทดสอบปฏิเสธโมฆะ?
mpiktas

1
@mpiktas การทดสอบ Ljung-Box ขึ้นอยู่กับสถิติที่มีการแจกแจงแบบไม่เชิงเส้น (เมื่อ h กลายเป็นใหญ่) chi-squared เมื่อ h มีขนาดใหญ่เมื่อเทียบกับ n แม้ว่าพลังของการทดสอบจะลดลงเป็น 0 ดังนั้นความปรารถนาที่จะเลือก h ที่มีขนาดใหญ่พอที่การแจกแจงจะใกล้เคียงกับไคสแควร์ แต่มีขนาดเล็กพอที่จะมีพลังที่เป็นประโยชน์ (ฉันไม่ทราบว่าความเสี่ยงของการลบที่ผิดพลาดคืออะไรเมื่อ h มีขนาดเล็ก)
user2875

@ user2875 นี่เป็นครั้งที่สามที่คุณเปลี่ยนคำถาม ก่อนอื่นคุณถามเกี่ยวกับกลยุทธ์ในการเลือกชั่วโมงมีค่าน้อยที่สุดจากนั้นจะตีความการทดสอบอย่างไรถ้าp<0.05สำหรับค่าบางค่าhและตอนนี้เหมาะสมที่สุดที่ชั่วโมงจะเลือกคืออะไร ทั้งสามคำถามมีคำตอบที่แตกต่างกันและอาจมีคำตอบที่แตกต่างกันขึ้นอยู่กับบริบทของปัญหานั้น ๆ
mpiktas

@mpiktas คำถามเหมือนกันทั้งหมดเพียงแค่วิธีที่แตกต่างในการดู (ดังที่อธิบายไว้ถ้า p> 0.05 สำหรับทุกชั่วโมงเราจะรู้วิธีตีความ p ที่เล็กที่สุดถ้าเรารู้ว่า h ที่ดีที่สุด - เราไม่ - - แล้วเราจะไม่เกี่ยวข้องกับการเลือก p ที่เล็กที่สุด)
2875

คำตอบ:


9

คำตอบนั้นขึ้นอยู่กับว่า: อะไรคือความจริงที่พยายามใช้การทดสอบเพื่อ?Q

สาเหตุที่พบบ่อยคือจะมีมากขึ้นหรือน้อยลงมีความมั่นใจเกี่ยวกับความสำคัญทางสถิติร่วมกันของสมมติฐานของอัตไม่ถึงล่าช้า (ผลัดกันสมมติว่าคุณมีสิ่งที่ใกล้เคียงกับเสียงสีขาวที่อ่อนแอ ) และเพื่อสร้างความเค็มรุ่นมีน้อย จำนวนพารามิเตอร์ที่เป็นไปได้h

โดยทั่วไปข้อมูลอนุกรมเวลามีรูปแบบตามฤดูกาลตามธรรมชาติดังนั้นกฏของนิ้วหัวแม่มือในทางปฏิบัติก็คือการตั้งค่าเป็นสองเท่าของค่านี้ อีกแบบหนึ่งคือขอบฟ้าการพยากรณ์ถ้าคุณใช้แบบจำลองสำหรับการพยากรณ์ความต้องการ ในที่สุดหากคุณพบว่าการออกเดินทางครั้งสำคัญมีความล่าช้าในภายหลังลองนึกถึงการแก้ไข (ซึ่งอาจเกิดจากผลกระทบตามฤดูกาลหรือข้อมูลไม่ถูกแก้ไขสำหรับค่าผิดปกติ)h

แทนที่จะใช้ค่าเดียวสำหรับ h สมมติว่าฉันทำการทดสอบ Ljung-Box สำหรับ h <50 ทั้งหมดแล้วเลือก h ซึ่งให้ค่า p ต่ำสุด

เป็นการทดสอบนัยสำคัญร่วมกันดังนั้นหากตัวเลือกคือการขับเคลื่อนข้อมูลทำไมฉันถึงต้องสนใจเล็ก ๆ น้อย ๆ (เป็นครั้งคราว) ออกไปที่ความล่าช้าน้อยกว่าhโดยสมมติว่ามันน้อยกว่าnแน่นอน (พลัง) จากการทดสอบที่คุณพูดถึง) การค้นหาแบบจำลองที่เรียบง่าย แต่มีความเกี่ยวข้องฉันขอแนะนำเกณฑ์ข้อมูลตามที่อธิบายไว้ด้านล่างhhn

คำถามของฉันเกี่ยวกับวิธีตีความการทดสอบถ้าสำหรับบางค่าของhและไม่ใช่สำหรับค่าอื่น ๆp<0.05ชั่วโมง

ดังนั้นมันจะขึ้นอยู่กับว่ามันเกิดขึ้นไกลแค่ไหนจากปัจจุบัน ข้อเสียของการเดินทางไกล: พารามิเตอร์เพิ่มเติมเพื่อประเมินองศาอิสระน้อยกว่าพลังการทำนายที่แย่กว่าของโมเดล

ลองประเมินโมเดลรวมถึงชิ้นส่วน MA และ \ หรือ AR ที่ล่าช้าซึ่งการออกเดินทางเกิดขึ้นและดูเกณฑ์ข้อมูลอย่างใดอย่างหนึ่งเพิ่มเติม (AIC หรือ BIC ขึ้นอยู่กับขนาดตัวอย่าง) สิ่งนี้จะทำให้คุณมีความเข้าใจมากขึ้นว่าแบบจำลองอะไรเพิ่มเติม ประหยัด แบบฝึกหัดการทำนายผลใด ๆ ก็ยินดีต้อนรับที่นี่เช่นกัน


+1 นี่คือสิ่งที่ฉันพยายามจะแสดง แต่ก็ไม่สามารถ :)
mpiktas

8

สมมติว่าเราระบุโมเดล AR (1) แบบง่ายพร้อมคุณสมบัติปกติทั้งหมด

Yเสื้อ=βYเสื้อ-1+ยูเสื้อ

แสดงให้เห็นถึงความแปรปรวนทางทฤษฎีของคำผิดพลาดเป็น

γJE(ยูเสื้อยูเสื้อ-J)

หากเราสามารถสังเกตคำศัพท์ความผิดพลาดได้นั้นตัวอย่างอัตโนมัติ

ρ~Jγ~Jγ~0

ที่ไหน

γ~J1nΣเสื้อ=J+1nยูเสื้อยูเสื้อ-J,J=0,1,2 ...

แต่ในทางปฏิบัติเราไม่ปฏิบัติตามข้อกำหนดข้อผิดพลาด ดังนั้นการหาค่าความสัมพันธ์ตัวอย่างอัตโนมัติที่เกี่ยวข้องกับคำที่ผิดพลาดจะถูกประเมินโดยใช้ค่าที่เหลือจากการประมาณดังนี้

γ^J1nΣเสื้อ=J+1nยู^เสื้อยู^เสื้อ-J,J=0,1,2 ...

สถิติ -Box ของ Pierce Q (Ljung-Box Q เป็นเพียงส่วนที่ปรับขนาดได้แบบเชิงเส้นกลางของ asymptotically)

QBP=nj=1pρ^j2=j=1p[nρ^j]2d???χ2(p)

ปัญหาของเราคือว่าสามารถกล่าวได้ว่ามีการแจกแจงแบบไคม์สแควร์แบบ asymptotically (ภายใต้โมฆะที่ไม่มีการเปลี่ยนระบบอัตโนมัติในเงื่อนไขข้อผิดพลาด) ในรุ่นนี้ เพื่อสิ่งนี้จะเกิดขึ้นแต่ละคนและทุกคนของQBP
จะต้องเป็นมาตรฐาน asymptotically ปกติ วิธีตรวจสอบสิ่งนี้คือการตรวจสอบว่าnρ^jมีการกระจาย asymptotic เดียวกับnρ^ (ซึ่งสร้างขึ้นโดยใช้ข้อผิดพลาดจริงและมีพฤติกรรมเชิงซีโมติกที่ต้องการภายใต้ null)nρ~

เรามีสิ่งนั้น

u^t=ytβ^yt1=ut(β^β)yt1

ที่βเป็นประมาณการที่สอดคล้องกัน ดังนั้นβ^

γ^j1nt=j+1n[ut(β^β)yt1][utj(β^β)ytj1]

=γ~J-1nΣเสื้อ=J+1n(β^-β)[ยูเสื้อYเสื้อ-J-1+ยูเสื้อ-JYเสื้อ-1]+1nΣเสื้อ=J+1n(β^-β)2Yเสื้อ-1Yเสื้อ-J-1

ตัวอย่างจะถือว่านิ่งและ ergodic และช่วงเวลาจะถือว่ามีอยู่จนถึงคำสั่งที่ต้องการ เนื่องจากประมาณการβสอดคล้องนี้เป็นพอสำหรับสองจำนวนเงินที่จะไปที่ศูนย์ ดังนั้นเราจึงสรุปβ^

γ^Jพีγ~J

นี่ก็หมายความว่า

ρ^Jพีρ~JพีρJ

แต่สิ่งนี้ไม่ได้รับประกันโดยอัตโนมัติว่าลู่ไป nρ^Jnρ~J(ในการกระจาย) (คิดว่าทฤษฎีบทการทำแผนที่แบบต่อเนื่องไม่ได้ใช้ที่นี่เพราะการแปลงที่ใช้กับตัวแปรสุ่มขึ้นอยู่กับ) เพื่อให้สิ่งนี้เกิดขึ้นเราต้องการn

nγ^Jdnγ~J

(ตัวส่วน -tilde หรือ hat- จะรวมเข้ากับความแปรปรวนของข้อผิดพลาดในทั้งสองกรณีดังนั้นจึงเป็นสิ่งที่เป็นกลางกับปัญหาของเรา)γ0

เรามี

nγ^J=nγ~J-1nΣเสื้อ=J+1nn(β^-β)[ยูเสื้อYเสื้อ-J-1+ยูเสื้อ-JYเสื้อ-1]+1nΣเสื้อ=J+1nn(β^-β)2Yเสื้อ-1Yเสื้อ-J-1

ดังนั้นคำถามคือทำผลบวกสองตัวนี้คูณด้วย , ไปที่ศูนย์ความน่าจะเป็นเพื่อเราจะเหลือnasymptotically?nγ^J=nγ~J

สำหรับผลรวมที่สองเรามี

1nΣเสื้อ=J+1nn(β^-β)2Yเสื้อ-1Yเสื้อ-J-1=1nΣเสื้อ=J+1n[n(β^-β)][(β^-β)Yเสื้อ-1Yเสื้อ-J-1]

ตั้งแต่ลู่ให้กับตัวแปรสุ่มและ βสอดคล้องนี้จะไปที่ศูนย์[n(β^-β)]β^

สำหรับผลรวมแรกตรงนี้เราก็มีลู่ให้กับตัวแปรสุ่มและดังนั้นเราจึงมีว่า [n(β^-β)]

1nΣเสื้อ=J+1n[ยูเสื้อYเสื้อ-J-1+ยูเสื้อ-JYเสื้อ-1]พีE[ยูเสื้อYเสื้อ-J-1]+E[ยูเสื้อ-JYเสื้อ-1]

ค่าที่คาดหวังแรกเป็นศูนย์โดยสมมติฐานของรุ่น AR (1) มาตรฐาน แต่ค่าที่คาดหวังที่สองไม่ใช่เพราะตัวแปรที่ขึ้นอยู่กับข้อผิดพลาดในอดีตE[ยูเสื้อYเสื้อ-J-1]

ดังนั้นจะไม่ได้มีการกระจาย asymptotic เดียวกับnρ^Jเจ แต่การแจกแจงเชิงเส้นกำกับของหลังคือมาตรฐานปกติซึ่งเป็นอันที่นำไปสู่การแจกแจงแบบไคสแควร์เมื่อกำลังสอง rvnρ~J

ดังนั้นเราจึงสรุปได้ว่าในโมเดลอนุกรมเวลาบริสุทธิ์สถิติ Box-Pierce Q และสถิติ Ljung-Box Q ไม่สามารถกล่าวได้ว่ามีการแจกแจงแบบไคม์สแควร์เชิงซีโมติคดังนั้นการทดสอบจึงขาดความเชื่อมั่นเชิงซีม

สิ่งนี้เกิดขึ้นเนื่องจากตัวแปรทางด้านขวา (นี่คือความล่าช้าของตัวแปรตาม) โดยการออกแบบไม่ได้เข้มงวดกับคำที่ผิดพลาดอย่างเคร่งครัดและเราพบว่าข้อกำหนด exogeneity ที่เข้มงวดดังกล่าวจำเป็นสำหรับสถิติ Q / BP ของ LB / LB การกระจาย asymptotic

ที่นี่ตัวแปรทางด้านขวาเป็นเพียง "ที่กำหนดไว้ล่วงหน้า" และการทดสอบ Breusch-Pagan นั้นจะถูกต้อง (สำหรับชุดเต็มของเงื่อนไขที่จำเป็นสำหรับการทดสอบที่ถูกต้องเชิงเส้นกำกับดูที่ฮายาชิ 2000, หน้า 146-149)


1
คุณเขียนว่า "แต่ค่าที่คาดหวังที่สองไม่ใช่เพราะตัวแปรตามนั้นขึ้นอยู่กับข้อผิดพลาดในอดีต" ที่เรียกว่าexogeneity เข้มงวด ผมเห็นว่ามันเป็นสมมติฐานที่แข็งแกร่งและคุณสามารถสร้าง AR (P) กรอบโดยไม่ได้โดยใช้เพียงแค่exogeneity อ่อนแอ นี่เป็นเหตุผลว่าทำไมการทดสอบ Breusch-Godfrey นั้นดีกว่าในแง่หนึ่ง: ถ้าค่าว่างไม่เป็นจริง BL จะสูญเสียพลังงาน BG มีพื้นฐานมาจากความอ่อนแอ การทดสอบทั้งสองไม่ดีสำหรับเศรษฐมิติทั่วไปแอพพลิเคชั่นดูตัวอย่างเช่นการนำเสนอของ Stataหน้านี้ 4/44
Aksakal

3
@ Aksakal ขอบคุณสำหรับการอ้างอิง ประเด็นก็คือว่าถ้าไม่มีความเข้มงวดอย่างเข้มงวด Box-Pierce / Ljung-Box ไม่มีการกระจายแบบไคสแควร์เชิงเส้นกำกับนี่คือสิ่งที่คณิตศาสตร์ข้างต้นแสดง ความอ่อนแอแบบเอกพันธ์ (ซึ่งมีอยู่ในตัวแบบด้านบน) นั้นไม่เพียงพอสำหรับพวกเขา นี่คือสิ่งที่นำเสนอที่คุณเชื่อมโยงไปพูดในหน้า 3/44
Alecos Papadopoulos

2
@AlecosPapadopoulos โพสต์ที่น่าทึ่ง !!! ในบรรดาสิ่งที่ดีที่สุดสองสามข้อที่ฉันได้พบที่นี่ที่ Cross Validated ฉันแค่หวังว่ามันจะไม่หายไปในเธรดที่ยาวนี้และผู้ใช้หลายคนจะพบและได้รับประโยชน์จากมันในอนาคต
Richard Hardy

3

ก่อนที่คุณจะ zero-in บน "right" h (ซึ่งดูเหมือนว่ามีความคิดเห็นมากกว่ากฎที่ยาก) ตรวจสอบให้แน่ใจว่า "lag" ถูกกำหนดอย่างถูกต้อง

http://www.stat.pitt.edu/stoffer/tsa2/Rissues.htm

การอ้างถึงหัวข้อด้านล่างฉบับที่ 4 ในลิงค์ด้านบน:

".... p-values ​​ที่แสดงสำหรับพล็อตสถิติ Ljung-Box ไม่ถูกต้องเนื่องจากองศาความอิสระที่ใช้ในการคำนวณค่า p-lag เป็น lag แทน lag - (p + q) นั่นคือขั้นตอนที่ใช้ ไม่ได้คำนึงถึงความจริงที่ว่าส่วนที่เหลือมาจากแบบจำลองที่ติดตั้งและใช่อย่างน้อยหนึ่งนักพัฒนาหลัก R รู้เรื่องนี้ .... "

แก้ไข (01/23/2011): นี่คือบทความของ Burns ที่อาจช่วยได้:

http://lib.stat.cmu.edu/S/Spoetry/Working/ljungbox.pdf


@ bil_080, OP ไม่ได้พูดถึง R และหน้าช่วยเหลือสำหรับ Box.test ใน R กล่าวถึงการแก้ไขและมีอาร์กิวเมนต์ที่อนุญาตให้มีการแก้ไขแม้ว่าคุณจะต้องให้มันเป็นคู่มือ
mpiktas

@mpiktas โอ๊ะคุณพูดถูก ฉันคิดว่านี่เป็นคำถาม R ในส่วนที่สองของความคิดเห็นของคุณมีแพ็คเกจ R หลายอย่างที่ใช้สถิติ Ljung-Box ดังนั้นจึงควรตรวจสอบให้แน่ใจว่าผู้ใช้เข้าใจความหมายของ "ความล่าช้า" ของแพ็คเกจ
bill_080

ขอบคุณ - ฉันใช้ R แต่คำถามนี้เป็นคำถามทั่วไป เพื่อความปลอดภัยฉันได้ทำการทดสอบด้วยฟังก์ชัน LjungBox ในแพ็คเกจพอร์ตรวมถึง Box.test
2875

2

หัวข้อ"การทดสอบสำหรับความสัมพันธ์อัตโนมัติ: Ljung-Box กับ Breusch-Godfrey"แสดงให้เห็นว่าการทดสอบ Ljung-Box นั้นไม่มีความจำเป็นอย่างยิ่งในกรณีของแบบจำลองการตอบโต้อัตโนมัติ นอกจากนี้ยังแสดงให้เห็นว่าควรใช้การทดสอบ Breusch-Godfrey แทน ที่ จำกัด ความเกี่ยวข้องของคำถามและคำตอบของคุณ (แม้ว่าคำตอบอาจรวมถึงคะแนนที่ดีโดยทั่วไป)


ปัญหาของการทดสอบ LB คือเมื่อโมเดล autoregressive มี regressors อื่น ๆ เช่น ARMAX ไม่ใช่รุ่น ARM OP ระบุ ARMA ไม่ใช่ ARMAX อย่างชัดเจนในคำถาม ดังนั้นฉันคิดว่าคำตอบของคุณไม่ถูกต้อง
Aksakal

@ Aksakal ฉันเห็นอย่างชัดเจนจากคำตอบของ Alecos Papadopoulos (และความคิดเห็นภายใต้) ในหัวข้อที่กล่าวถึงข้างต้นว่าการทดสอบ Ljung-Box ไม่สามารถใช้ได้ทั้งสองกรณีเช่น AR / ARMA และ ARX ​​/ ARMAX บริสุทธิ์ ดังนั้นฉันไม่สามารถเห็นด้วยกับคุณ
Richard Hardy

คำตอบของ Alecos Papadopoulos นั้นดี แต่ไม่สมบูรณ์ มันชี้ให้เห็นถึงข้อสันนิษฐานของการทดสอบของ Ljung-Box เกี่ยวกับความเป็นเอกเทศที่เข้มงวด แต่ก็ไม่ได้กล่าวถึงว่าถ้าคุณเข้าใจสมมติฐานได้ดีแล้วการทดสอบของ LB ก็ถือว่าใช้ได้ การทดสอบ BG ซึ่งเขาและฉันชื่นชอบมากกว่า LB นั้นขึ้นอยู่กับความอ่อนแอที่ไม่สม่ำเสมอ มันจะดีกว่าถ้าใช้แบบทดสอบที่มีสมมติฐานน้อยกว่าโดยทั่วไป อย่างไรก็ตามสมมติฐานของการทดสอบ BG นั้นแข็งแกร่งเกินไปในหลายกรณี
Aksakal

@ Aksakal การตั้งค่าของคำถามนี้ค่อนข้างชัดเจน - มันพิจารณาจากส่วนที่เหลือของแบบจำลอง ARMA สิ่งสำคัญที่นี่คือ LB ไม่ทำงาน (ดังแสดงอย่างชัดเจนในโพสต์ของ Alecos ในนี้รวมถึงเธรดที่อ้างถึงข้างต้น) ในขณะที่การทดสอบ BG ทำงานได้ แน่นอนสิ่งต่าง ๆ สามารถเกิดขึ้นได้ในการตั้งค่าอื่น ๆ ( แม้สมมติฐานของการทดสอบ BG จะแข็งแกร่งเกินไปในหลาย ๆ กรณี ) - แต่นั่นไม่ได้เกี่ยวข้องกับหัวข้อนี้ นอกจากนี้ฉันไม่ได้รับสิ่งที่สมมติฐานอยู่ในคำสั่งของคุณถ้าคุณพอใจกับข้อสันนิษฐานจากนั้นการทดสอบ LB ก็ใช้ได้ นั่นควรจะทำให้จุด Alecos เป็นโมฆะหรือไม่?
Richard Hardy

1

Escanciano และ Lobatoสร้างการทดสอบกระเป๋าหิ้วด้วยการเลือกความล่าช้าโดยอัตโนมัติโดยใช้ข้อมูลจากการทดสอบ Pierce-Box และการปรับแต่ง (ซึ่งรวมถึงการทดสอบ Ljung-Box)

ส่วนสำคัญของวิธีการของพวกเขาคือการรวมเกณฑ์AICและBIC --- ร่วมกันในการระบุและการประเมินของแบบจำลอง ARMA เพื่อเลือกจำนวนที่เหมาะสมของความล่าช้าที่จะใช้ ในการแนะนำของพวกเขาแนะนำว่าโดยสังหรณ์ใจ `` การทดสอบดำเนินการโดยใช้เกณฑ์ BIC สามารถควบคุมข้อผิดพลาดประเภทที่ 1 ได้อย่างถูกต้องและมีประสิทธิภาพมากขึ้นเมื่อมีความสัมพันธ์แบบอนุกรมอยู่ในลำดับแรก '' แต่การทดสอบบนพื้นฐานของ AIC นั้นมีประสิทธิภาพมากกว่าเมื่อเทียบกับลำดับความสัมพันธ์ลำดับสูง ขั้นตอนของพวกเขาจึงเลือก BIC-type lag selection ในกรณีที่ autocorrelations ดูเหมือนจะมีขนาดเล็กและอยู่ในลำดับต่ำเท่านั้นและ AIC-type lag section เป็นอย่างอื่น

การทดสอบจะดำเนินการในRแพคเกจvrtest(ดูฟังก์ชั่นAuto.Q)


1

นาที(20,T-1)LNTT

คนแรกที่ควรจะมาจากหนังสือผู้มีอำนาจโดยกล่องเจนกินส์และ Reinsel การวิเคราะห์อนุกรมเวลา: การพยากรณ์และการควบคุม วันที่ 3 Englewood Cliffs, NJ: Prentice Hall, 1994 .. อย่างไรก็ตามนี่คือทั้งหมดที่พวกเขาพูดเกี่ยวกับล่าช้าใน p.314: ป้อนคำอธิบายรูปภาพที่นี่

มันไม่ได้เป็นข้อโต้แย้งหรือข้อเสนอแนะที่แข็งแกร่งโดยวิธีการใด ๆ แต่คนยังคงทำซ้ำจากที่หนึ่งไปยังอีกที่หนึ่ง

การตั้งค่าที่สองสำหรับความล่าช้ามาจาก Tsay การวิเคราะห์ RS ของซีรี่ส์เวลาทางการเงิน 2nd เอ็ด โฮโบเก้น, นิวเจอร์ซีย์: John Wiley & Sons, Inc. , 2005 นี่คือสิ่งที่เขาเขียนไว้ใน p.33:

มักใช้ค่าหลายค่าของ m การศึกษาแบบจำลองชี้ให้เห็นว่าการเลือก m ≈ ln (T) ให้ประสิทธิภาพการใช้พลังงานที่ดีขึ้น

นี่เป็นข้อโต้แย้งที่ค่อนข้างแข็งแกร่ง แต่ไม่มีคำอธิบายว่าการศึกษาแบบไหนที่ทำ ดังนั้นฉันจะไม่ใช้มันตามมูลค่า นอกจากนี้เขายังเตือนเกี่ยวกับฤดูกาล:

กฎทั่วไปนี้ต้องมีการปรับเปลี่ยนในการวิเคราะห์อนุกรมเวลาตามฤดูกาลซึ่ง autocorrelations ที่มีความล่าช้าที่ทวีคูณของฤดูกาลมีความสำคัญมากกว่า

โดยสรุปหากคุณเพียงแค่เสียบความล่าช้าในการทดสอบและดำเนินการต่อคุณสามารถใช้การตั้งค่าเหล่านี้และนั่นก็ดีเพราะนั่นคือสิ่งที่ผู้ปฏิบัติงานส่วนใหญ่ทำ เราขี้เกียจหรือไม่มีแนวโน้มสำหรับสิ่งนี้ มิฉะนั้นคุณจะต้องทำการวิจัยของคุณเองเกี่ยวกับพลังและคุณสมบัติของสถิติสำหรับซีรี่ส์ที่คุณจัดการด้วย

UPDATE

xเสื้อ

Yเสื้อ=xเสื้อ'β+φ(L)Yเสื้อ+ยูเสื้อ

อย่างไรก็ตาม OP ไม่ได้ระบุว่าเขากำลังทำ ARMAX ตรงกันข้ามเขากล่าวถึง ARMA อย่างชัดเจน:

หลังจากแบบจำลอง ARMA เหมาะสมกับอนุกรมเวลามันเป็นเรื่องธรรมดาที่จะตรวจสอบสิ่งตกค้างผ่านการทดสอบ Ljung-Box portmanteau

หนึ่งในเอกสารแรกที่ชี้ให้เห็นถึงปัญหาที่อาจเกิดขึ้นกับการทดสอบ LB คือ Dezhbaksh, Hashem (1990) “ การทดสอบความสัมพันธ์แบบอนุกรมที่ไม่เหมาะสมในแบบจำลองเชิงเส้นตรง ” การทบทวนเศรษฐศาสตร์และสถิติ, 72, 126–132 นี่คือข้อความที่ตัดตอนมาจากกระดาษ:

ป้อนคำอธิบายรูปภาพที่นี่

อย่างที่คุณเห็นเขาไม่คัดค้านการใช้ LB ทดสอบสำหรับรุ่นอนุกรมเวลาบริสุทธิ์เช่น ARMA ดูการอภิปรายในคู่มือไปยังเครื่องมือเศรษฐมิติมาตรฐานดูตัวอย่าง:

หากซีรีส์แสดงค่าส่วนที่เหลือจากการประมาณ ARIMA ควรปรับองศาความเป็นอิสระที่เหมาะสมเพื่อแสดงจำนวนของความสัมพันธ์อัตโนมัติน้อยกว่าจำนวนเทอม AR และ MA ที่ประเมินไว้ก่อนหน้านี้ โปรดทราบว่าควรใช้ความระมัดระวังในการตีความผลลัพธ์ของการทดสอบ Ljung-Box ที่ใช้กับส่วนที่เหลือจากข้อกำหนด ARMAX (ดู Dezhbaksh, 1990, เพื่อเป็นหลักฐานการจำลองประสิทธิภาพการทำงานตัวอย่างที่ จำกัด ของการทดสอบในการตั้งค่านี้)

ใช่คุณต้องระวังโมเดล ARMAX และ LB test แต่คุณไม่สามารถสร้างคำสั่งแบบครอบคลุมได้ว่าการทดสอบ LB นั้นผิดเสมอไปสำหรับซีรีย์ออโต้ทุกชุด

อัพเดท 2

คำตอบของ Alecos Papadopoulos แสดงให้เห็นว่าทำไมการทดสอบ Ljung-Box จำเป็นต้องมีข้อสมมติฐานที่เป็นเอกเทศ เขาไม่ได้แสดงไว้ในโพสต์ของเขา แต่การทดสอบ Breusch-Gpdfrey (การทดสอบทางเลือกอื่น) ต้องมีความเป็นเอกเทศที่อ่อนแอเท่านั้นซึ่งดีกว่าแน่นอน นี่คือสิ่งที่กรีนเศรษฐมิติที่ 7 พูดถึงความแตกต่างระหว่างการทดสอบหน้า 923:

ความแตกต่างที่สำคัญระหว่างการทดสอบ Godfrey – Breusch และ Box – Pierce คือการใช้สหสัมพันธ์บางส่วน (การควบคุม X และตัวแปรอื่น ๆ ) ในอดีตและเรียบง่ายที่สัมพันธ์กันในระยะหลัง ภายใต้สมมติฐานว่างไม่มีความสัมพันธ์แบบอัตโนมัติในεtและไม่มีความสัมพันธ์กันxเสื้อεsxเสื้อ


ฉันคิดว่าคุณตัดสินใจที่จะตอบคำถามเมื่อถูกชนไปที่ด้านบนของกระทู้ที่ใช้งานโดยคำตอบล่าสุดของฉัน อยากรู้อยากเห็นฉันยืนยันว่าการทดสอบไม่เหมาะสมในการตั้งค่าภายใต้การพิจารณาทำให้ทั้งปัญหาเธรดและคำตอบในนั้นโดยเฉพาะอย่างยิ่ง คุณคิดว่าเป็นวิธีปฏิบัติที่ดีหรือไม่ในการโพสต์คำตอบอื่นที่ไม่สนใจปัญหานี้โดยไม่ได้กล่าวถึง (เช่นเดียวกับคำตอบก่อนหน้าทั้งหมด) หรือคุณคิดว่าคำตอบของฉันไม่สมเหตุสมผล (ซึ่งจะทำให้การโพสต์คำตอบเหมือนคุณ)
Richard Hardy

ขอบคุณสำหรับการอัปเดต! ฉันไม่ใช่ผู้เชี่ยวชาญ แต่เป็นข้อถกเถียงโดย Alecos Papadopoulos "การทดสอบสำหรับ autocorrelation: Ljung-Box กับ Breusch-Godfrey"และในความคิดเห็นภายใต้คำตอบของเขาแสดงให้เห็นว่า Ljung-Box นั้นไม่เหมาะสมกับ ARMA บริสุทธิ์ (เช่นเดียวกับ ARMAX) โมเดล หากถ้อยคำสับสนให้ตรวจสอบคณิตศาสตร์ที่นั่นดูเหมือนดี ฉันคิดว่านี่เป็นคำถามที่น่าสนใจและสำคัญมากดังนั้นฉันต้องการค้นหาข้อตกลงระหว่างเราทุกคนที่นี่
Richard Hardy

0

... h ควรมีขนาดเล็กที่สุดเท่าที่จะเป็นไปได้เพื่อรักษาอำนาจใด ๆ ก็ตามที่การทดสอบ LB อาจมีภายใต้สถานการณ์ เมื่อ h เพิ่มพลังจะลดลง การทดสอบ LB เป็นการทดสอบที่แย่มาก คุณต้องมีตัวอย่างจำนวนมาก n จะต้องเป็น ~> 100 จึงจะมีความหมาย น่าเสียดายที่ฉันไม่เคยเห็นแบบทดสอบที่ดีกว่านี้มาก่อน แต่บางทีอาจมีอยู่จริง ใครรู้บ้าง

Paul3nt


0

ไม่มีคำตอบที่ถูกต้องสำหรับสิ่งนี้ที่ใช้งานได้ในทุกสถานการณ์ด้วยเหตุผลอื่น ๆ ที่กล่าวว่าจะขึ้นอยู่กับข้อมูลของคุณ

ม.ผมn(n2-2,40)

ค่าเริ่มต้นทั้งหมดผิดแน่นอนและนี่จะผิดแน่นอนในบางสถานการณ์ ในหลาย ๆ สถานการณ์นี่อาจไม่ใช่จุดเริ่มต้นที่แย่


0

ผมขอแนะนำแพ็คเกจrww ของเรา มันใช้การทดสอบเสียงสีขาวบนพื้นฐานของเวฟเล็ตซึ่งไม่ต้องการพารามิเตอร์การปรับแต่งใด ๆ และมีขนาดและกำลังทางสถิติที่ดี

นอกจากนี้ฉันเพิ่งพบ"ความคิดเกี่ยวกับการทดสอบ Ljung-Box"ซึ่งเป็นการสนทนาที่ยอดเยี่ยมในหัวข้อจาก Rob Hyndman

ปรับปรุง: พิจารณาการอภิปรายทางเลือกในหัวข้อนี้เกี่ยวกับ ARMAX สิ่งจูงใจอีกอย่างที่จะดูที่ hwwntest คือความพร้อมใช้งานของฟังก์ชันพลังงานเชิงทฤษฎีสำหรับหนึ่งในการทดสอบกับสมมติฐานทางเลือกของแบบจำลอง ARMA (p, q)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.