มีมาตรฐานทองคำสำหรับการสร้างแบบจำลองช่วงเวลาที่เว้นระยะผิดปกติหรือไม่?


45

ในสาขาเศรษฐศาสตร์ (ฉันคิดว่า) เรามี ARIMA และ GARCH สำหรับอนุกรมเวลาที่มีระยะห่างเป็นประจำและ Poisson, Hawkes สำหรับการสร้างแบบจำลองกระบวนการจุดดังนั้นวิธีการเกี่ยวกับความพยายามสำหรับการสร้างแบบจำลองอนุกรมเวลาเว้นระยะเวลา ?

(หากคุณมีความรู้ในหัวข้อนี้คุณสามารถขยายบทความ wiki ที่เกี่ยวข้องได้ด้วย)

Edition (เกี่ยวกับค่าที่หายไปและอนุกรมเวลาที่เว้นระยะไม่สม่ำเสมอ):

ตอบกลับความคิดเห็น @Lucas Reis หากช่องว่างระหว่างการวัดหรือตัวแปรการรับรู้เป็นระยะห่างเนื่องจาก (ตัวอย่าง) กระบวนการปัวซงไม่มีที่ว่างสำหรับการทำให้เป็นมาตรฐานแบบนี้ แต่มีขั้นตอนง่าย ๆ : t(i)เป็นดัชนีเวลา i-th ของตัวแปร x (เวลา i-th ของ การทำให้เป็นจริง x), จากนั้นกำหนดช่องว่างระหว่างเวลาของการวัดเป็นg(i)=t(i)-t(i-1), จากนั้นเราทำการแยกg(i)โดยใช้ค่าคงที่c, dg(i)=floor(g(i)/cและสร้างอนุกรมเวลาใหม่ที่มีจำนวนค่าว่างระหว่างการสังเกตแบบเก่าจากอนุกรมเวลาดั้งเดิมiและi+1เท่ากับ dg (i) แต่ปัญหาคือ ขั้นตอนสามารถสร้างอนุกรมเวลาได้อย่างง่ายดายด้วยจำนวนข้อมูลที่หายไปที่ใหญ่กว่าจำนวนการสังเกตดังนั้นการประมาณค่าที่สมเหตุสมผลของค่าการสังเกตที่หายไปอาจเป็นไปไม่ได้และใหญ่เกินไปcลบ "โครงสร้างเวลา / การพึ่งพาเวลา ฯลฯ " ของปัญหาการวิเคราะห์ (กรณีที่รุนแรงจะได้รับโดยการc>=max(floor(g(i)/c))ที่เพียงแค่ยุบอนุกรมเวลาเว้นระยะผิดปกติเป็นระยะห่างปกติ

Edition2 (เพื่อความสนุกสนาน): การบัญชีอิมเมจสำหรับค่าที่หายไปในอนุกรมเวลาที่เว้นระยะไม่สม่ำเสมอหรือแม้แต่กรณีของกระบวนการจุด


เพื่อชี้แจงเมื่อคุณพูดว่า "เว้นระยะไม่สม่ำเสมอ" คุณไม่ได้หมายถึง "เว้นระยะสม่ำเสมอ แต่มีค่าขาดหายไป" ใช่ไหม
เวย์น

2
ไม่ :) t(i)- เวลาx[t(i)],x[t(i+1)],x[t(i+2)]...และt(j+1)-t(j)ไม่คงที่ ข้อมูลถูกรวบรวมในคฤหาสน์แบบกระจายหรือแบบอะซิงโครนัส
Qbik


2
สิ่งที่เกี่ยวกับการประมาณค่าและทำการวิเคราะห์ด้วยค่าการประมาณระยะห่างเป็นระยะ? ใครรู้ว่าสิ่งที่จะเป็นความหมายของวิธีนี้?
Lucas Reis

สิ่งที่เกี่ยวกับการสร้างแบบจำลองครั้งแรกของจุดและจากนั้นค่าของคะแนนตามเงื่อนไขในเวลาของพวกเขา? ฉันเชื่อว่า 'กระบวนการระบุจุด' เป็นคำศัพท์
PeterR

คำตอบ:


26

หากการสังเกตของกระบวนการสโตแคสติกเป็นระยะห่างอย่างไม่สม่ำเสมอวิธีที่เป็นธรรมชาติที่สุดในการจำลองแบบการสังเกตคือการสังเกตเวลาแบบไม่ต่อเนื่องจากกระบวนการเวลาต่อเนื่อง

สิ่งที่ต้องการโดยทั่วไปของข้อกำหนดเฉพาะของแบบจำลองคือการกระจายข้อสังเกตสังเกตได้ตลอดเวลาที่และสิ่งนี้สามารถถูกแบ่งย่อยเป็นเงื่อนไขแบบกระจายให้X_1 หากกระบวนการเป็นกระบวนการมาร์คอฟเงื่อนไขการจำหน่ายนี้ขึ้นอยู่กับไม่ได้อยู่ในและมันขึ้นอยู่กับและ{i-1} หากกระบวนการจะใช้เวลาเป็นเนื้อเดียวกันพึ่งพาจุดเวลาที่เป็นเพียงผ่านความแตกต่างของพวกเขา{i-1}X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

เราเห็นได้จากสิ่งนี้ว่าถ้าเรามีการสังเกตระยะเท่ากัน (ด้วย , พูด) จากกระบวนการมาร์คอฟที่เป็นเนื้อเดียวกันเราจะต้องระบุการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขเดียวเพื่อระบุ แบบ มิฉะนั้นเราต้องระบุทั้งชุดของการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขซึ่งจัดทำดัชนีโดยความแตกต่างของเวลาของการสังเกตเพื่อระบุแบบจำลอง อันที่จริงแล้วทำได้ง่ายที่สุดโดยการระบุตระกูลของการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขตามเวลาอย่างต่อเนื่องtiti1=1P1Ptiti1Pt

วิธีทั่วไปในการรับข้อมูลจำเพาะโมเดลเวลาต่อเนื่องคือผ่านสมการเชิงอนุพันธ์สุ่ม (SDE) จุดเริ่มต้นที่ดีในการทำสถิติสำหรับโมเดล SDE คือการจำลองและการอนุมานสำหรับ Stochastic Differential Equationsโดย Stefano Iacus อาจเป็นได้ว่ามีวิธีการและผลลัพธ์หลายอย่างสำหรับการสังเกตระยะไกล แต่นี่เป็นเพียงความสะดวกในการนำเสนอและไม่จำเป็นสำหรับแอปพลิเคชัน หนึ่งในอุปสรรคสำคัญคือข้อกำหนด SDE ไม่ค่อยอนุญาตให้มีโอกาสชัดเจนเมื่อคุณมีข้อสังเกตที่ไม่ต่อเนื่อง แต่มีทางเลือกการประมาณสมการที่พัฒนาแล้วเป็นอย่างดี

dXt=a(Xt)dt+b(Xt)dBt.

หากคุณต้องการให้เกินกระบวนการมาร์คอฟโมเดลความผันผวนแบบสุ่ม (G) ARCH พยายามที่จะสร้างแบบจำลองความแปรปรวนต่างกัน (ความผันผวน) เราสามารถพิจารณาสมการการหน่วงเวลาเช่น ที่เป็นอะนาล็อกเวลาต่อเนื่องของ AR - กระบวนการ ( P )

dXt=0ta(s)(XtXs)ds+σdBt
(p)

ฉันคิดว่ามันยุติธรรมที่จะบอกว่าวิธีปฏิบัติทั่วไปเมื่อต้องรับมือกับการสังเกตที่จุดเวลาที่ผิดปกติคือการสร้างแบบจำลองสุ่มเวลาต่อเนื่อง


1
GARCH ไม่ใช่กระบวนการที่ผันผวน vol ใน GARCH จะถูกกำหนดอย่างสมบูรณ์สำหรับช่วงเวลานี้โดยการสังเกตในช่วงก่อนหน้า
Aksakal

11

สำหรับความผิดปกติของอนุกรมเวลาระยะห่างมันเป็นเรื่องง่ายที่จะสร้างตัวกรองคาลมาน

มีกระดาษวิธีการโอน ARIMA ลงในแบบฟอร์มพื้นที่ของรัฐที่นี่

และหนึ่งกระดาษที่เปรียบเทียบ Kalman กับ GARCH ที่นี่(1)

(1) Choudhry, Taufiq และ Wu, Hao (2008)
ความสามารถในการคาดการณ์ของวิธีการกรอง GARCH กับ Kalman: หลักฐานจากรุ่นเบต้าที่เปลี่ยนแปลงตามเวลาของสหราชอาณาจักรประจำวัน
วารสารการพยากรณ์ , 27, (8), 670-689 (ดอย: 10.1002 / for.1096)


ขออภัยฉันไม่มีสิทธิ์เข้าถึงเอกสารฉบับสุดท้ายคุณช่วยฉันด้วยได้ไหม
ควอตซ์

2
ฉันเพิ่มการอ้างอิงเพื่อให้หาง่าย - นอกจากนี้ยังมีคำนำหน้าไว้
bdecaf

บทความเกี่ยวกับการถ่ายโอน ARIMA ไปยังพื้นที่ของรัฐดูเหมือนว่าจะมีลิงค์ที่ขาด
ofey73

9

เมื่อฉันกำลังมองหาวิธีที่จะวัดปริมาณความผันผวนในข้อมูลตัวอย่างที่ผิดปกติฉันได้พบกับเอกสารสองฉบับนี้เกี่ยวกับการปรับให้เรียบแบบเอกซ์โปเนนเชียลสำหรับข้อมูลที่ผิดปกติโดย Cipra [ 1 , 2 ] สิ่งเหล่านี้สร้างขึ้นด้วยเทคนิคการปรับให้เรียบของ Brown, Winters และ Holt (ดู Wikipedia-entry สำหรับExponential Smoothing ) และวิธีอื่นโดย Wright (ดูกระดาษสำหรับการอ้างอิง) วิธีการเหล่านี้ไม่ได้ถือว่ามากเกี่ยวกับกระบวนการพื้นฐานและยังทำงานกับข้อมูลที่แสดงความผันผวนตามฤดูกาล

ฉันไม่รู้ว่ามันจะนับว่าเป็น 'มาตรฐานทองคำ' หรือไม่ เพื่อจุดประสงค์ของตัวเองฉันตัดสินใจใช้การยกกำลังสองวิธี (เดี่ยว) ตามวิธีของบราวน์ ฉันมีความคิดที่จะทำให้การสรุปสรุปสองวิธีอ่านลงในรายงานของนักเรียน (ซึ่งตอนนี้ฉันไม่สามารถหาได้)


7

การวิเคราะห์อนุกรมเวลาที่สุ่มตัวอย่างผิดปกติอาจเป็นเรื่องยุ่งยากเนื่องจากไม่มีเครื่องมือมากมาย บางครั้งการปฏิบัติคือการใช้อัลกอริทึมปกติและหวังว่าจะดีที่สุด นี่ไม่ใช่วิธีการที่ดีที่สุด ในบางครั้งผู้คนพยายามสอดแทรกข้อมูลในช่องว่าง ฉันเคยเห็นกรณีที่ช่องว่างเต็มไปด้วยตัวเลขสุ่มที่มีการแจกแจงแบบเดียวกับข้อมูลที่รู้จัก อัลกอริทึมหนึ่งที่เฉพาะเจาะจงสำหรับซีรีย์ตัวอย่างที่ผิดปกติคือ periodogram ลอมบาร์ - ลอมบาร์ดที่ให้ periodogram (คิดว่าสเปกตรัมพลังงาน) สำหรับอนุกรมเวลาที่สุ่มตัวอย่างไม่สม่ำเสมอ Lomb-Scargle ไม่จำเป็นต้องมี "การปรับช่องว่าง"


3

หากคุณต้องการรูปแบบโดเมนเวลา "ท้องถิ่น" - ซึ่งต่างจากการประมาณค่าฟังก์ชันความสัมพันธ์หรือสเปกตรัมพลังงาน) ให้พูดเพื่อตรวจจับและแสดงลักษณะของพัลส์ชั่วคราวการกระโดดและสิ่งที่คล้ายกัน - อัลกอริทึม Bayesian Block อาจมีประโยชน์ มันให้การแสดงค่าคงที่ทีละชิ้นที่เหมาะสมที่สุดของอนุกรมเวลาในโหมดข้อมูลใด ๆ และการสุ่มตัวอย่างแบบเว้นระยะ ดู

"การศึกษาการวิเคราะห์อนุกรมเวลาทางดาราศาสตร์ VI. การเป็นตัวแทน Block Bayesian," Scargle, Jeffrey D. ; Norris, Jay P .; แจ็กสันแบรด; Chiang, James, Astrophysical Journal, เล่มที่ 764, 167, 26 pp. (2013) http://arxiv.org/abs/1207.5578


2

RJMartin, "ตัวอย่างสัญญาณไม่สม่ำเสมอ: ทฤษฎีและเทคนิคในการวิเคราะห์", วิทยานิพนธ์ปริญญาเอก, UCL, 1998, ออนไลน์ บทที่ 4 เกี่ยวกับโมเดลการตอบโต้อัตโนมัติและพัฒนาเรื่องจากมุมมองเวลาต่อเนื่องตามที่โพสต์อื่น ๆ ได้กล่าวไว้


1

หมวดที่ 4.10 ของ J.Durbin, SJKoopman, การวิเคราะห์อนุกรมเวลาโดยวิธีอวกาศของรัฐ , ฉบับที่ 2, 2012, อุทิศให้กับการสร้างแบบจำลองในกรณีที่ไม่มีการสังเกตการณ์


1

ในการวิเคราะห์ข้อมูลเชิงพื้นที่ข้อมูลส่วนใหญ่มักจะถูกสุ่มตัวอย่างอย่างผิดปกติในอวกาศ ดังนั้นความคิดหนึ่งก็คือการเห็นสิ่งที่ทำไปแล้วและใช้การประมาณค่ารูปแปร, การดึงดูดและอื่น ๆ สำหรับโดเมน "เวลา" หนึ่งมิติ Variograms นั้นน่าสนใจแม้จะเป็นข้อมูลอนุกรมเวลาที่มีระยะห่างเป็นประจำเนื่องจากมีคุณสมบัติที่แตกต่างจากฟังก์ชั่น autocorrelation

นี่คือหนึ่งในกระดาษ (สเปน) และที่นี่อีกคนหนึ่ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.