ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร


10

ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1)

ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน

ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่

นี่คือค่านิยมของฉันตามลำดับ:

VALUE <- scan()
  4.6  4.5  4.4  4.5  4.4  4.6  4.7  4.6  4.7  4.7  4.7  5.0  5.0  4.9  5.1  5.0  5.4
  5.6  5.8  6.1  6.1  6.5  6.8  7.3  7.8  8.3  8.7  9.0  9.4  9.5  9.5  9.6  9.8 10.0
  9.9  9.9  9.8  9.8  9.9  9.9  9.6  9.4  9.5  9.5  9.5  9.5  9.8  9.3  9.1  9.0  8.9
  9.0  9.0  9.1  9.0  9.0  9.0  8.9  8.6  8.5  8.3  8.3  8.2  8.1  8.2  8.2  8.2  8.1
  7.8  7.9  7.8  7.8

นั่นคือข้อมูลของฉัน พวกเขาเป็นอัตราการว่างงานในช่วง 6 ปี มีข้อสังเกต 72 รายการ แต่ละค่าต้องมีทศนิยมไม่เกินหนึ่งตำแหน่ง


6
คุณสามารถสร้างหุ่นจำลองที่มีค่าเท่ากับ 1 สำหรับและ 0 ในช่วงเวลาอื่น ๆ จากนั้นประมาณการโมเดลอีกครั้ง ที่จะทำให้ค่าผิดปกตินี้หลุดพ้นจากการพยากรณ์ หากนั่นไม่ใช่สิ่งที่คุณมีอยู่ในใจคุณควรทำอย่างละเอียดในวรรคสอง t=48
Dimitriy V. Masterov

2
@Gen_b คุณถูกต้องมันน่าจะรบกวนคุณเพราะนี่อาจจะทำให้ MA ที่ยกเลิกไปต่างกัน (1) การระบุผิดพลาดเกิดจากการใช้เครื่องมือที่ไม่เหมาะสม
IrishStat

2
ในความแตกต่างที่สองคุณมีสิ่งที่ดูเหมือนค่าผิดปกติ แต่เกิดจากการกระโดดเพิ่มขนาดเล็กที่การสังเกต 47 ในซีรีส์ดั้งเดิมซึ่งเมื่อแตกต่างสองครั้งดูเหมือนว่าจะเป็นค่าลบขนาดใหญ่ในระยะเวลาหนึ่งในภายหลัง หากคุณทำอะไรง่ายๆเพื่อลบเอฟเฟกต์เล็ก ๆ น้อย ๆ ที่ข้อสังเกต 47 (เกือบทุกอย่างที่สมเหตุสมผล) จะไม่มีค่าผิดปกติปรากฏในความแตกต่างที่สอง ฉันว่ามันอาจจะดูดีกว่าในฐานะที่เป็น AO ในระดับเดิม
Glen_b -Reinstate Monica

2
มีหลายสิ่งที่เกิดขึ้นในชุดข้อมูลนี้ แต่พฤติกรรมทางโลก (ความสัมพันธ์ฤดูกาลและอื่น ๆ ) เป็นสิ่งที่น้อยที่สุด เมื่อคุณวิเคราะห์ข้อมูลแบบนี้เป็นลำดับตัวเลขคุณจะเสี่ยงต่อการสร้างผลลัพธ์ที่ไร้สาระ (หรือแย่กว่านั้น) คุณสามารถบอกเราเกี่ยวกับความหมายของข้อมูลเหล่านี้ได้อย่างไร พวกเขาอาจวัดบางสิ่งบางอย่างที่สถานีตรวจสอบหรือไม่? อนุกรมเวลาทางเศรษฐกิจ แผนภูมิการเจริญเติบโตทางชีวภาพ? การทำความเข้าใจบางอย่างเกี่ยวกับปรากฏการณ์พื้นฐานมักจะทำอะไรได้มากกว่าเพื่อช่วยระบุแบบจำลองมากกว่าการเล่นซอฟท์แวร์ทางสถิติ
whuber

2
@whuber: พวกเขาเป็นอัตราการว่างงานในช่วง 6 ปี!
b2amen

คำตอบ:


3

ถ้าดังนั้น(t)]Y(t)=[θ/ϕ][A(t)+IO(t)]Y*(t)=[θ/ϕ][A(t)]+[θ/ϕ][IO(t)]

หากและเช่น ... ดังนั้นθ=1ϕ=[1.5B]
Y*(t)=[1/(1.5B)][A(t)]
+IO(t).5IO(t1)+.25IO(t2).125IO(t3).

หากตัวอย่างเช่นการประเมินผลกระทบของ IO คือ 10.0 ดังนั้น โดยที่ตัวแปรตัวบ่งชี้สำหรับคือ 0 หรือ 1
Y(t)=[1/(1.5B)][A(t)] IO+10IO(t)5IO(t1)+2.5IO(t2)1.25IO(t3).
IO

ด้วยวิธีนี้คุณจะเห็นว่าผลกระทบของความผิดปกตินั้นไม่เพียง แต่เกิดขึ้นทันที แต่มีความทรงจำ

ซอฟต์แวร์เช่น Autobox (ซึ่งผมคุ้นเคยกับ) ไม่ได้ระบุผลกระทบ IO ( แต่ผลกระทบ AO) จะระบุลำดับของความผิดปกติที่มีค่า 10, -5, 2.5, -1.25 ... เริ่มต้นที่ระยะเวลาทีt

ผู้ใช้เมื่อเห็นเหตุการณ์ที่เกิดขึ้นได้ยากนี้จะสามารถย้ำถึงการถ่ายโอนระหว่างการแทรกแซง AO กับโครงสร้างแบบไดนามิกมากกว่าโครงสร้างตัวเศษบริสุทธิ์ให้ผลลัพธ์เดียวกันกับถ้า IO ผลกระทบถูกจัดตั้งขึ้น [ w ( b ) ][w(b)/d(b)][w(b)]

ทุกครั้งที่คุณรวมหน่วยความจำไม่ว่าจะเป็นผลมาจากตัวดำเนินการที่แตกต่างกันหรือโครงสร้าง ARMA มันเป็นการยอมรับโดยปริยายของความไม่รู้เนื่องจากชุดสาเหตุที่ละเว้น สิ่งนี้เป็นความจริงด้วยที่จะต้องรวมชุดการกำหนดค่าการแทรกแซงเช่นพัลส์ / การเลื่อนระดับพัลส์ตามฤดูกาลหรือแนวโน้มเวลาท้องถิ่น ตัวแปรดัมมี่เหล่านี้เป็นพร็อกซีที่ต้องการสำหรับตัวแปรเชิงสาเหตุที่ผู้ใช้ระบุไม่ระบุ บ่อยครั้งที่สิ่งที่คุณมีคือชุดของความสนใจและจากตัวระบุที่ฉันสะกดออกมาคุณสามารถคาดการณ์อนาคตตามอดีตที่ผ่านมาโดยไม่รู้ถึงธรรมชาติของข้อมูลที่กำลังวิเคราะห์ ปัญหาเดียวคือคุณกำลังใช้หน้าต่างด้านหลังเพื่อคาดการณ์ถนนข้างหน้า .... สิ่งที่เป็นอันตรายแน่นอน

หลังจากโพสต์ข้อมูลแล้ว ...

แบบจำลองที่สมเหตุสมผลคือ (1,1,0) คือป้อนคำอธิบายรูปภาพที่นี่และความผิดปกติของ AO ถูกระบุในช่วงเวลา 39,41,47,21 และ 69 (ไม่ใช่ระยะเวลา 48) ส่วนที่เหลือของรุ่นนี้ดูเหมือนจะไม่มีโครงสร้างที่ชัดเจน ป้อนคำอธิบายรูปภาพที่นี่AND ป้อนคำอธิบายรูปภาพที่นี่AO fice ให้คุณค่าการแสดงกิจกรรมที่เหมาะสมที่สุดซึ่งสะท้อนโดยกิจกรรมที่ไม่ได้อยู่ในประวัติของอนุกรมเวลา ฉันคิดว่า ACF ของโมเดลที่มีความแตกต่างเกินกว่าของ OP จะสะท้อนถึงความไม่เพียงพอของโมเดล นี่คือรูปแบบ ป้อนคำอธิบายรูปภาพที่นี่ อีกครั้งที่ไม่มีรหัส R ส่งมอบเนื่องจากปัญหาหรือโอกาสอยู่ในขอบเขตของการระบุ / แก้ไข / ตรวจสอบรุ่น ในที่สุดพล็อตของซีรีส์ที่เกิดขึ้นจริง / ติดตั้งและคาดการณ์! [ใส่คำอธิบายภาพที่นี่] [6]


1
ขอบคุณสำหรับการตอบกลับของคุณ; แต่ฉันต้องการรหัส R-Code แทนรุ่นของฉัน
b2amen

1
@ b2amen ใช่ฉันขีดเส้นใต้ แต่ Glen_b ต้องการบางสิ่ง "" และฉันคิดว่าฉันจะตอบเขา
IrishStat

ขอบคุณสำหรับการแก้ไข คุณและฉันจะสร้างพันธมิตรที่ดี!
IrishStat

@ IrishStat: ข้อมูลของฉันรวมอยู่ในคำถามเดิม หวังว่าจะช่วยคุณในการช่วยเหลือฉัน ขอบคุณทุกคน
b2amen

@IrishStat: ฉันชอบผลลัพธ์ของคุณ มันดูเรียบร้อยสำหรับฉัน แล้วคุณใช้ซอฟต์แวร์อะไร แต่คุณสามารถอธิบายวิธีที่คุณระบุ AR (2,1,0) ได้อย่างไร ขอบคุณ
b2amen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.