คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

4
การประเมินความสามารถคาดการณ์ของอนุกรมเวลา
สมมติว่าฉันมีซีรี่ส์เวลารายเดือนมากกว่า 20,000 รายการที่ครอบคลุมตั้งแต่ Jan'05 ถึง Dec'11 แต่ละเหล่านี้แสดงข้อมูลการขายทั่วโลกสำหรับผลิตภัณฑ์ที่แตกต่างกัน ถ้าหากฉันคำนวณการคาดการณ์สำหรับแต่ละคนฉันต้องการเน้นเฉพาะผลิตภัณฑ์จำนวนเล็กน้อยที่ "สำคัญ" จริงหรือไม่ ฉันสามารถจัดอันดับผลิตภัณฑ์เหล่านั้นตามรายได้รวมต่อปีและตัดรายการโดยใช้ Pareto แบบดั้งเดิม ถึงกระนั้นฉันก็ดูเหมือนว่าแม้ว่าพวกเขาจะไม่ได้มีส่วนช่วยอะไรมาก แต่ผลิตภัณฑ์บางอย่างนั้นง่ายที่จะคาดการณ์ว่าการปล่อยพวกเขาออกไปจะเป็นการตัดสินที่ไม่ดี ผลิตภัณฑ์ที่ขายมูลค่า 50 ดอลลาร์ในแต่ละเดือนในช่วง 10 ปีที่ผ่านมาอาจไม่ฟังดูมากนัก แต่มันต้องใช้ความพยายามเพียงเล็กน้อยในการสร้างการคาดการณ์เกี่ยวกับยอดขายในอนาคตที่ฉันอาจทำได้เช่นกัน สมมุติว่าฉันแบ่งผลิตภัณฑ์ออกเป็นสี่หมวดหมู่: รายได้สูง / ง่ายต่อการคาดการณ์ - รายได้ต่ำ / ง่ายต่อการคาดการณ์ - รายได้สูง / ยากต่อการคาดการณ์ - รายได้ต่ำ / ยากต่อการคาดการณ์ ฉันคิดว่ามันสมเหตุสมผลที่จะทิ้งไว้ข้างหลังเฉพาะซีรี่ส์เวลาที่เป็นของกลุ่มที่สี่ แต่ฉันจะประเมิน "การคาดการณ์" ได้อย่างไร ค่าสัมประสิทธิ์ของความแปรปรวนดูเหมือนจะเป็นจุดเริ่มต้นที่ดี แต่จะเกิดอะไรขึ้นถ้าอนุกรมเวลาของฉันแสดงฤดูกาล / การเลื่อนระดับ / เอฟเฟกต์ปฏิทิน / แนวโน้มที่แข็งแกร่ง ฉันคิดว่าฉันควรประเมินจากการสุ่มส่วนประกอบเท่านั้นและไม่ใช่หนึ่งในข้อมูล …

1
การจำลองซีรี่ส์ ARIMA (1,1,0)
ฉันได้ติดตั้งโมเดล ARIMA กับซีรี่ส์เวลาดั้งเดิมและรุ่นที่ดีที่สุดคือ ARIMA (1,1,0) ตอนนี้ฉันต้องการจำลองซีรีส์จากโมเดลนั้น ฉันเขียนโมเดล AR (1) อย่างง่าย แต่ฉันไม่เข้าใจวิธีการปรับความแตกต่างภายในโมเดล ARI (1,1,0) รหัส R ต่อไปนี้สำหรับซีรีย์ AR (1) คือ: phi= -0.7048 z=rep(0,100) e=rnorm(n=100,0,0.345) cons=2.1 z[1]=4.1 for (i in 2:100) z[i]=cons+phi*z[i-1]+e[i] plot(ts(Y)) ฉันจะรวมคำต่าง ARI (1,1) ในรหัสข้างต้นได้อย่างไร คนใดคนหนึ่งช่วยฉันในเรื่องนี้
11 r  time-series  arima 

2
การคำนวณดัชนีตามฤดูกาลสำหรับฤดูกาลที่ซับซ้อน
ฉันต้องการคาดการณ์รายการค้าปลีก (สัปดาห์) โดยใช้การปรับให้เรียบแบบเอ็กซ์โปเนนเชียล ตอนนี้ฉันติดอยู่กับวิธีการคำนวณจัดเก็บและใช้ดัชนี sesonality ปัญหาคือตัวอย่างทั้งหมดที่ฉันพบพบว่าเป็นฤดูกาลที่เรียบง่าย ในกรณีของฉันฉันมีปัญหาดังต่อไปนี้: 1. ฤดูกาลไม่เกิดขึ้นในสัปดาห์เดียวกันทุกปี: พวกเขาสามารถเคลื่อนย้ายได้ มาร์ดิกราส์เข้าพรรษาอีสเตอร์และอีกไม่กี่คน 2. มีฤดูกาลที่เปลี่ยนแปลงไปตามปี ตัวอย่างเช่นมีเทศกาลวันหยุดประจำชาติ ขึ้นอยู่กับว่าวันหยุดใกล้กับวันหยุดสุดสัปดาห์ลูกค้าจะหรือไม่ออกจากเมือง มันเหมือนกับว่ามีสองฤดูกาล: หนึ่งที่ลูกค้าออกจากเมืองและที่ที่พวกเขาไม่ออกจากเมือง 3. บางครั้งสอง (หรือ 3) ฤดูกาลเกิดขึ้นในเวลาเดียวกัน ตัวอย่างเช่นเรามีฤดู "Mardi-Gras" ที่เกิดขึ้นในเวลาเดียวกับฤดูวาเลนไทน์ 4. บางครั้งฤดูกาลเปลี่ยนแปลงในระยะเวลา ตัวอย่างเช่น "เทศกาลวันฮาโลวีน" เริ่มขึ้นเมื่อต้นปี คริสต์มาสก็เป็นอีกตัวอย่างหนึ่งที่ดูเหมือนว่าทุกปีเราเริ่มต้นเร็ว ๆ นี้เพื่อพกพาผลิตภัณฑ์ สำหรับฉันดูเหมือนว่าฉันต้องหาวิธีในการตั้งค่า "โปรไฟล์ตามฤดูกาล" ซึ่งตอนนั้นขึ้นอยู่กับสถานการณ์เฉพาะจะถูกเพิ่มเข้ามาเพื่อให้ได้ดัชนีตามฤดูกาลที่ถูกต้อง มันสมเหตุสมผลไหม ไม่มีใครรู้ว่าฉันสามารถหาข้อมูลที่เป็นประโยชน์เกี่ยวกับวิธีการทำเช่นนี้ได้ที่ไหน? ขอบคุณ Edgard

2
สัญชาตญาณลำดับที่สองแตกต่างกันอย่างไร
บางครั้งเซเรียอาอาจจำเป็นต้องมีความแตกต่างเพื่อให้นิ่ง อย่างไรก็ตามฉันไม่เข้าใจว่าความแตกต่างของลำดับที่สองสามารถช่วยให้หยุดนิ่งได้อย่างไรเมื่อความแตกต่างของลำดับที่หนึ่งไม่เพียงพอ คุณสามารถให้คำอธิบายที่เข้าใจง่ายสำหรับการสั่งซื้อลำดับที่สองและกรณีที่จำเป็นได้หรือไม่?

3
ทำไม OLS ประมาณค่าสัมประสิทธิ์ AR (1) เอนเอียง?
ฉันพยายามที่จะเข้าใจว่าทำไม OLS จึงให้ตัวประมาณค่าแบบอคติของกระบวนการ AR (1) พิจารณา ในรูปแบบนี้มีการละเมิด exogeneity ที่เข้มงวดเช่นและมีความสัมพันธ์กัน แต่และไม่มีความสัมพันธ์กัน แต่ถ้าสิ่งนี้เป็นจริงแล้วเหตุใดความเรียบง่ายที่ตามมาจึงไม่เกิดขึ้น Yเสื้อεเสื้อ= α + βYt - 1+εเสื้อ,~ฉันฉันdยังไม่มีข้อความ( 0 , 1 )Yเสื้อ=α+βYเสื้อ-1+εเสื้อ,εเสื้อ~ผมผมdยังไม่มีข้อความ(0,1). \begin{aligned} y_{t} &= \alpha + \beta y_{t-1} + \epsilon_{t}, \\ \epsilon_{t} &\stackrel{iid}{\sim} N(0,1). \end{aligned} Yเสื้อYเสื้อy_tεเสื้อεเสื้อ\epsilon_tYt - 1Yเสื้อ-1y_{t-1}εเสื้อεเสื้อ\epsilon_tPLIM β^=โคฟ(Yเสื้อ,Yt - 1)วาร์(Yt - 1)=Cov ( α + βYt - 1+εเสื้อ,Yt - …

3
ใช้ Holt-Winters หรือ ARIMA หรือไม่
คำถามของฉันเกี่ยวกับความแตกต่างทางแนวคิดระหว่าง Holt-Winters และ ARIMA เท่าที่ฉันเข้าใจ Holt-Winters เป็นกรณีพิเศษของ ARIMA แต่เมื่อไรที่อัลกอริทึมหนึ่งต้องการมากกว่าอีกอันหนึ่ง? บางทีโฮลท์ - วินเทอร์เป็นแบบเพิ่มขึ้นดังนั้นจึงทำหน้าที่เป็นอัลกอริทึมแบบอินไลน์ (เร็วกว่า)? รอคอยที่จะเข้าใจบางอย่างที่นี่

2
ตัวประมาณที่ไม่เอนเอียงสำหรับแบบจำลองAR ( )
พิจารณาโมเดลAR ( ) (สมมติว่าค่าเฉลี่ยเป็นศูนย์สำหรับความเรียบง่าย):ppp xt=φ1xt−1+…+φpxt−p+εtxt=φ1xt−1+…+φpxt−p+εt x_t = \varphi_1 x_{t-1} + \dotsc + \varphi_p x_{t-p} + \varepsilon_t OLS ประมาณการ (เทียบเท่ากับเงื่อนไขประมาณการโอกาสสูงสุด) สำหรับเป็นที่รู้จักกันจะลำเอียงตามที่ระบุไว้ในหัวข้อที่ผ่านมาφ:=(φ1,…,φp)φ:=(φ1,…,φp)\mathbf{\varphi} := (\varphi_1,\dotsc,\varphi_p) (อยากรู้อยากเห็นฉันไม่สามารถหาอคติที่กล่าวถึงในแฮมิลตัน"การวิเคราะห์อนุกรมเวลา"หรือในตำราอนุกรมเวลาอื่น ๆ ไม่กี่อย่างไรก็ตามมันสามารถพบได้ในบันทึกการบรรยายต่างๆและบทความทางวิชาการเช่นนี้ ) ผมไม่สามารถที่จะหาไม่ว่าจะเป็นที่แน่นอนประมาณการความน่าจะเป็นสูงสุดของ AR ( ) จะลำเอียงหรือไม่ ดังนั้นคำถามแรกของฉันppp คำถามที่ 1:เป็นที่แน่นอนประมาณการความน่าจะเป็นสูงสุดของ AR ( ) รูปแบบของพารามิเตอร์อัตลำเอียง? (ให้เราสมมติว่ากระบวนการ AR ( ) เป็นแบบนิ่งมิฉะนั้นตัวประมาณจะไม่สอดคล้องกันเนื่องจากมันถูก จำกัด ในภูมิภาคที่อยู่นิ่ง; ดูเช่น"การวิเคราะห์อนุกรมเวลา"แฮมิลตัน, หน้า 123)pppφ1,…,φpφ1,…,φp\varphi_1,\dotsc,\varphi_pppp นอกจากนี้ คำถามที่ …

1
การทำความเข้าใจสูตรที่แตกต่างแบบเศษส่วน
ฉันมีอนุกรมเวลาและฉันต้องการจำลองเป็นกระบวนการ ARFIMA (aka FARIMA) หากถูกรวมกับคำสั่ง (เศษส่วน)ฉันต้องการแยกความแตกต่างเล็กน้อยเพื่อทำให้เป็นแบบนิ่งytyty_tytyty_tddd คำถาม : สูตรต่อไปนี้กำหนดความแตกต่างของเศษส่วนถูกต้องหรือไม่ ΔdYเสื้อ: =Yเสื้อ- dYt - 1+d( d- 1 )2 !Yt - 2-d( d- 1 ) ( d- 2 )3 !Yt - 3+ . . . + ( - 1)k + 1d( d- 1 ) ⋅ . . ⋅ ( d- k )k …

2
วิธีสร้างแบบจำลองเดือนต่อเดือนผลกระทบในข้อมูลอนุกรมเวลารายวัน?
ฉันมีชุดข้อมูลรายวันสองชุด หนึ่งคือsign-upsและอื่น ๆterminationsของการสมัครสมาชิก ฉันต้องการทำนายหลังโดยใช้ข้อมูลที่มีอยู่ในตัวแปรทั้งสอง เมื่อมองดูกราฟของซีรี่ส์เหล่านี้เห็นได้ชัดว่าการเลิกจ้างมีความสัมพันธ์กับการลงชื่อสมัครเข้าใช้หลายรายการก่อนหน้านี้หลายเดือน นั่นคือการขัดขวางการลงชื่อสมัครใช้ในวันที่ 10 พฤษภาคมจะนำไปสู่การเพิ่มขึ้นของการยุติในวันที่ 10 มิถุนายน 10 กรกฎาคมและ 10 สิงหาคมเป็นต้นไปแม้ว่าผลจะหมดไป ฉันหวังว่าจะได้คำใบ้ว่าฉันควรใช้แบบจำลองรุ่นใดเพื่อแก้ปัญหาเฉพาะนี้ คำแนะนำใด ๆ ที่จะได้รับการชื่นชมมาก .. จนถึงตอนนี้ฉันกำลังคิดแบบจำลอง VAR แต่ฉันไม่แน่ใจว่าจะรวมเอฟเฟกต์รายเดือนอย่างไรให้ใช้คำสั่งล่าช้าสูงมากหรือเพิ่มองค์ประกอบตามฤดูกาลอย่างใด

3
การสร้างค่าสุ่มที่มีความสัมพันธ์อัตโนมัติใน R
เรากำลังพยายามสร้างค่าสุ่มที่มีความสัมพันธ์โดยอัตโนมัติซึ่งจะใช้เป็นชุดเวลา เราไม่มีข้อมูลที่เราอ้างถึงและเพียงต้องการสร้างเวกเตอร์ตั้งแต่เริ่มต้น ในอีกด้านหนึ่งเราต้องการกระบวนการสุ่มที่มีการแจกแจงและ SD ในอีกทางหนึ่งความสัมพันธ์อัตโนมัติที่มีอิทธิพลต่อกระบวนการสุ่มจะต้องมีการอธิบาย ค่าของเวกเตอร์นั้นมีความสัมพันธ์กันโดยอัตโนมัติพร้อมกับความแข็งแรงลดลงในช่วงเวลาต่าง ๆ เช่น lag1 มี 0.5, lag2 0.3, lag1 0.1 เป็นต้น ดังนั้นในที่สุดเวกเตอร์ควรมองสิ่งที่: 2, 4, 7, 11, 10, 8, 5, 4, 2, -1, 2, 5, 9, 12, 13, 10, 8, 4, 3, 1, -2, -5 และอื่น ๆ

5
วิธีการเปรียบเทียบอนุกรมเวลาที่ไม่หยุดนิ่ง 2 แบบเพื่อกำหนดสหสัมพันธ์
ฉันมีชุดข้อมูลสองชุดที่พล็อตค่ามัธยฐานของอายุเมื่อเวลาผ่านไป ทั้งสองซีรีส์แสดงอายุที่เพิ่มขึ้นเมื่อตายในช่วงเวลาหนึ่ง แต่ต่ำกว่าอีกมาก ฉันต้องการตรวจสอบว่าการเพิ่มขึ้นของอายุที่เสียชีวิตของกลุ่มตัวอย่างต่ำกว่านั้นแตกต่างจากกลุ่มตัวอย่างบนอย่างมีนัยสำคัญหรือไม่ นี่คือข้อมูลที่เรียงลำดับตามปี (ตั้งแต่ปี 1972 ถึง 2009 รวม) โดยปัดเศษเป็นทศนิยมสามตำแหน่ง: Cohort A 70.257 70.424 70.650 70.938 71.207 71.263 71.467 71.763 71.982 72.270 72.617 72.798 72.964 73.397 73.518 73.606 73.905 74.343 74.330 74.565 74.558 74.813 74.773 75.178 75.406 75.708 75.900 76.152 76.312 76.558 76.796 77.057 77.125 77.328 77.431 77.656 77.884 …

4
สิ่งที่ต้องทำในห้องอธิบายเวลา
หลังจากที่ได้ทำงานกับข้อมูลภาคตัดขวางมาจนถึงตอนนี้และเมื่อเร็ว ๆ นี้การสืบค้นดูสะดุดไปกับวรรณคดีอนุกรมเวลาเบื้องต้นฉันสงสัยว่าสิ่งใดที่ตัวแปรอธิบายบทบาทกำลังเล่นอยู่ในการวิเคราะห์อนุกรมเวลา ฉันต้องการอธิบายแนวโน้มแทนการยกเลิกแนวโน้ม ส่วนใหญ่ของสิ่งที่ฉันอ่านเป็นบทนำถือว่าซีรีส์เกิดจากกระบวนการสุ่ม ฉันอ่านเกี่ยวกับกระบวนการ AR (p) และ MA รวมถึงแบบจำลอง ARIMA ต้องการจัดการกับข้อมูลมากกว่ากระบวนการ autoregressive เท่านั้นที่ฉันพบ VAR / VECM และวิ่งตัวอย่างบางส่วน แต่ฉันก็ยังสงสัยว่ามีบางกรณีที่เกี่ยวข้องกับสิ่งที่ explanatories ทำในส่วนต่างๆ แรงจูงใจเบื้องหลังสิ่งนี้คือการสลายตัวของซีรี่ส์ของฉันแสดงให้เห็นว่าเทรนด์เป็นผู้สนับสนุนรายใหญ่ในขณะที่ส่วนที่เหลือและผลกระทบตามฤดูกาลแทบจะไม่มีบทบาท ฉันต้องการอธิบายแนวโน้มนี้ ฉันสามารถ / ควรถอยหลังซีรีส์ของฉันในซีรีย์ต่าง ๆ กันไหม? โดยสังหรณ์ใจฉันจะใช้ gls เนื่องจากความสัมพันธ์แบบอนุกรม (ฉันไม่แน่ใจเกี่ยวกับโครงสร้างคร) ฉันได้ยินเกี่ยวกับการถดถอยที่น่าเกรงขามและเข้าใจว่านี่เป็นข้อผิดพลาด แต่ฉันกำลังมองหาวิธีที่จะอธิบายแนวโน้ม สิ่งนี้ผิดปกติหรือผิดปกติหรือไม่? หรือฉันเพิ่งพลาดบทที่ถูกต้องจนถึงตอนนี้?

5
วิธีแก้ไขค่าผิดปกติที่ตรวจพบเมื่อทำการพยากรณ์ข้อมูลอนุกรมเวลา?
ฉันพยายามหาวิธีแก้ไขค่าผิดปกติเมื่อฉันค้นหา / ตรวจจับพวกมันในข้อมูลอนุกรมเวลา วิธีการบางอย่างเช่น nnetar ใน R ให้ข้อผิดพลาดบางประการสำหรับอนุกรมเวลาที่มีค่าผิดปกติจำนวนมาก / มาก ฉันจัดการเพื่อแก้ไขค่าที่หายไปแล้ว แต่ผู้นอกองค์กรยังคงสร้างความเสียหายต่อการคาดการณ์ของฉัน ...

1
การตีความการสลายตัวของอนุกรมเวลาโดยใช้ TBATS จากแพ็คเกจพยากรณ์
ฉันต้องการที่จะแยกข้อมูลอนุกรมเวลาต่อไปนี้ออกเป็นฤดูกาลแนวโน้มและส่วนประกอบที่เหลือ ข้อมูลนี้เป็นข้อมูลการระบายความร้อนพลังงานทุกชั่วโมงจากอาคารพาณิชย์: TotalCoolingForDecompose.ts <- ts(TotalCoolingForDecompose, start=c(2012,3,18), freq=8765.81) plot(TotalCoolingForDecompose.ts) มีผลกระทบตามฤดูกาลรายวันและรายสัปดาห์ที่ชัดเจนดังนั้นจึงขึ้นอยู่กับคำแนะนำจาก: วิธีการสลายอนุกรมเวลาที่มีองค์ประกอบตามฤดูกาลหลายรายการ? ฉันใช้tbatsฟังก์ชั่นจากforecastแพ็คเกจ: TotalCooling.tbats <- tbats(TotalCoolingForDecompose.ts, seasonal.periods=c(24,168), use.trend=TRUE, use.parallel=TRUE) plot(TotalCooling.tbats) ซึ่งผลลัพธ์ใน: อะไรlevelและslopeส่วนประกอบของรุ่นนี้อธิบายอะไร ฉันจะได้รับtrendและremainderส่วนประกอบคล้ายกับกระดาษที่อ้างอิงโดยแพคเกจนี้ ( De Livera, Hyndman และ Snyder (JASA, 2011) )

2
ใช้โมเดล ARMA-GARCH เพื่อจำลองราคาแลกเปลี่ยนเงินตราต่างประเทศ
ฉันได้ติดตั้งแบบจำลอง ARIMA (1,1,1) -GARCH (1,1) เข้ากับช่วงเวลาของราคาบันทึกอัตราแลกเปลี่ยน AUD / USD ที่สุ่มตัวอย่างเป็นระยะเวลาหนึ่งนาทีตลอดระยะเวลาหลายปีทำให้ฉันมากกว่าสองปี ล้านจุดข้อมูลที่จะประเมินรูปแบบ ชุดข้อมูลที่สามารถใช้ได้ที่นี่ เพื่อความชัดเจนนี่เป็นรูปแบบ ARMA-GARCH ที่ติดตั้งเพื่อส่งคืนบันทึกเนื่องจากการรวมราคาบันทึกครั้งแรก ซีรี่ส์เวลา AUD / USD ดั้งเดิมมีลักษณะดังนี้: จากนั้นฉันพยายามจำลองอนุกรมเวลาตามโมเดลที่ติดตั้งให้ฉันดังนี้: ฉันคาดหวังและต้องการอนุกรมเวลาที่จำลองมานั้นจะแตกต่างจากซีรี่ส์ดั้งเดิม แต่ฉันไม่ได้คาดหวังว่าจะมีความแตกต่างที่มีนัยสำคัญ โดยเนื้อแท้แล้วฉันต้องการให้ซีรีย์ที่จำลองขึ้นมีลักษณะหรือกว้างเหมือนต้นฉบับ นี่คือรหัส R ที่ฉันใช้ประเมินโมเดลและจำลองซีรีย์: library(rugarch) rows <- nrow(data) data <- (log(data[2:rows,])-log(data[1:(rows-1),])) spec <- ugarchspec(variance.model = list(model = "sGARCH", garchOrder = c(1, 1)), mean.model = list(armaOrder = c(1, …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.