คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา


2
ทำความเข้าใจกับความล่าช้าในการทดสอบเพิ่ม Dickey Fuller ของ R
ฉันเล่นรอบ ๆ ด้วยการทดสอบรูทยูนิตใน R และฉันไม่แน่ใจว่าจะทำอย่างไรกับพารามิเตอร์ k lag ฉันใช้การทดสอบเพิ่มDickey FullerและการทดสอบPhilipps Perronจากแพ็คเกจtseries เห็นได้ชัดว่าพารามิเตอร์เริ่มต้น(สำหรับ) ขึ้นอยู่กับความยาวของซีรีส์เท่านั้น ถ้าฉันเลือกk- ค่าต่างกันฉันจะได้ผลลัพธ์ที่แตกต่างกันมาก ปฏิเสธโมฆะ:kkkadf.testkkk Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272 alternative hypothesis: stationary # 103^(1/3)=k=4 Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543 alternative hypothesis: stationary # k=0 Dickey-Fuller = -2.5365, Lag order …
15 r  time-series  trend 

1
วิธีการตีความ ACF เชิงลบ (ฟังก์ชั่นความสัมพันธ์อัตโนมัติ)?
ดังนั้นฉันจึงวางแผน ACF / PACFของผลตอบแทนน้ำมันและคาดว่าจะเห็นความสัมพันธ์เชิงบวกบางอย่าง แต่ด้วยความประหลาดใจของฉันฉันได้รับความสัมพันธ์เชิงลบที่สำคัญเท่านั้น ฉันจะตีความกราฟข้างต้นได้อย่างไร พวกเขาดูเหมือนจะบ่งชี้ว่ามีแนวโน้มที่ผลตอบแทนน้ำมันจะเพิ่มขึ้นเมื่อมันลดลงก่อนหน้านี้และในทางกลับกันพฤติกรรมจึงสั่นไหว โปรดแก้ไขฉันหากฉันผิด

5
วิธีจัดการกับซีรี่ส์หลายต่อหลายครั้งพร้อมกัน?
ฉันมีชุดข้อมูลรวมถึงความต้องการของผลิตภัณฑ์ต่าง ๆ (1200 ผลิตภัณฑ์) เป็นระยะเวลา 25 ระยะและฉันจำเป็นต้องทำนายความต้องการของแต่ละผลิตภัณฑ์สำหรับงวดถัดไป ตอนแรกฉันต้องการใช้ ARIMA และฝึกอบรมแบบจำลองสำหรับแต่ละผลิตภัณฑ์ แต่เนื่องจากจำนวนของผลิตภัณฑ์และการปรับพารามิเตอร์ (p, d, q) ทำให้ใช้เวลานานมากและไม่สามารถใช้งานได้จริง แนะนำให้ใช้การถดถอยที่ความต้องการก่อนหน้าเป็นตัวแปรอิสระ (Autoregressive) หรือไม่? ฉันจะรู้ได้อย่างไรว่ามีวิธีใดที่จะฝึกอบรมแบบจำลองเดียวสำหรับการทำนายความต้องการผลิตภัณฑ์ทั้ง 1200 รายการ ฉันจะขอบคุณถ้าคุณสามารถแนะนำห้องสมุดใด ๆ ใน Python เพราะฉันใช้ Python

3
เหตุใดจึงถูกต้องเพื่อทำให้เสียเวลาอนุกรมด้วยการถดถอย
มันอาจเป็นคำถามแปลก ๆ เลย แต่ในฐานะที่เป็นสามเณรในเรื่องที่ฉันสงสัยว่าทำไมเราถึงใช้การถดถอยเพื่อทำให้เป็นอนุกรมเวลาถ้าหนึ่งในสมมติฐานของการถดถอยคือข้อมูลที่ควรใช้ในขณะที่ข้อมูลที่ใช้ในการถดถอยนั้น ไม่ใช่ id

3
ทำไมกลับเผยแพร่ผ่านเวลาใน RNN
ในเครือข่ายประสาทที่เกิดขึ้นอีกคุณมักจะส่งต่อการแพร่กระจายผ่านหลายขั้นตอน "ปลด" เครือข่ายและจากนั้นกลับแพร่กระจายไปตามลำดับของอินพุต ทำไมคุณไม่เพียงแค่อัปเดตน้ำหนักหลังจากแต่ละขั้นตอนตามลำดับ (เทียบเท่ากับการใช้ความยาวของการตัดทอนที่ 1 ดังนั้นจึงไม่มีสิ่งใดที่จะคลี่คลาย) สิ่งนี้ขจัดปัญหาการไล่ระดับสีที่หายไปอย่างสมบูรณ์ลดความซับซ้อนของอัลกอริทึมอย่างมากอาจจะลดโอกาสที่จะติดอยู่ในท้องถิ่น . ฉันฝึกรูปแบบด้วยวิธีนี้เพื่อสร้างข้อความและผลลัพธ์ที่ได้นั้นเทียบได้กับผลลัพธ์ที่ฉันเห็นจากแบบจำลองที่ผ่านการฝึกอบรมของ BPTT ฉันสับสนเพียงแค่นี้เพราะทุกบทช่วยสอนเกี่ยวกับ RNN ฉันเห็นว่าใช้ BPTT เกือบราวกับว่าจำเป็นสำหรับการเรียนรู้ที่เหมาะสมซึ่งไม่ใช่กรณี อัปเดต: ฉันเพิ่มคำตอบ

5
ความแตกต่างระหว่างเศรษฐมิติอนุกรมเวลาและเศรษฐมิติข้อมูลแบบแผงคืออะไร
คำถามนี้อาจไร้เดียงสามาก แต่วิธีที่ฉันสอนเกี่ยวกับเศรษฐมิติฉันสับสนมากหากมีความแตกต่างระหว่างอนุกรมเวลาและวิธีการคำนวณข้อมูล เกี่ยวกับอนุกรมเวลาฉันได้กล่าวถึงหัวข้อต่าง ๆ เช่นความแปรปรวนแบบคงที่, AR, MA และอื่น ๆ เกี่ยวกับข้อมูลพาเนลฉันได้เห็นการอภิปรายในรูปแบบของเอฟเฟกต์คงที่เทียบกับเอฟเฟ็กต์แบบสุ่มเท่านั้น ในความแตกต่าง ฯลฯ หัวข้อเหล่านี้เกี่ยวข้องกันในบางวิธีหรือไม่? เนื่องจากข้อมูลพาเนลยังมีมิติเวลาเหตุใดจึงไม่มีการอภิปราย AR, MA และอื่น ๆ อีกด้วย หากคำตอบคือการศึกษาของฉันเกี่ยวกับวิธีการสอนไม่เพียงพอคุณสามารถชี้ไปที่หนังสือที่ครอบคลุมมากกว่าแค่ FE / RE, ความแตกต่างในความแตกต่างหรือไม่?

1
การจัดการกับข้อมูลที่ขาดหายไปในรูปแบบการปรับให้เรียบแบบเอ็กซ์โปเนนเชียล
ดูเหมือนจะไม่มีวิธีมาตรฐานในการจัดการกับข้อมูลที่ขาดหายไปในบริบทของตระกูลแบบจำลองการยกกำลังแบบเอ็กซ์โพเนนเชียล โดยเฉพาะอย่างยิ่งการนำ R ไปใช้นั้นเรียกว่าetsในแพ็คเกจพยากรณ์ดูเหมือนว่าจะใช้องค์ประกอบที่ยาวที่สุดโดยไม่มีข้อมูลหายไปและหนังสือ "การพยากรณ์ด้วยการทำให้เรียบแบบเอ็กซ์โปเนนเชียล" โดย Hyndman et al ดูเหมือนจะไม่พูดคุยเกี่ยวกับข้อมูลที่หายไปเลย ฉันต้องการเพิ่มอีกเล็กน้อยหากผู้ใช้ของฉันขอให้ฉันอย่างชัดเจน (และหากข้อมูลที่หายไปไม่ได้เกิดขึ้นใกล้กันเกินไปหรือในหลายช่วงเวลาที่ห่างกันหนึ่งฤดูกาล) โดยเฉพาะสิ่งที่ฉันมีในใจคือ ระหว่างการจำลองเมื่อใดก็ตามที่ฉันจะพบค่าที่หายไปผมจะทดแทนการคาดการณ์จุดปัจจุบันสำหรับเพื่อให้0 ตัวอย่างเช่นนี้ทำให้จุดข้อมูลไม่ได้รับการพิจารณาสำหรับกระบวนการปรับพารามิเตอร์ให้เหมาะสมYเสื้อYเสื้อy_tY~เสื้อY~เสื้อ\tilde y_tYเสื้อYเสื้อy_tεเสื้อ= 0εเสื้อ=0\varepsilon_t = 0 เมื่อฉันมีเหตุผลที่เหมาะสมสำหรับพารามิเตอร์ฉันสามารถประมาณค่าเบี่ยงเบนมาตรฐานของข้อผิดพลาด (สันนิษฐานว่าเป็นเรื่องปกติด้วยค่าเฉลี่ย ) และตรวจสอบว่าการใช้ค่าสำหรับสร้างขึ้นจากการกระจายนั้นไม่ลดความน่าจะเป็นด้วยปัจจัยใหญ่ ฉันจะใช้ค่าดังกล่าวสำหรับการคาดการณ์ (โดยใช้การจำลอง) เช่นกัน000εเสื้อεเสื้อ\epsilon_t มีข้อผิดพลาดที่รู้จักกับวิธีนี้หรือไม่?

1
วิธีการทำนายอนุกรมเวลาหนึ่งครั้งจากอนุกรมเวลาอื่นหากสัมพันธ์กัน
ฉันพยายามที่จะแก้ปัญหานี้มานานกว่าหนึ่งปีโดยไม่มีความคืบหน้ามาก มันเป็นส่วนหนึ่งของโครงการวิจัยที่ฉันทำ แต่ฉันจะแสดงให้เห็นตัวอย่างของเรื่องที่ฉันทำเพราะโดเมนที่แท้จริงของปัญหานั้นค่อนข้างสับสน (การติดตามด้วยตา) คุณเป็นเครื่องบินที่ติดตามเรือศัตรูที่เดินทางข้ามมหาสมุทรดังนั้นคุณจึงได้รวบรวมพิกัด (x, y, เวลา) พิกัดของเรือ คุณรู้ไหมว่าเรือดำน้ำที่ซ่อนอยู่เดินทางไปกับเรือเพื่อปกป้องมัน แต่ในขณะที่มีความสัมพันธ์ระหว่างตำแหน่งของพวกเขาเรือดำน้ำมักจะออกเดินทางจากเรือดังนั้นในขณะที่มันอยู่ใกล้มันบ่อยครั้ง โลกเป็นครั้งคราว คุณต้องการที่จะทำนายเส้นทางของเรือดำน้ำ แต่น่าเสียดายที่มันถูกซ่อนไว้จากคุณ แต่หนึ่งเดือนในเดือนเมษายนคุณสังเกตเห็นว่าเรือดำน้ำลืมที่จะซ่อนตัวเองดังนั้นคุณจึงมีชุดพิกัดสำหรับทั้งเรือดำน้ำและเรือตลอดการเดินทาง 1,000 ครั้ง เมื่อใช้ข้อมูลนี้คุณต้องการสร้างแบบจำลองเพื่อทำนายเส้นทางของเรือดำน้ำที่ซ่อนอยู่ซึ่งเป็นเพียงการเคลื่อนไหวของเรือ พื้นฐานที่ไร้เดียงสาคือการพูดว่า "ตำแหน่งเรือดำน้ำเดา =" ตำแหน่งปัจจุบันของเรือ "แต่จากข้อมูลเดือนเมษายนที่มองเห็นเรือดำน้ำคุณสังเกตเห็นว่ามีแนวโน้มที่เรือดำน้ำจะอยู่หน้าเรือสักหน่อยดังนั้น" ตำแหน่งเรือดำน้ำ guess = ตำแหน่งของเรือใน 1 นาที "เป็นการคาดการณ์ที่ดียิ่งขึ้นนอกจากนี้ข้อมูลเมษายนแสดงว่าเมื่อเรือหยุดในน้ำเป็นระยะเวลานานเรือดำน้ำน่าจะลาดตระเวนน่านน้ำชายฝั่งไกลออกไป แน่นอน. คุณจะสร้างโมเดลนี้อย่างไรโดยให้ข้อมูลเดือนเมษายนเป็นข้อมูลการฝึกอบรมเพื่อคาดการณ์เส้นทางของเรือดำน้ำ โซลูชันปัจจุบันของฉันคือการถดถอยเชิงเส้นแบบเฉพาะกิจซึ่งปัจจัยคือ "เวลาเดินทาง", "พิกัด x ของเรือ", "ไม่ได้ใช้งานเรือเป็นเวลา 1 วัน" ฯลฯ จากนั้นให้ R คำนวณน้ำหนักและทำการตรวจสอบข้าม . แต่ฉันชอบวิธีสร้างปัจจัยเหล่านี้โดยอัตโนมัติจากข้อมูลเดือนเมษายน นอกจากนี้รูปแบบที่ใช้ลำดับหรือเวลาจะดีเนื่องจากการถดถอยเชิงเส้นไม่ได้และฉันคิดว่ามันเกี่ยวข้อง ขอบคุณที่อ่านทั้งหมดนี้และฉันยินดีที่จะชี้แจงอะไร

2
อนุกรมเวลาไม่สม่ำเสมอในการวิจัยทางการเงิน / เศรษฐศาสตร์
ในงานวิจัยทางเศรษฐศาสตร์การเงินมันเป็นเรื่องธรรมดามากที่จะตรวจสอบความสัมพันธ์ระหว่างอนุกรมเวลาทางการเงินที่จะใช้รูปแบบของข้อมูลรายวัน ตัวแปรมักจะทำให้โดยการบันทึกความแตกต่างเช่น; LN ( P T ) - LN ( P T - 1 )I(0)I(0)I(0)ln(Pt)−ln(Pt−1)ln⁡(Pt)−ln⁡(Pt−1)\ln(P_t)-\ln(P_{t-1}) อย่างไรก็ตามข้อมูลรายวันหมายความว่ามีจุดข้อมูลในแต่ละสัปดาห์และวันเสาร์และวันอาทิตย์จะหายไป ดูเหมือนจะไม่ได้กล่าวถึงในวรรณคดีประยุกต์ที่ฉันรู้ นี่คือคำถามที่เกี่ยวข้องอย่างใกล้ชิดที่ฉันมีที่มาจากการสังเกตนี้:555 สิ่งนี้มีคุณสมบัติเป็นข้อมูลที่เว้นระยะไม่สม่ำเสมอหรือไม่แม้ว่าตลาดการเงินจะปิดทำการในช่วงสุดสัปดาห์ ถ้าเป็นเช่นนั้นจะมีผลต่อความถูกต้องของผลลัพธ์เชิงประจักษ์ที่ยังไม่ได้รวบรวมไว้ในเอกสารจำนวนมหาศาลที่ไม่สนใจเรื่องนี้อย่างไร

1
เป็นวิธีการของการสุ่มตัวอย่างเวลาชุดใหม่นี้เป็นที่รู้จักในวรรณคดี? มันมีชื่อหรือไม่?
เมื่อเร็ว ๆ นี้ฉันกำลังมองหาวิธีในการสุ่มตัวอย่างอนุกรมเวลาใหม่ในแบบที่ ประมาณรักษาความสัมพันธ์อัตโนมัติของกระบวนการหน่วยความจำยาว เก็บรักษาโดเมนของการสังเกต (ตัวอย่างเช่นชุดข้อมูลจำนวนเต็มครั้งที่ resampled ยังคงเป็นชุดข้อมูลจำนวนเต็มครั้ง) อาจส่งผลกระทบต่อเครื่องชั่งบางตัวเท่านั้นหากจำเป็น ฉันคิดรูปแบบการเปลี่ยนแปลงต่อไปนี้สำหรับอนุกรมเวลาที่มีความยาว :2ยังไม่มีข้อความ2ยังไม่มีข้อความ2^N Bin อนุกรมเวลาโดยการสังเกตต่อเนื่องเป็นคู่ (มีถังขยะ) พลิกแต่ละของพวกเขา ( เช่นดัชนีจากไป) อย่างอิสระที่มีความน่าจะเป็น1/22ยังไม่มีข้อความ- 12ยังไม่มีข้อความ-12^{N-1}1:22:11 / 21/21/2 Bin อนุกรมเวลาที่ได้รับจากการสังเกตครั้งติดต่อกัน(มีถังขยะ) ย้อนกลับแต่ละของพวกเขา ( เช่นดัชนีจากไป) independelty กับความน่า1/24442ยังไม่มีข้อความ- 22ยังไม่มีข้อความ-22^{N-2}1:2:3:44:3:2:11 / 21/21/2 ทำซ้ำขั้นตอนที่มีถังขยะขนาด , , ... ,เสมอย้อนกลับถังขยะที่มีความน่าจะเป็น1/28881616162N−12N−12^{N-1}1/21/21/2 การออกแบบนี้เป็นเชิงประจักษ์ล้วนและฉันกำลังมองหางานที่จะได้รับการตีพิมพ์ในประเภทของการเปลี่ยนแปลงนี้ ฉันยังเปิดรับข้อเสนอแนะสำหรับวิธีเรียงสับเปลี่ยนหรือโครงร่างการสุ่มใหม่

2
คำถามเกี่ยวกับการถดถอยโลจิสติก
ฉันต้องการรันการถดถอยโลจิสติกแบบไบนารีเพื่อสร้างแบบจำลองการมีหรือไม่มีความขัดแย้ง (ตัวแปรตาม) จากชุดของตัวแปรอิสระในช่วง 10 ปี (1997-2006) โดยแต่ละปีมีการสังเกต 107 ครั้ง ที่ปรึกษาของฉันคือ: การเสื่อมสภาพของดิน (แบ่งเป็น 2 ประเภทคือการย่อยสลาย); จำนวนประชากรเพิ่มขึ้น (0- no; 1-yes); ประเภทการดำรงชีวิต (0 - ประเภทหนึ่ง; 1 - ประเภทสอง); ความหนาแน่นของประชากร (ความหนาแน่นสามระดับ); NDVIอย่างต่อเนื่อง (ผลผลิตสูงสุด veg); NDVI t - 1 (ลดลง veg จากปีก่อน - 0 - no; 1 -yes) และt - 1เสื้อ-1_{t-1} และ NDVI (การลดลงของ veg …

3
ใครช่วยอธิบายการแปรปรวนเวลาแบบไดนามิกเพื่อพิจารณาความคล้ายคลึงของอนุกรมเวลาได้หรือไม่?
ฉันพยายามเข้าใจการวัดเวลาแปรปรวนแบบไดนามิกสำหรับการเปรียบเทียบอนุกรมเวลาเข้าด้วยกัน ฉันมีชุดข้อมูลสามชุดดังนี้: T1 <- structure(c(0.000213652387565, 0.000535045478866, 0, 0, 0.000219346347883, 0.000359669104424, 0.000269469145783, 0.00016051364366, 0.000181950509461, 0.000385579332948, 0.00078170803205, 0.000747244535774, 0, 0.000622858922454, 0.000689084895259, 0.000487983408564, 0.000224744353298, 0.000416449765747, 0.000308388157895, 0.000198906016907, 0.000179549331179, 9.06289650172e-05, 0.000253506844685, 0.000582896161212, 0.000386473429952, 0.000179839942451, 0, 0.000275608635737, 0.000622665006227, 0.00036075036075, 0.00029057097196, 0.000353232073472, 0.000394710874285, 0.000207555002076, 0.000402738622634, 0, 0.000309693403531, 0.000506521463847, 0.000226988991034, 0.000414164423276, 9.6590360282e-05, 0.000476689865573, 0.000377572210685, 0.000378967314069, 9.25240562546e-05, 0.000172309813044, …

2
ARMA / ARIMA เกี่ยวข้องกับการสร้างแบบจำลองเอฟเฟกต์ผสมอย่างไร?
ในการวิเคราะห์ข้อมูลแบบพาเนลฉันใช้โมเดลหลายระดับพร้อมเอฟเฟ็กต์แบบสุ่ม / ผสมเพื่อจัดการกับปัญหาความสัมพันธ์อัตโนมัติ (เช่นการสังเกตมีการรวมกลุ่มภายในบุคคลเมื่อเวลาผ่านไป) ด้วยพารามิเตอร์อื่น ๆ ที่เพิ่มเข้ามาเพื่อปรับตามเวลาและแรงกระแทก . ดูเหมือน ARMA / ARIMA ออกแบบมาเพื่อแก้ไขปัญหาที่คล้ายกัน ทรัพยากรที่ฉันพบออนไลน์สนทนาทั้งชุด (ARMA / ARIMA) หรือโมเดลเอฟเฟกต์แบบผสม แต่นอกเหนือจากการสร้างความถดถอยฉันไม่เข้าใจความสัมพันธ์ระหว่างทั้งสอง มีใครต้องการใช้ ARMA / ARIMA จากภายในรุ่นหลายระดับหรือไม่ มีความรู้สึกในสิ่งที่ทั้งสองจะเทียบเท่าหรือซ้ำซ้อน? คำตอบหรือตัวชี้ไปยังแหล่งข้อมูลที่กล่าวถึงเรื่องนี้จะดีมาก

2
การเลือกโมเดล Box-Jenkins
ขั้นตอนการคัดเลือกแบบจำลอง Box-Jenkins ในการวิเคราะห์อนุกรมเวลาเริ่มต้นขึ้นโดยดูที่ฟังก์ชันการหาค่าความสัมพันธ์และฟังก์ชั่นความสัมพันธ์แบบกึ่งอัตโนมัติบางส่วนของชุดข้อมูล พล็อตเหล่านี้สามารถแนะนำและqที่เหมาะสมในโมเดลARMA ( p , q ) ขั้นตอนดำเนินการต่อโดยขอให้ผู้ใช้ใช้เกณฑ์ AIC / BIC เพื่อเลือกแบบจำลองที่เป็นทางเลือกมากที่สุดในบรรดารุ่นที่สร้างแบบจำลองที่มีเงื่อนไขข้อผิดพลาดของสัญญาณรบกวนสีขาวพีพีpQQq( p , q)(พี,Q)(p,q) ฉันสงสัยว่าขั้นตอนเหล่านี้ของการตรวจสอบด้วยภาพและการเลือกแบบจำลองตามเกณฑ์นั้นมีผลต่อข้อผิดพลาดมาตรฐานโดยประมาณของรุ่นสุดท้ายอย่างไร ฉันรู้ว่าขั้นตอนการค้นหาจำนวนมากในโดเมนแบบตัดขวางอาจมีอคติข้อผิดพลาดมาตรฐานลดลงเช่น ในขั้นตอนแรกการเลือกจำนวนล่าช้าที่เหมาะสมโดยการดูข้อมูล (ACF / PACF) ส่งผลต่อข้อผิดพลาดมาตรฐานสำหรับรุ่นอนุกรมเวลาอย่างไร ฉันเดาว่าการเลือกรูปแบบตามคะแนน AIC / BIC จะมีผลกระทบคล้ายกับวิธีการแบบตัดขวาง จริง ๆ แล้วฉันไม่ทราบเกี่ยวกับพื้นที่นี้มากนักดังนั้นความคิดเห็นใด ๆ ก็จะได้รับการชื่นชมในจุดนี้เช่นกัน สุดท้ายหากคุณจดบันทึกเกณฑ์ที่แม่นยำซึ่งใช้สำหรับแต่ละขั้นตอนคุณสามารถบูตกระบวนการทั้งหมดเพื่อประเมินข้อผิดพลาดมาตรฐานและกำจัดข้อกังวลเหล่านี้ได้หรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.