คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

2
วิธีตรวจสอบการคาดการณ์ของอนุกรมเวลา
หนึ่งในประเด็นสำคัญที่นักพยากรณ์ประสบคือถ้าซีรีส์ที่กำหนด สามารถคาดการณ์ได้หรือไม่? ฉันสะดุดกับบทความเรื่อง " เอนโทรปีในฐานะตัวบ่งชี้การพยากรณ์ของ Priori " โดย Peter Catt ที่ใช้Entropimate Entropy (ApEn) เป็นตัวชี้วัดที่สัมพันธ์กันเพื่อกำหนดชุดเวลาที่กำหนด บทความกล่าวว่า "ค่า ApEn ที่เล็กลงบ่งชี้ว่ามีโอกาสมากขึ้นที่ชุดข้อมูลจะตามด้วยข้อมูลที่คล้ายกัน (ความเป็นปกติ) ในทางกลับกันค่าที่ใหญ่กว่าของ ApEn บ่งชี้ว่าโอกาสที่ข้อมูลที่คล้ายกันซ้ำกันจะลดลง การสุ่มและความซับซ้อนของระบบ " และตามด้วยสูตรทางคณิตศาสตร์สำหรับการคำนวณ ApEn นี่เป็นวิธีการที่น่าสนใจเพราะให้ค่าตัวเลขที่สามารถใช้ในการประเมินความคาดการณ์ในแง่ที่เกี่ยวข้อง ฉันไม่รู้ว่า Entropy หมายถึงอะไรฉันกำลังอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้ มีแพคเกจที่เรียกว่าเป็นpracmaในRที่ช่วยให้คุณคำนวณ Apen เพื่อวัตถุประสงค์ในการอธิบายฉันใช้อนุกรมเวลา 3 แบบและคำนวณตัวเลข ApEn อันดับ 1:ซีรี่ส์เวลาของ AirPassenger ที่มีชื่อเสียง - ถูกกำหนดไว้สูงและเราควรคาดการณ์ได้ง่าย Series 2: Sunspot Time Series - ถูกกำหนดไว้อย่างดี แต่ควรคาดการณ์ได้น้อยกว่า …

2
การแทรกแซงด้วยความแตกต่าง
เมื่อทำการวิเคราะห์การแทรกแซงด้วยข้อมูลอนุกรมเวลา (อนุกรมเวลาขัดจังหวะ aka) ดังที่กล่าวไว้ที่นี่ตัวอย่างหนึ่งข้อกำหนดที่ฉันมีคือการประเมินผลรวม (หรือการสูญเสีย) เนื่องจากการแทรกแซง - จำนวนหน่วยที่ได้รับหรือสูญหาย (ตัวแปร Y ) ไม่เข้าใจวิธีการประมาณฟังก์ชั่นการแทรกแซงโดยใช้ฟังก์ชั่นตัวกรองภายใน R ฉันไปเกี่ยวกับมันในลักษณะเดรัจฉานแรงหวังว่านี่เป็นเรื่องทั่วไปพอที่จะทำงานในสถานการณ์ใด ๆ ให้บอกว่าได้รับข้อมูล cds<- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L, 2084L, 2031L, 2256L, 2401L, 3253L, 2881L, 2555L, 2585L, 3015L, 2608L, 3676L, 5763L, 4626L, 3848L, 4523L, 4186L, 4070L, 4000L, 3498L), .Dim = c(29L, 1L), …

4
การแปรปรวนเวลาแบบไดนามิกสำหรับอนุกรมเวลาที่ผิดปกติ
ฉันได้อ่านเกี่ยวกับ Dynamic Time Warping (DTW) เมื่อไม่นานมานี้ ฉันประหลาดใจมากที่ไม่มีวรรณกรรมเลยในการใช้ DTW กับซีรี่ย์เวลาที่ผิดปกติหรืออย่างน้อยฉันก็หาไม่เจอ ใครช่วยให้ฉันอ้างอิงถึงบางสิ่งที่เกี่ยวข้องกับปัญหานั้นหรือแม้กระทั่งการใช้งานได้หรือไม่

2
ANOVA สองทางเหมาะสมหรือไม่
นี่คือคำอธิบายของการศึกษาของฉัน ฉันกำลังทดลองกับพืชสามชนิด: A, B และ C พืชเหล่านี้ควรจะลดระดับน้ำตาลในเลือดสำหรับผู้ป่วยเบาหวาน ฉันต้องการตรวจสอบว่าต้นไม้สามชนิดใดมีผลต่อการลดระดับน้ำตาลในเลือดได้นานขึ้นหลังจากที่หนูได้รับหนูเพียงครั้งเดียว ทำได้โดยการวัดระดับน้ำตาลในเลือดจากหนูที่เวลา 7 คะแนน (วันที่ 1, 2, 3, 5, 7, 10 และ 14) ดังนั้นจึงมี 4 กลุ่ม (ไม่ถูกรักษารับการรักษาด้วย A ได้รับการรักษาด้วย B และรับการรักษาด้วย C) สำหรับการใช้หนู 3 กลุ่มแต่ละกลุ่ม (n = 3) เป้าหมายของฉันคือ: เพื่อตรวจสอบว่าผลกระทบของการรักษาพืชแต่ละอย่างมีนัยสำคัญเมื่อเทียบกับไม่ได้รับการรักษา เพื่อเปรียบเทียบผลของกลุ่มในแต่ละวัน เพื่อตรวจสอบว่ากลุ่มที่ได้รับการรักษามีผลยาวนานที่สุดหลังจาก 14 วัน ทางออกของฉันคือใช้ ANOVA สองทางเนื่องจากมีมากกว่า 2 กลุ่มและฉันต้องการเปรียบเทียบกลุ่มในแต่ละวันและในที่สุดก็ถึงผลกระทบโดยรวม นี่เป็นวิธีที่ถูกต้องหรือไม่? ฉันจะสามารถจัดอันดับซึ่งจะเป็นพืชที่ดีที่สุดตามด้วยอันดับที่ 2 และ …

3
การพยากรณ์ฟังก์ชันความหนาแน่น
ฉันกำลังทำการวิจัยเกี่ยวกับการทำนายอนุกรมเวลาของฟังก์ชันความหนาแน่นของความน่าจะเป็น เรากำลังตั้งเป้าที่จะคาดการณ์ PDF ที่ได้รับจากการสังเกตในอดีต (ปกติแล้วโดยประมาณ) PDF วิธีการพยากรณ์ที่เรากำลังพัฒนานั้นทำได้ค่อนข้างดีในการศึกษาแบบจำลอง อย่างไรก็ตามฉันต้องการตัวอย่างตัวเลขจากแอปพลิเคชันจริงเพื่อแสดงวิธีการของเราเพิ่มเติม ดังนั้นมีตัวอย่างที่เหมาะสมในแอปพลิเคชัน (การเงินเศรษฐศาสตร์ชีววิทยาวิศวกรรม ฯลฯ ) ที่มีการรวบรวมอนุกรมเวลาของ PDF และเป็นสิ่งสำคัญและยากที่จะคาดเดาชุดเวลาดังกล่าวหรือไม่

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
ทำความเข้าใจกับเส้นประสีน้ำเงินใน ACF จาก R
ฉันมีปัญหาเล็กน้อยในการทำความเข้าใจเส้นประสีน้ำเงินในภาพต่อไปนี้ของฟังก์ชั่นความสัมพันธ์อัตโนมัติ: มีคนให้คำอธิบายง่ายๆกับฉันว่าพวกเขาบอกอะไรฉัน

3
วิธีการดูข้อมูลอนุกรมเวลาขนาดใหญ่แบบโต้ตอบ?
ฉันมักจะจัดการกับข้อมูลอนุกรมเวลาที่มีขนาดพอสมควรจำนวน 50-200 ล้านคู่กับการประทับเวลาที่เกี่ยวข้องและต้องการเห็นภาพเหล่านั้นแบบไดนามิก มีซอฟต์แวร์ที่มีอยู่ให้ทำอย่างมีประสิทธิภาพหรือไม่ ห้องสมุดและรูปแบบข้อมูลเป็นอย่างไร Zoom-cacheเป็นตัวอย่างหนึ่งของการมุ่งเน้นไปที่อนุกรมเวลาขนาดใหญ่ ในซูมแคชข้อมูลสรุปที่ความละเอียดหลายอย่างเพื่อให้ง่ายต่อการดูที่ความละเอียดที่แตกต่างกัน แก้ไข: หากมีที่อื่นฉันควรถามคำถามนี้หรือค้นหาคำตอบโปรดแจ้งให้เราทราบ

2
การตีความฤดูกาลตาม ACF และ PACF
ฉันมีชุดข้อมูลที่สัญชาตญาณเชิงประจักษ์บอกว่าฉันควรคาดหวังว่าจะมีฤดูกาลประจำสัปดาห์ (เช่นพฤติกรรมในวันเสาร์และวันอาทิตย์นั้นแตกต่างจากส่วนที่เหลือของสัปดาห์) หลักฐานนี้ควรเป็นจริงกราฟกราฟความสัมพันธ์แบบอัตโนมัติไม่ควรให้ฉันระเบิดที่ความล่าช้าทวีคูณของ 7 หรือไม่? นี่คือตัวอย่างของข้อมูล: data = TemporalData[{{{2012, 09, 28}, 19160768}, {{2012, 09, 19}, 19607936}, {{2012, 09, 08}, 7867456}, {{2012, 09, 15}, 11245024}, {{2012, 09, 04}, 0}, {{2012, 09, 21}, 24314496}, {{2012, 09, 12}, 11233632}, {{2012, 09, 03}, 9886496}, {{2012, 09, 09}, 9122272}, {{2012, 09, 24}, 23103456}, {{2012, 09, …

1
“ ทฤษฎีขีด จำกัด กลาง” สำหรับผลรวมถ่วงน้ำหนักของตัวแปรสุ่มที่สัมพันธ์กัน
ฉันกำลังอ่านกระดาษซึ่งอ้างว่า (เช่นการแปลงฟูริเยร์แบบไม่ต่อเนื่อง, DFT) โดย CLT มีแนวโน้มที่จะเป็นตัวแปรสุ่ม (ซับซ้อน) gaussian อย่างไรก็ตามฉันรู้ว่านี่ไม่เป็นความจริงโดยทั่วไป หลังจากอ่านอาร์กิวเมนต์ (ผิดพลาด) นี้ฉันค้นหาผ่านเน็ตและพบบทความนี้โดย Peligrad & Wu ปี 2010ที่พวกเขาพิสูจน์ว่าสำหรับกระบวนการคงที่บางคนสามารถพบ "ทฤษฎีบท CLT"X^k= 1ยังไม่มีข้อความ--√Σj = 0ยังไม่มีข้อความ- 1XJอี- ฉัน2 πk j / N,X^k=1ยังไม่มีข้อความΣJ=0ยังไม่มีข้อความ-1XJอี-ผม2πkJ/ยังไม่มีข้อความ,\hat{X}_k=\frac{1}{\sqrt{N}}\sum_{j=0}^{N-1}X_je^{-i2\pi kj/N}, คำถามของฉันคือ: คุณมีการอ้างอิงอื่น ๆ ที่พยายามแก้ไขปัญหาในการค้นหาการ จำกัด การกระจายของ DFT ของลำดับดัชนีที่กำหนด (ทั้งโดยการจำลองหรือทฤษฎี) หรือไม่? ฉันสนใจโดยเฉพาะอย่างยิ่งในอัตราการบรรจบกัน (เช่นความรวดเร็วของ DFT ที่มาบรรจบกัน) เนื่องจากโครงสร้างความแปรปรวนร่วมของในบริบทของการวิเคราะห์อนุกรมเวลาXJXJX_j

3
วิธีทำแบบจำลองลำเอียงที่มีอคติแตกต่างกันไปตามเวลา
สินค้าทุกรุ่นของเหรียญลำเอียงมักจะมีพารามิเตอร์หนึ่งtheta) วิธีหนึ่งในการประมาณจากชุดของการจับฉลากคือการใช้เบต้าก่อนหน้านี้และคำนวณการกระจายด้านหลังด้วยความน่าจะเป็นทวินามθ=P(Head|θ)θ=P(Head|θ)\theta = P(\text{Head} | \theta)θθ\theta ในการตั้งค่าของฉันเพราะของกระบวนการทางกายภาพบางอย่างแปลกคุณสมบัติเหรียญของฉันจะเปลี่ยนแปลงอย่างช้าๆและกลายเป็นหน้าที่ของเวลาทีข้อมูลของฉันคือชุดของคำสั่งให้ดึงเช่น\} ฉันสามารถพิจารณาว่าฉันมีเพียงหนึ่งวาดสำหรับแต่ละในตารางเวลาไม่ต่อเนื่องและปกติθθ\thetattt{H,T,H,H,H,T,...}{H,T,H,H,H,T,...}\{H,T,H,H,H,T,...\}ttt คุณจะทำแบบนี้อย่างไร ฉันกำลังคิดบางอย่างเช่นตัวกรองคาลมานที่ปรับให้เข้ากับความจริงที่ว่าตัวแปรที่ซ่อนอยู่คือและรักษาโอกาสทวินาม ฉันจะใช้อะไรกับโมเดลเพื่อให้อนุมานได้θθ\thetaP(θ(t+1)|θ(t))P(θ(t+1)|θ(t))P(\theta(t+1)|\theta(t)) แก้ไขคำตอบต่อไปนี้ (ขอบคุณ!) : ฉันต้องการสร้างแบบจำลองเป็น Markov Chain ของคำสั่งที่ 1 เหมือนที่ทำในตัวกรอง HMM หรือ Kalman ข้อสันนิษฐานเดียวที่ฉันทำได้คือราบรื่น ฉันสามารถเขียนด้วยเสียงแบบเกาส์ขนาดเล็ก (ความคิดตัวกรองคาลมาน) แต่สิ่งนี้จะทำลายข้อกำหนดที่จะต้องยังคงอยู่ใน[0,1]จากแนวคิดต่อไปนี้จาก @J Dav ฉันสามารถใช้ฟังก์ชัน probit เพื่อแมปบรรทัดจริงกับแต่ฉันมีสัญชาตญาณว่าสิ่งนี้จะให้โซลูชันที่ไม่ใช่การวิเคราะห์ การแจกแจงแบบเบต้าพร้อมค่าเฉลี่ยθ(t)θ(t)\theta(t)θ(t)θ(t)\theta(t)P(θ(t+1)|θ(t))=θ(t)+ϵP(θ(t+1)|θ(t))=θ(t)+ϵP(\theta(t+1)|\theta(t)) = \theta(t) + \epsilonϵϵ\epsilonθθ\theta[0,1][0,1][0,1][0,1][0,1][0,1]θ(t)θ(t)\theta(t) และความแปรปรวนที่กว้างขึ้นสามารถทำกลอุบายได้ ฉันถามคำถามนี้เพราะฉันรู้สึกว่าปัญหานี้ง่ายมากจนต้องมีการศึกษามาก่อน

1
การวิเคราะห์อนุกรมเวลาแบบอะซิงโครนัส
ฉันพยายามวิเคราะห์ช่วงเวลารอคอยของอนุกรมเวลาของราคาหุ้นสองแห่ง ในการวิเคราะห์อนุกรมเวลาปกติเราสามารถทำ Cross Correlaton, VECM (Granger Causality) อย่างไรก็ตามวิธีการหนึ่งจะจัดการเดียวกันในอนุกรมเวลาเว้นระยะไม่สม่ำเสมอ สมมติฐานคือเครื่องมือหนึ่งนำไปสู่อีกอันหนึ่ง ฉันมีข้อมูลสำหรับสัญลักษณ์ทั้งสองถึงไมโครวินาที ฉันดูแพ็คเกจ RTAQ และลองใช้ VECM RTAQ นั้นเพิ่มเติมในอนุกรมเวลาที่ไม่เปลี่ยนแปลงในขณะที่ VECM ไม่สำคัญในช่วงเวลาเหล่านี้ > dput(STOCKS[,])) structure(c(29979, 29980, 29980, 29980, 29981, 29981, 29991, 29992, 29993, 29991, 29990, 29992), .Dim = c(6L, 2L), .Dimnames = list(NULL, c("Pair_Bid", "Calc_Bid" )), index = structure(c(1340686178.55163, 1340686181.40801, 1340686187.2642, 1340686187.52668, 1340686187.78777, 1340686189.36693), …

1
รูปแบบของการคลิกเมาส์ (หรือแป้นพิมพ์) และทำนายการกระทำของผู้ใช้คอมพิวเตอร์
ขึ้นอยู่กับรูปแบบชั่วคราวของการคลิกเมาส์ (รายการเวลาในการคลิก ) เป็นไปได้หรือไม่ที่จะทำนายกิจกรรมของผู้ใช้คอมพิวเตอร์?[t1,t2,t3,…][t1,t2,t3,…][t_1,t_2,t_3,\ldots] ตัวอย่างเช่นจาก: การทำงานกับการใช้เวลากับ Facebook เทียบกับการดูรูปถ่ายและเล่นเกมคอมพิวเตอร์ หากพวกเขาเป็นการคาดการณ์ที่ละเอียดยิ่งขึ้น (เช่นการเล่น StarCraft vs Counter Strike vs SimCity) ฉันก็สนใจเช่นกัน ในขณะที่ (สามารถได้ยินได้ว่าใครบางคนกำลังเล่นอยู่ (เนื่องจากการคลิกที่รวดเร็วและต่อเนื่อง) หรือดูรูปภาพ (การคลิกระยะห่างเท่า ๆ กัน) ฉันสนใจถ้ามีการค้นพบที่เป็นวัตถุประสงค์เพิ่มเติม (สิ่งพิมพ์การวิจัยบนบล็อกเป็นต้น) . แก้ไข: ฉันสนใจในการคลิกแป้นพิมพ์อย่างเท่าเทียมกัน (โดยไม่แยกความแตกต่างว่าจะกดปุ่มใด) หรือวิธีการรวม (เมาส์ + คีย์บอร์ด)

2
อะไรคือความแตกต่างระหว่างความสัมพันธ์แบบอนุกรมและการมีหน่วยรูท
ฉันอาจจะผสมแนวความคิดอนุกรมเวลาและไม่ใช่อนุกรมเวลา แต่อะไรคือความแตกต่างระหว่างตัวแบบการถดถอยที่แสดงถึงสหสัมพันธ์แบบอนุกรมและแบบจำลองที่แสดงรูตหน่วย นอกจากนี้ทำไมคุณสามารถใช้การทดสอบ Durbin-Watson เพื่อทดสอบความสัมพันธ์แบบอนุกรม แต่ต้องใช้การทดสอบ Dickey-Fuller สำหรับรากหน่วย (หนังสือเรียนของฉันบอกว่านี่เป็นเพราะการทดสอบ Durbun Watson ไม่สามารถใช้ได้ในรุ่นที่มีความล่าช้าในตัวแปรอิสระ)

3
วิธีการเปรียบเทียบความแม่นยำของแบบจำลองที่แตกต่างกันสองแบบโดยใช้นัยสำคัญทางสถิติ
ฉันกำลังทำงานกับการทำนายอนุกรมเวลา ฉันมีสองชุดข้อมูลและ\} ฉันมีสามรูปแบบการทำนาย:M3 ทั้งหมดของรูปแบบเหล่านี้จะได้รับการฝึกฝนโดยใช้ตัวอย่างในชุดข้อมูลและประสิทธิภาพการทำงานของพวกเขาจะวัดโดยใช้กลุ่มตัวอย่างในชุดข้อมูลD2สมมติว่าตัวชี้วัดประสิทธิภาพคือ MSE (หรืออย่างอื่น) ค่า MSE ของแบบจำลองเหล่านั้นเมื่อวัดสำหรับชุดข้อมูลมีและMSE_3ฉันจะทดสอบได้อย่างไรว่าการปรับปรุงโมเดลหนึ่งเหนืออีกโมเดลหนึ่งนั้นมีนัยสำคัญทางสถิติD 1 = { x1, x2, . . . . xn}D1={x1,x2,....xn}D1=\{x_1, x_2,....x_n\}D 2 = { xn+ 1 , xn+ 2 , xn+ 3 , . . . , xn+ k }D2={xn+1,xn+2,xn+3,....,xn+k}D2=\{x_n+1, x_n+2, x_n+3,...., x_n+k\}M1 , M2 , M3M1,M2,M3M1, M2, M3D 1D1D1D 2D2D2D …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.