คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

2
สร้างอนุกรมเวลาที่มีข้อสังเกตหลายอย่างสำหรับแต่ละวัน
ฉันพยายามใช้อนุกรมเวลากับข้อมูลตัวอย่างรายไตรมาส (ชีวมวลสัตว์) ในช่วงเวลา 10 ปีโดยมี 3 reps ต่อไตรมาส ดังนั้น 40 วัน แต่ 120 การสังเกตทั้งหมด ฉันได้อ่านถึง SARIMA'a ในการวิเคราะห์อนุกรมเวลาของ Shumway และ Stoffer แล้วและก็เป็นแอปพลิเคชันเช่นเดียวกับ Woodward ที่เหลืออยู่ การวิเคราะห์อนุกรมเวลาของอัลประยุกต์และความเข้าใจของฉันคือแต่ละแบบจำลองนั้นอิงจากการสังเกตเพียงจุดเดียวในแต่ละจุดในอนุกรมเวลา คำถาม: ฉันจะรวมการเปลี่ยนแปลงในแต่ละการสังเกตในแบบจำลองของฉันได้อย่างไร ฉันสามารถสร้างซีรีส์ตามค่าเฉลี่ย แต่ฉันจะหลวมการเปลี่ยนแปลงในแต่ละการสังเกตและฉันคิดว่ามันเป็นสิ่งสำคัญที่จะเข้าใจสิ่งที่เกิดขึ้น
11 r  time-series 

1
IDF แบบเพิ่มหน่วย (ความถี่เอกสารผกผัน)
ในแอปพลิเคชันการทำเหมืองข้อความวิธีการง่ายๆอย่างหนึ่งคือการใช้การแก้ปัญหาเพื่อสร้างเวกเตอร์เป็นการนำเสนอที่กระจัดกระจายของเอกสาร นี่เป็นเรื่องปกติสำหรับการตั้งค่าแบบแบตช์ซึ่งเป็นที่รู้จักทั้งคลังข้อมูล a-Priori เนื่องจากต้องการทั้งคลังข้อมูลฉันd ft f- ฉันdฉtf−idftf-idfฉันdฉidfidf ฉันd ฉ( t ) = บันทึก| D || {d: t ∈ d} |ผมdฉ(เสื้อ)=เข้าสู่ระบบ⁡|D||{d:เสื้อ∈d}| \mathrm{idf}(t) = \log \frac{|D|}{|\{d: t \in d\}|} โดยที่คือคำศัพท์,คือเอกสาร,คือคลังเอกสาร, และ (ไม่แสดง) เป็นพจนานุกรมd D Tเสื้อเสื้อtdddDDDTTT อย่างไรก็ตามโดยทั่วไปแล้วจะได้รับเอกสารใหม่เมื่อเวลาผ่านไป ทางเลือกหนึ่งคือการใช้ที่มีอยู่ต่อไปจนกว่าจะได้รับเอกสารใหม่จำนวนหนึ่งและทำการคำนวณใหม่ อย่างไรก็ตามเรื่องนี้ดูเหมือนจะไม่มีประสิทธิภาพ ไม่มีใครรู้ของรูปแบบการปรับปรุงที่เพิ่มขึ้นที่ (อาจจะประมาณ) มาบรรจบกับค่าถ้าข้อมูลทั้งหมดถูกเห็นล่วงหน้า? หรืออีกวิธีหนึ่งจะมีมาตรการอื่นที่จับความคิดเดียวกัน แต่สามารถคำนวณในแบบที่เพิ่มขึ้น?ฉันdฉผมdฉidf นอกจากนี้ยังมีคำถามที่เกี่ยวข้องว่ายังคงใช้งานได้ดีเมื่อเวลาผ่านไป เนื่องจาก idf รวบรวมความคิดเกี่ยวกับความถี่ของคำศัพท์ของคลังข้อมูลมันเป็นไปได้ที่เอกสารเก่าในคลังข้อมูล (เช่นตัวอย่างเช่นคลังข้อมูลของฉันครอบคลุมบทความวารสารกว่า 100 ปี) เนื่องจากความถี่ของคำที่แตกต่างกันเปลี่ยนแปลงไปตามกาลเวลา ในกรณีนี้มันจริงอาจจะเหมาะสมที่จะโยนออกเอกสารเก่าเมื่อคนใหม่เข้ามาในผลการใช้หน้าต่างบานเลื่อนIDFน่าจะเป็นไปได้ที่เราสามารถเก็บเวกเตอร์ก่อนหน้านี้ทั้งหมดได้เมื่อใหม่แล้วถ้าเราต้องการเรียกเอกสารจาก …

1
สิ่งที่ต้องอ่านจากฟังก์ชั่นออโต้คอร์สัมพันธ์
เมื่อให้อนุกรมเวลาเราสามารถประมาณค่าความสัมพันธ์ระหว่างฟังก์ชันและพล็อตได้เช่นตามที่เห็นด้านล่าง อะไรคือความเป็นไปได้ที่จะอ่านเกี่ยวกับอนุกรมเวลาจากฟังก์ชั่นความสัมพันธ์อัตโนมัตินี้? ยกตัวอย่างเช่นเป็นไปได้หรือไม่ที่จะให้เหตุผลเกี่ยวกับความคงที่ของอนุกรมเวลา แก้ไข : ที่นี่ฉันได้รวม ACF ของซีรีส์ที่แตกต่างกับล่าช้ามากขึ้น

1
ช่วงความเชื่อมั่นสำหรับความแตกต่างในอนุกรมเวลา
ฉันมีโมเดลสุ่มที่ใช้ในการจำลองอนุกรมเวลาของกระบวนการบางอย่าง ฉันสนใจผลของการเปลี่ยนพารามิเตอร์หนึ่งค่าเป็นค่าเฉพาะและต้องการแสดงความแตกต่างระหว่างอนุกรมเวลา (พูดแบบจำลอง A และแบบจำลอง B) และช่วงความเชื่อมั่นแบบจำลองบางประเภท ฉันทำการจำลองสถานการณ์จากรุ่น A และพวงจากรุ่น B แล้วลบค่ามัธยฐานในแต่ละจุดเพื่อค้นหาความแตกต่างของค่ามัธยฐานตลอดเวลา ฉันใช้วิธีการเดียวกันเพื่อค้นหา 2.5 และ 97.5 quantiles ดูเหมือนว่าจะเป็นวิธีที่อนุรักษ์นิยมมากเนื่องจากฉันไม่ได้พิจารณาแต่ละชุดเวลาร่วมกัน (เช่นแต่ละจุดถือว่าเป็นอิสระจากชุดอื่น ๆ ทั้งหมดในเวลาก่อนหน้าและอนาคต) มีวิธีที่ดีกว่าในการทำเช่นนี้?

1
การพิจารณาว่าการเปลี่ยนแปลงในอนุกรมเวลามีนัยสำคัญทางสถิติหรือไม่
ฉันมีจำนวนการโทรทั้งหมดที่ได้รับในแต่ละสัปดาห์และได้วางแผนไว้ในแผนภูมิย้อนกลับไปเกือบ 3 ปี ดูเหมือนว่าในวันคริสต์มาสจะมีการลดลงครั้งใหญ่ซึ่งดูเหมือนว่าจะไม่สามารถฟื้นตัวได้ดูเหมือนว่ามีการเปลี่ยนแปลงขั้นตอนในการร้องขอ มีการทดสอบที่ฉันสามารถทำได้ที่สามารถวัดความแตกต่างนี้ได้หรือไม่? ไชโย เบน

1
การทำนายกระบวนการหน่วยความจำระยะยาว
ฉันกำลังทำงานกับกระบวนการสองสถานะด้วยxเสื้อxtx_tใน{ 1 , - 1 }{1,−1}\{1, -1\}สำหรับt = 1 , 2 , ...t=1,2,…t = 1, 2, \ldots ฟังก์ชั่น autocorrelation เป็นตัวบ่งชี้ของกระบวนการที่มีหน่วยความจำยาวนั่นคือมันแสดงการสลายตัวของกฎกำลังไฟฟ้าที่มีเลขชี้กำลัง <1 คุณสามารถจำลองชุดที่คล้ายกันใน R ด้วย: > library(fArma) > x<-fgnSim(10000,H=0.8) > x<-sign(x) > acf(x) คำถามของฉัน: มีวิธีบัญญัติมาตรฐานหรือไม่ที่จะทำนายค่าถัดไปในซีรีส์ที่ได้รับมาจากฟังก์ชั่น วิธีหนึ่งในการทำนายก็คือใช้ x^( t ) = x ( t - 1 )x^(t)=x(t−1)\hat{x}(t) = x(t-1) ซึ่งมีอัตราการจำแนกประเภทโดยที่คือความสัมพันธ์แบบอัตโนมัติ -1 แต่ฉันรู้สึกว่ามันต้องเป็นไปได้ที่จะทำได้ดีขึ้นโดยคำนึงถึงโครงสร้างหน่วยความจำระยะยาวρ( …

2
ตรวจจับการเปลี่ยนแปลงในอนุกรมเวลา
ฉันเจอรูปภาพของต้นแบบแอปพลิเคชันที่พบการเปลี่ยนแปลงที่สำคัญ ("แนวโน้ม" - ไม่ใช่ spikes / outliers) ในข้อมูลการจราจร: ฉันต้องการเขียนโปรแกรม (Java หรือเป็นทางเลือก R) ที่สามารถทำเช่นเดียวกัน - แต่เนื่องจากทักษะทางสถิติของฉันค่อนข้างจะเป็นสนิมฉันจึงต้องขุดลงในหัวข้อนี้อีกครั้ง ฉันควรใช้วิธีการ / อัลกอริทึม / การวิจัยอย่างไร

3
การวิเคราะห์การแทรกแซงด้วยอนุกรมเวลาหลายมิติ
ฉันต้องการทำการวิเคราะห์การแทรกแซงเพื่อหาปริมาณผลลัพธ์ของการตัดสินใจเชิงนโยบายเกี่ยวกับการขายแอลกอฮอล์เมื่อเวลาผ่านไป อย่างไรก็ตามฉันค่อนข้างใหม่กับการวิเคราะห์อนุกรมเวลาดังนั้นฉันจึงมีคำถามเริ่มต้น จากการตรวจสอบวรรณกรรมพบว่านักวิจัยคนอื่นได้ใช้ ARIMA เพื่อจำลองการขายเครื่องดื่มแอลกอฮอล์ตามลำดับเวลาโดยมีตัวแปรหุ่นจำลองเป็นตัวแทนเพื่อจำลองผลกระทบของการแทรกแซง ในขณะที่สิ่งนี้ดูเหมือนจะเป็นวิธีการที่สมเหตุสมผล แต่ชุดข้อมูลของฉันก็ยิ่งดีกว่าที่ฉันเคยเขียนในวรรณคดี ประการแรกชุดข้อมูลของฉันถูกจำแนกตามประเภทเครื่องดื่ม (เช่นเบียร์ไวน์สุรา) แล้วแยกตามเขตภูมิศาสตร์ต่อไป ในขณะที่ฉันสามารถสร้างการวิเคราะห์ ARIMA แยกต่างหากสำหรับแต่ละกลุ่มที่ไม่ได้แยกจากกันแล้วเปรียบเทียบผลลัพธ์ แต่ฉันสงสัยว่ามีวิธีการที่ดีกว่าที่นี่ ใครบ้างที่คุ้นเคยกับข้อมูลอนุกรมเวลาหลายมิติมากขึ้นสามารถให้คำแนะนำหรือคำแนะนำได้?

4
ศาสดาจาก Facebook ต่างจากการถดถอยเชิงเส้นหรือไม่?
ดังนั้นสิ่งที่ฉันได้อ่านเกี่ยวกับผู้เผยพระวจนะของ Facebook ก็คือมันจะแบ่งช่วงเวลาออกเป็นแนวโน้มและฤดูกาล ตัวอย่างเช่นแบบจำลองเพิ่มเติมจะถูกเขียนเป็น: Y( t ) = g( t ) + s ( t ) + h ( t ) + eเสื้อy(t)=g(t)+s(t)+h(t)+et y(t) = g(t) + s(t) + h(t) + e_t กับ เสื้อttเวลา ก.( t )g(t)g(t)แนวโน้ม (อาจเป็นเชิงเส้นหรือโลจิสติก) s ( T )s(t)s(t)ฤดูกาล (รายวันรายสัปดาห์รายปี ... ) h ( t )h(t)h(t)วันหยุด อีเสื้อete_tข้อผิดพลาด …

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
สัญชาตญาณที่อยู่เบื้องหลังเครือข่ายประสาทแบบ Long Long Term Memory (LSTM) กำเริบคืออะไร?
แนวคิดที่อยู่เบื้องหลัง Recurrent Neural Network (RNN) ชัดเจนสำหรับฉัน ฉันเข้าใจในวิธีต่อไปนี้: เรามีลำดับของการสังเกต ( ) (หรือกล่าวอีกนัยหนึ่งคืออนุกรมเวลาหลายตัวแปร) การสังเกตแต่ละครั้งเป็นเวกเตอร์ตัวเลข -dimensional ภายในโมเดล RNN เราถือว่าการสังเกตต่อไปเป็นหน้าที่ของการสังเกตการณ์ก่อนหน้านี้เช่นเดียวกับ "สถานะที่ซ่อน" ก่อนหน้านี้ซึ่งสถานะที่ซ่อนอยู่จะถูกแสดงด้วยตัวเลข เวกเตอร์ (ขนาดของสถานะที่ถูกตรวจสอบและสถานะที่ซ่อนอยู่อาจแตกต่างกัน) รัฐที่ซ่อนตัวเองก็สันนิษฐานว่าขึ้นอยู่กับการสังเกตก่อนหน้านี้และสถานะที่ซ่อนอยู่:โอ⃗ 1, o⃗ 2, … , o⃗ no→1,o→2,…,o→n\vec o_1, \vec o_2, \dots, \vec o_nโอ⃗ ผมo→i\vec o_iยังไม่มีข้อความNNโอ⃗ ฉัน+ 1o→i+1\vec o_{i+1}โอ⃗ ผมo→i\vec o_{i}ชั่วโมง⃗ ผมh→i\vec h_i โอ⃗ ผม, ชั่วโมง⃗ ผม= F( o⃗ ฉัน- …

2
ทำไมฟังก์ชั่น stl จึงมีความแปรผันตามฤดูกาลอย่างมีนัยสำคัญด้วยข้อมูลแบบสุ่ม
ฉันพล็อตด้วยรหัสต่อไปนี้พร้อมฟังก์ชั่น stl (การสลายตามฤดูกาลของ Time Series by Loess): plot(stl(ts(rnorm(144), frequency=12), s.window="periodic")) มันแสดงให้เห็นถึงการเปลี่ยนแปลงตามฤดูกาลที่สำคัญกับข้อมูลสุ่มที่ใส่ไว้ในโค้ดด้านบน (ฟังก์ชัน rnorm) รูปแบบ Signficant จะเห็นทุกครั้งที่มีการเรียกใช้แม้ว่ารูปแบบจะแตกต่างกัน สองรูปแบบดังกล่าวจะแสดงด้านล่าง: เราจะพึ่งพาฟังก์ชั่น stl ในข้อมูลบางอย่างได้อย่างไรเมื่อมันแสดงการเปลี่ยนแปลงตามฤดูกาล ความแปรปรวนตามฤดูกาลนี้จำเป็นต้องเห็นในมุมมองของพารามิเตอร์อื่นหรือไม่? ขอบคุณสำหรับความเข้าใจของคุณ รหัสถูกนำมาจากหน้านี้: นี่เป็นวิธีที่เหมาะสมในการทดสอบผลกระทบตามฤดูกาลในข้อมูลการนับการฆ่าตัวตายหรือไม่?

2
เหตุใดเราจึงควรลบฤดูกาลออกจากอนุกรมเวลา
ขณะทำงานกับอนุกรมเวลาบางครั้งเราตรวจจับและลบฤดูกาลตามการวิเคราะห์สเปกตรัม ฉันเป็นผู้เริ่มต้นที่แท้จริงในซีรีย์ไทม์และฉันก็สับสนว่าทำไมคนเราต้องการที่จะลบฤดูกาลออกจากซีรีย์ดั้งเดิม ไม่ได้ลบฤดูกาลที่บิดเบือนข้อมูลต้นฉบับหรือไม่ เราได้ประโยชน์อะไรบ้างจากการสร้างอนุกรมเวลาโดยการลบฤดูกาล

2
หากอนุกรมเวลาเป็นคำสั่งที่สองที่หยุดนิ่งนี่จะแปลว่าเป็นเครื่องเขียนที่เคร่งครัดหรือไม่?
กระบวนการไม่หยุดนิ่งหากการกระจายข้อต่อของเหมือนกันกับการกระจายข้อต่อของสำหรับทุกสำหรับทุกและทุกt_1,Xเสื้อXเสื้อX_t X ที1 + k , X เสื้อ2 + k , . . , X ตันเมตร + kมk T 1 , T 2 , . . , เสื้อเมตรXเสื้อ1, Xเสื้อ2, . . . , Xเสื้อม.Xเสื้อ1,Xเสื้อ2,...,Xเสื้อม.X_{t_1},X_{t_2},...,X_{t_m}Xเสื้อ1+ k, Xเสื้อ2+ k, . . . , Xเสื้อม.+ kXเสื้อ1+k,Xเสื้อ2+k,...,Xเสื้อม.+kX_{t_1+k},X_{t_2+k},...,X_{t_m+k}ม.ม.mkkkเสื้อ1, t2, . . . , tม.เสื้อ1,เสื้อ2,...,เสื้อม.t_1,t_2,...,t_m กระบวนการคือลำดับที่สองนิ่งถ้าค่าเฉลี่ยของมันเป็นค่าคงที่และฟังก์ชั่น …

1
ทดสอบคุณสมบัติมาร์คอฟในอนุกรมเวลา
รับ (ปฏิบัติ) เวลาชุดกับX T ∈ { 1 , . . , n }จะมีการทดสอบทางสถิติสำหรับการทดสอบด้วย null สมมติฐานที่ว่าP ( X T | X T - 1 , X T - 2 , . . . , X 1 ) = P ( X T | X T - 1 ) ( เช่นคุณสมบัติมาร์คอฟ)?Xเสื้อXเสื้อX_tXเสื้อ∈ { …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.