คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

3
R: การสุ่มฟอเรสต์การโยน NaN / Inf ในข้อผิดพลาด“ การเรียกฟังก์ชันต่างประเทศ” แม้จะไม่มีชุดข้อมูลของ NaN [ปิด]
ฉันใช้คาเร็ตเพื่อรันฟอเรสต์แบบสุ่มที่ผ่านการตรวจสอบความถูกต้องข้ามชุดข้อมูล ตัวแปร Y เป็นปัจจัย ไม่มีชุดข้อมูลของ NaN, Inf's หรือ NA ในชุดข้อมูลของฉัน อย่างไรก็ตามเมื่อใช้ป่าสุ่มฉันได้รับ Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs …

1
ค่า“ ความถี่” สำหรับข้อมูลช่วงเวลาวินาที / นาทีใน R
ฉันใช้ R (3.1.1) และโมเดล ARIMA สำหรับการคาดการณ์ ฉันต้องการที่จะรู้ว่าสิ่งที่ควรเป็นพารามิเตอร์ "ความถี่" ซึ่งได้รับมอบหมายในts()ฟังก์ชั่นถ้าฉันใช้ข้อมูลอนุกรมเวลาซึ่งเป็น: คั่นด้วยนาทีและกระจายไปทั่ว 180 วัน (1440 นาที / วัน) คั่นด้วยวินาทีและกระจายไปทั่ว 180 วัน (86,400 วินาที / วัน) ถ้าฉันจำคำจำกัดความได้ถูกต้อง "ความถี่" ใน ts ใน R คือจำนวนการสังเกตต่อ "ซีซัน" คำถามตอนที่ 1: "ฤดูกาล" ในกรณีของฉันคืออะไร หากฤดูกาลคือ "วัน" ดังนั้น "ความถี่" เป็นนาที = 1440 และ 86,400 เป็นวินาทีหรือไม่ คำถามที่ 2: "ความถี่" อาจขึ้นอยู่กับสิ่งที่ฉันพยายามบรรลุ / …

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
เริ่มวิตกเกี่ยวกับอนุกรมเวลาด้วย R
หากคุณคิดย้อนกลับไปถึงเมื่อคุณเริ่มต้นด้วยการวิเคราะห์อนุกรมเวลา คุณต้องการใช้เครื่องมือแพ็คเกจ R และทรัพยากรอินเทอร์เน็ตอะไรบ้าง สิ่งที่ฉันพยายามถามคือควรเริ่มต้นที่ไหน โดยเฉพาะมีทรัพยากรใด ๆ สำหรับ R ที่ต้มลงจริง ๆ สำหรับผู้ที่ "ใหม่" การวิเคราะห์อนุกรมเวลากับ R
28 r  time-series 

5
ทำไมความแปรปรวนของการเดินสุ่มเพิ่มขึ้น?
การเดินแบบสุ่มที่กำหนดเป็นโดยที่เป็นเสียงสีขาว แสดงว่าตำแหน่งปัจจุบันคือผลรวมของตำแหน่งก่อนหน้า + คำที่ไม่ถูกคาดการณ์Yเสื้อ= Yt - 1+ eเสื้อYเสื้อ=Yเสื้อ-1+อีเสื้อY_{t} = Y_{t-1} + e_tอีเสื้ออีเสื้อe_t คุณสามารถพิสูจน์ได้ว่าฟังก์ชันค่าเฉลี่ยเนื่องจากμเสื้อ= 0μเสื้อ=0\mu_t = 0 E( Yเสื้อ) = E( e1+ e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0E(Yเสื้อ)=E(อี1+อี2+...+อีเสื้อ)=E(อี1)+E(อี2)+...+E(อีเสื้อ)=0+0+...+0E(Y_{t}) = E(e_1+ e_2+ ... +e_t) = E(e_1) + E(e_2) +... +E(e_t) = 0 + 0 + ... + 0 แต่ทำไมความแปรปรวนเพิ่มขึ้นเป็นเส้นตรงตามเวลา? สิ่งนี้มีบางอย่างที่เกี่ยวกับการไม่สุ่ม "บริสุทธิ์" เนื่องจากตำแหน่งใหม่มีความสัมพันธ์กับตำแหน่งก่อนหน้าหรือไม่ แก้ไข: ตอนนี้ฉันมีความเข้าใจที่ดีขึ้นมากโดยการเห็นภาพตัวอย่างของการเดินสุ่มขนาดใหญ่และที่นี่เราสามารถสังเกตได้อย่างง่ายดายว่าความแปรปรวนโดยรวมเพิ่มขึ้นเมื่อเวลาผ่านไป และค่าเฉลี่ยก็ประมาณตามคาด บางทีนี่อาจเป็นเรื่องเล็กน้อยเนื่องจากในช่วงแรก ๆ …

1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

5
อนุกรมเวลาเหมือนกับกระบวนการสุ่มหรือไม่
กระบวนการสุ่มเป็นกระบวนการที่วิวัฒนาการไปตามกาลเวลาดังนั้นมันจึงเป็นวิธีที่ดีกว่าในการพูดว่า "อนุกรมเวลา" หรือไม่?

2
ทำไมการเดินแบบสุ่มมีความสัมพันธ์กัน?
ฉันสังเกตว่าโดยเฉลี่ยแล้วค่าสัมประสิทธิ์สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันนั้นใกล้เคียงกับการเดินสุ่มคู่ใด ๆ โดยไม่คำนึงถึงความยาวการเดิน0.560.42 มีคนอธิบายปรากฏการณ์นี้ได้ไหม ฉันคาดว่าความสัมพันธ์จะเล็กลงเมื่อความยาวเดินเพิ่มขึ้นเช่นเดียวกับการสุ่มลำดับ สำหรับการทดลองของฉันฉันใช้การสุ่ม gaussian walk พร้อม step เฉลี่ย 0 และเบี่ยงเบนมาตรฐาน step 1 UPDATE: ฉันลืมไปยังศูนย์ข้อมูลที่ว่าทำไมมันเป็นแทน0.560.42 นี่คือสคริปต์ Python เพื่อคำนวณสหสัมพันธ์: import numpy as np from itertools import combinations, accumulate import random def compute(length, count, seed, center=True): random.seed(seed) basis = [] for _i in range(count): walk = np.array(list(accumulate( random.gauss(0, 1) for …

2
อะไรคือค่า p, d, q, ใน ARIMA?
ในarimaฟังก์ชันใน R order(1, 0, 12)หมายถึงอะไร อะไรคือค่าที่สามารถกำหนดให้p, d, qและสิ่งที่เป็นกระบวนการในการหาค่าเหล่านั้นหรือไม่
27 r  time-series  arima 

2
แนวโน้ม STL ของอนุกรมเวลาโดยใช้ R
ฉันยังใหม่กับ R และการวิเคราะห์อนุกรมเวลา ฉันพยายามค้นหาแนวโน้มของอนุกรมเวลาอุณหภูมิรายวัน (40 ปี) ที่ยาวนานและพยายามประมาณที่แตกต่างกัน อันแรกเป็นเพียงการถดถอยเชิงเส้นอย่างง่ายและอันที่สองคือการสลายตัวตามฤดูกาลของอนุกรมเวลาโดย Loess ในระยะหลังปรากฏว่าองค์ประกอบตามฤดูกาลมากกว่าแนวโน้ม แต่ฉันจะหาแนวโน้มได้อย่างไร ฉันต้องการตัวเลขที่บอกว่าแนวโน้มนั้นแข็งแกร่งเพียงใด Call: stl(x = tsdata, s.window = "periodic") Time.series components: seasonal trend remainder Min. :-8.482470191 Min. :20.76670 Min. :-11.863290365 1st Qu.:-5.799037090 1st Qu.:22.17939 1st Qu.: -1.661246674 Median :-0.756729578 Median :22.56694 Median : 0.026579468 Mean :-0.005442784 Mean :22.53063 Mean : …
27 r  time-series  trend 

4
อะไรคือความแตกต่างระหว่างการทดสอบแบบคงที่และการทดสอบรูทยูนิต
อะไรคือความแตกต่างระหว่างการทดสอบ Kwiatkowski – Phillips – Schmidt – Shin (KPSS) และการทดสอบเพิ่ม Dickey-Fuller (ADF) พวกเขากำลังทดสอบสิ่งเดียวกันหรือไม่? หรือเราจำเป็นต้องใช้มันในสถานการณ์ต่าง ๆ ?

6
การประมาณแบบเดียวกันกับอนุกรมเวลาหลายชุด
ฉันมีพื้นฐานสามเณรในอนุกรมเวลา (ประมาณ ARIMA / การคาดการณ์ / การคาดการณ์) และฉันกำลังประสบปัญหาที่ฉันไม่เข้าใจ ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมอย่างมาก. ฉันกำลังวิเคราะห์อนุกรมเวลาหลายช่วงเวลาในช่วงเวลาเดียวกันและความถี่เดียวกันทั้งหมดอธิบายถึงประเภทของข้อมูลที่คล้ายกัน แต่ละชุดเป็นเพียงตัวแปรเดียวไม่มีตัวทำนายอื่นที่เกี่ยวข้องที่ฉันดู ฉันถูกขอให้ประเมินแบบจำลองเดียวที่อธิบายชุดทั้งหมด - ตัวอย่างเช่นลองนึกภาพฉันสามารถหา ARIMA (p, d, q) หนึ่งชุดที่มีคำสั่งสัมประสิทธิ์และอื่น ๆ ที่เหมือนกันทุกชุด หัวหน้างานของฉันไม่ต้องการให้ฉันประเมินแต่ละชุดแยกกันและเขาไม่ต้องการให้ฉันทำแบบจำลอง VAR บางประเภทที่มีการพึ่งพาระหว่างชุด คำถามของฉันคืออะไรฉันจะเรียกรูปแบบดังกล่าวและฉันจะไปเกี่ยวกับการประเมิน / การคาดการณ์มันได้อย่างไร หากคุณใช้ตัวอย่างโค้ดได้ง่ายขึ้นฉันจะพูดทั้ง SAS และ R

1
วิธีการทำความเข้าใจ SARIMAX อย่างสังหรณ์ใจ?
ฉันพยายามที่จะเข้าใจกระดาษเกี่ยวกับการพยากรณ์โหลดไฟฟ้า แต่ฉันกำลังดิ้นรนกับแนวคิดที่อยู่ภายในโดยเฉพาะแบบจำลองSARIMAX แบบจำลองนี้ใช้ในการทำนายการโหลดและใช้แนวคิดทางสถิติมากมายที่ฉันไม่เข้าใจ (ฉันเป็นนักศึกษาวิทยาศาสตร์คอมพิวเตอร์ระดับปริญญาตรี - คุณสามารถพิจารณาฉันเป็นคนธรรมดาในสถิติ) ฉันไม่จำเป็นต้องเข้าใจอย่างสมบูรณ์ถึงวิธีการทำงาน แต่อย่างน้อยฉันก็ต้องเข้าใจอย่างถ่องแท้ว่าเกิดอะไรขึ้น ฉันพยายามแยก SARIMAX ออกเป็นชิ้นเล็ก ๆ และพยายามที่จะเข้าใจแต่ละชิ้นแยกกันแล้วรวมเข้าด้วยกัน พวกคุณช่วยฉันได้ไหม นี่คือสิ่งที่ฉันมี ฉันเริ่มต้นด้วย AR และ MA AR : อัตถดถอย ฉันได้เรียนรู้ว่าการถดถอยคืออะไรและจากความเข้าใจของฉันเพียงแค่ตอบคำถาม: จากชุดของค่า / คะแนนฉันจะหาแบบจำลองที่อธิบายค่าเหล่านี้ได้อย่างไร ตัวอย่างเช่นเรามีการถดถอยเชิงเส้นซึ่งพยายามหาเส้นที่สามารถอธิบายประเด็นเหล่านี้ทั้งหมด การตอบโต้อัตโนมัติคือการถดถอยที่พยายามอธิบายค่าโดยใช้ค่าก่อนหน้า MA : ค่าเฉลี่ยเคลื่อนที่ ที่นี่ฉันหลงทางจริงๆ ฉันรู้ว่าค่าเฉลี่ยเคลื่อนที่คืออะไร แต่โมเดลค่าเฉลี่ยเคลื่อนที่ดูเหมือนจะไม่มีส่วนเกี่ยวข้องกับค่าเฉลี่ยเคลื่อนที่ "ปกติ" สูตรของแบบจำลองนั้นดูคล้ายกับ AR อย่างเชื่องช้าและฉันไม่สามารถเข้าใจแนวคิดใด ๆ ที่ฉันพบในอินเทอร์เน็ต วัตถุประสงค์ของ MA คืออะไร? MA และ AR แตกต่างกันอย่างไร? ดังนั้นตอนนี้เรามี ARMA ผมแล้วมาจากแบบบูรณาการซึ่งเท่าที่ผมมีความเข้าใจเพียงแค่จุดมุ่งหมายของการช่วยให้รูปแบบ …

4
เมื่อใดที่จะเข้าสู่การแปลงอนุกรมเวลาก่อนที่จะติดตั้งแบบจำลอง ARIMA
ก่อนหน้านี้ฉันเคยใช้โปรแกรมพยากรณ์อากาศเพื่อคาดการณ์อนุกรมเวลาที่ไม่เปลี่ยนแปลง แต่ฉันเปลี่ยนเวิร์กโฟลว์ของฉันไปเป็น R แพ็คเกจพยากรณ์สำหรับ R มีฟังก์ชั่นที่มีประโยชน์มากมาย แต่สิ่งหนึ่งที่มันไม่ได้ทำคือการแปลงข้อมูลชนิดใด ๆ .arima () ในบางกรณีการคาดการณ์โปรตัดสินใจที่จะเข้าสู่ระบบการแปลงข้อมูลก่อนที่จะทำการคาดการณ์ แต่ฉันยังไม่ได้หาสาเหตุ ดังนั้นคำถามของฉันคือ: เมื่อใดที่ฉันควรเปลี่ยนชุดเวลาของฉันก่อนที่จะลองใช้วิธี ARIMA กับมัน / แก้ไข: หลังจากอ่านคำตอบของคุณฉันจะใช้สิ่งนี้โดยที่ x คืออนุกรมเวลาของฉัน: library(lmtest) if ((gqtest(x~1)$p.value < 0.10) { x<-log(x) } มันสมเหตุสมผลหรือไม่

3
วิธีการวัดความเรียบของอนุกรมเวลาใน R?
มีวิธีที่ดีในการวัดความเรียบของอนุกรมเวลาใน R หรือไม่? ตัวอย่างเช่น, -1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0 ราบรื่นกว่า -1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0 แม้ว่าจะมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเดียวกัน มันจะเจ๋งถ้ามีฟังก์ชั่นที่จะให้คะแนนที่ราบรื่นกับฉันในช่วงเวลา
25 r  time-series 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.