คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ในช่วงเวลาหนึ่ง (ไม่ว่าจะเป็นเวลาต่อเนื่องหรือในช่วงเวลาที่ไม่ต่อเนื่อง)

1
ฉันควรใช้เซลล์ LSTM กี่เซลล์
มีกฎของหัวแม่มือ (หรือกฎจริง) ที่เกี่ยวข้องกับจำนวน LSTM ขั้นต่ำ, สูงสุดและ "สมเหตุสมผล" ที่ฉันควรใช้หรือไม่? โดยเฉพาะฉันเกี่ยวข้องกับBasicLSTMCellจาก TensorFlow และnum_unitsคุณสมบัติ โปรดสมมติว่าฉันมีปัญหาการจำแนกที่กำหนดโดย: t - number of time steps n - length of input vector in each time step m - length of output vector (number of classes) i - number of training examples ตัวอย่างจริงหรือไม่ที่จำนวนตัวอย่างการฝึกอบรมควรมากกว่า: 4*((n+1)*m + m*m)*c ที่cเป็นจำนวนของเซลล์? ฉันใช้สิ่งนี้: จะคำนวณจำนวนพารามิเตอร์ของเครือข่าย …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

3
มีรูปแบบภาษาที่ดีนอกกรอบสำหรับงูใหญ่หรือไม่?
ฉันกำลังสร้างต้นแบบแอปพลิเคชันและฉันต้องการโมเดลภาษาเพื่อคำนวณความงุนงงในประโยคที่สร้างขึ้น มีรูปแบบภาษาที่ผ่านการฝึกอบรมในภาษาไพ ธ อนที่ฉันสามารถใช้ได้หรือไม่? บางสิ่งที่เรียบง่ายเช่น model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 ฉันดูบางกรอบ แต่ไม่สามารถค้นหาสิ่งที่ฉันต้องการ ฉันรู้ว่าฉันสามารถใช้สิ่งที่ชอบ: from nltk.model.ngram import NgramModel lm = NgramModel(3, brown.words(categories='news')) สิ่งนี้ใช้การแจกแจงความน่าจะเป็นที่ดีใน Brown Corpus แต่ฉันกำลังมองหาโมเดลที่สร้างขึ้นอย่างดีในชุดข้อมูลขนาดใหญ่เช่นชุดข้อมูลคำ 1b สิ่งที่ฉันสามารถเชื่อถือได้จริง ๆ ผลลัพธ์สำหรับโดเมนทั่วไป (ไม่เพียงข่าว)
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

5
จะรวมข้อมูลรายเดือนรายวันและรายสัปดาห์ได้อย่างไร
Google Trends ส่งคืนข้อมูลรายสัปดาห์ดังนั้นฉันต้องหาวิธีที่จะรวมเข้ากับข้อมูลรายวัน / รายเดือนของฉัน สิ่งที่ฉันทำไปแล้วคือการแบ่งเซเรียแต่ละเป็นข้อมูลรายวันสำหรับตัวอย่าง: จาก: 2013-03-03 - 2013-03-09 37 ถึง: 2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37 แต่นี่เป็นการเพิ่มความซับซ้อนให้กับปัญหาของฉัน ฉันพยายามคาดคะเนการค้นหา google จากค่า 6 เดือนล่าสุดหรือ 6 ค่าในข้อมูลรายเดือน ข้อมูลรายวันจะบ่งบอกถึงการทำงานใน 180 ค่าที่ผ่านมา (ฉันมีข้อมูล 10 ปีดังนั้น 120 คะแนนในข้อมูลรายเดือน / 500+ ในข้อมูลรายสัปดาห์ / 3,500+ ในข้อมูลรายวัน) อีกวิธีหนึ่งก็คือ "ผสาน" …

4
เทคนิคการแยกคุณสมบัติ - สรุปลำดับของข้อมูล
ฉันมักจะสร้างแบบจำลอง (การจำแนกประเภทหรือการถดถอย) ที่ฉันมีตัวแปรตัวทำนายบางอย่างที่เป็นลำดับและฉันพยายามค้นหาคำแนะนำทางเทคนิคสำหรับการสรุปพวกเขาด้วยวิธีที่ดีที่สุดเท่าที่จะทำได้เพื่อรวมไว้เป็นตัวทำนายในแบบจำลอง ตัวอย่างที่เป็นรูปธรรมสมมติว่ามีการสร้างแบบจำลองเพื่อคาดการณ์ว่าลูกค้าจะออกจาก บริษัท ในอีก 90 วันข้างหน้า (ทุกเวลาระหว่าง t ถึง t + 90 ซึ่งเป็นผลลัพธ์ไบนารี) หนึ่งในตัวทำนายที่มีคือระดับของยอดคงเหลือทางการเงินของลูกค้าสำหรับช่วงเวลา t_0 ถึง t-1 บางทีนี่อาจหมายถึงการสังเกตรายเดือนสำหรับ 12 เดือนก่อนหน้า (เช่น 12 การวัด) ฉันกำลังมองหาวิธีสร้างคุณสมบัติจากซีรี่ส์นี้ ฉันใช้คำอธิบายของชุดลูกค้าแต่ละชุดเช่นค่าเฉลี่ยสูงต่ำ std dev. พอดีกับการถดถอย OLS เพื่อรับแนวโน้ม มีวิธีอื่นในการคำนวณคุณสมบัติหรือไม่ มาตรการอื่น ๆ ของการเปลี่ยนแปลงหรือความผันผวน? เพิ่ม: ดังที่ได้กล่าวไว้ในการตอบกลับด้านล่างฉันยังพิจารณา (แต่ลืมที่จะเพิ่มที่นี่) โดยใช้ Dynamic Time Warping (DTW) และการจัดกลุ่มตามลำดับชั้นบนเมทริกซ์ระยะทางที่ได้ - สร้างกลุ่มจำนวนหนึ่งแล้วใช้กลุ่มสมาชิกเป็นคุณลักษณะ การให้คะแนนข้อมูลการทดสอบน่าจะเป็นไปตามกระบวนการที่ทำ DTW ในกรณีใหม่และกลุ่ม …

3
ภาษาที่ดีที่สุดสำหรับการคำนวณทางวิทยาศาสตร์ [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน5 ปีที่ผ่านมา ดูเหมือนว่าภาษาส่วนใหญ่จะมีห้องสมุดคำนวณทางวิทยาศาสตร์จำนวนหนึ่ง Python มี Scipy Rust มี SciRust C++มีหลายอย่างรวมถึงViennaCLและArmadillo JavaมีJava NumericsและColtเช่นเดียวกับหลาย ๆ ไม่ต้องพูดถึงภาษาที่ชอบRและJuliaออกแบบมาอย่างชัดเจนสำหรับการคำนวณทางวิทยาศาสตร์ ด้วยตัวเลือกมากมายคุณจะเลือกภาษาที่ดีที่สุดสำหรับงานอย่างไร นอกจากนี้ภาษาใดที่จะเป็นคนที่มีประสิทธิภาพมากที่สุด? PythonและRดูเหมือนว่าจะมีแรงฉุดที่สุดในอวกาศ แต่ภาษาที่รวบรวมได้ดูเหมือนจะเป็นทางเลือกที่ดีกว่า และจะมีอะไรดีกว่านี้Fortranไหม ภาษาที่คอมไพล์ด้วยนอกจากนี้มักจะมีการเร่งความเร็วของ GPU ในขณะที่ตีความภาษาเช่นRและPythonไม่ ฉันควรคำนึงถึงอะไรเมื่อเลือกภาษาและภาษาใดให้ความสมดุลของยูทิลิตี้และประสิทธิภาพที่ดีที่สุด มีภาษาใดบ้างที่มีทรัพยากรการคำนวณทางวิทยาศาสตร์ที่สำคัญที่ฉันพลาดไป
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

1
Keras LSTM พร้อมอนุกรมเวลา 1D
ฉันเรียนรู้วิธีการใช้ Keras และผมเคยประสบความสำเร็จที่เหมาะสมกับชุดที่มีป้ายกำกับของฉันโดยใช้ตัวอย่างใน Chollet ของการเรียนรู้ลึกหลาม ชุดข้อมูลคือ ~ 1000 Time Series ที่มีความยาว 3125 กับ 3 คลาสที่อาจเกิดขึ้น ฉันต้องการไปไกลกว่าเลเยอร์หนาแน่นพื้นฐานซึ่งให้อัตราการคาดคะเนประมาณ 70% และหนังสือเล่มนี้จะพูดถึงเลเยอร์ LSTM และ RNN ตัวอย่างทั้งหมดดูเหมือนจะใช้ชุดข้อมูลที่มีคุณสมบัติหลายอย่างสำหรับแต่ละชุดเวลาและฉันพยายามหาวิธีนำข้อมูลมาใช้ให้เกิดประโยชน์ ตัวอย่างเช่นฉันมี 1000x3125 Time Series ฉันจะป้อนสิ่งนั้นลงในเลเยอร์ SimpleRNN หรือ LSTM ได้อย่างไร ฉันขาดความรู้พื้นฐานเกี่ยวกับเลเยอร์เหล่านี้หรือไม่? รหัสปัจจุบัน: import pandas as pd import numpy as np import os from keras.models import Sequential from keras.layers import …

2
พยายามใช้ TensorFlow เพื่อทำนายข้อมูลอนุกรมเวลาทางการเงิน
ฉันใหม่สำหรับ ML และ TensorFlow (ฉันเริ่มประมาณสองสามชั่วโมงที่ผ่านมา) และฉันพยายามใช้เพื่อทำนายจุดข้อมูลสองสามอันถัดไปในอนุกรมเวลา ฉันรับข้อมูลของฉันและทำสิ่งนี้กับมัน: /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | '-------------------------------' \----------- y ------------/ สิ่งที่ฉันคิดว่าฉันกำลังทำคือการใช้xเป็นข้อมูลอินพุตและyเป็นผลลัพธ์ที่ต้องการสำหรับอินพุตนั้นเพื่อให้ 0-6 ฉันจะได้รับ 1-7 (โดยเฉพาะ 7) แต่เมื่อผมทำงานกราฟของฉันกับxเป็น input ในสิ่งที่ฉันได้รับคือการทำนายที่มีลักษณะเหมือนxกว่าปี นี่คือรหัส (ตามโพสต์นี้และโพสต์นี้ ): import tensorflow as tf import numpy …


4
จำแนกอนุกรมเวลาหลายตัวแปร
ฉันมีชุดข้อมูลที่ประกอบด้วยอนุกรมเวลา (8 คะแนน) ที่มีประมาณ 40 มิติ (ดังนั้นแต่ละชุดเวลาคือ 8 คูณ 40) ouput ที่สอดคล้องกัน (ผลลัพธ์ที่เป็นไปได้สำหรับหมวดหมู่) คือ eitheir 0 หรือ 1 อะไรจะเป็นวิธีที่ดีที่สุดในการออกแบบลักษณนามสำหรับอนุกรมเวลาที่มีหลายมิติ กลยุทธ์เริ่มต้นของฉันคือการดึงคุณสมบัติต่างๆจากอนุกรมเวลาเหล่านั้น: หมายถึงมาตรฐานรูปแบบสูงสุดสำหรับแต่ละมิติ ฉันได้รับชุดข้อมูลที่ฉันใช้ในการฝึกซ้อม RandomTreeForest การตระหนักถึงความไร้เดียงสาทั้งหมดของเรื่องนี้และหลังจากได้รับผลลัพธ์ที่ไม่ดีตอนนี้ฉันกำลังมองหาโมเดลที่ปรับปรุงมากขึ้น โอกาสในการขายของฉันมีดังนี้จัดหมวดหมู่ซีรีส์สำหรับแต่ละมิติ (โดยใช้อัลกอริธึม KNN และ DWT) ลดมิติด้วย PCA และใช้ลักษณนามสุดท้ายตามหมวดหมู่หลายมิติ การเป็น ML ค่อนข้างใหม่ฉันไม่รู้ว่าฉันผิดทั้งหมดหรือเปล่า
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.