คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

2
ประเมินค่าสูงสุดของอนุกรมเวลาของข้อมูลสัญญาณมือถือ
ฉันกำลังวัดการมีอยู่ของการตอบสนองในการวัดสัญญาณของเซลล์ สิ่งที่ฉันทำคือการใช้อัลกอริทึมที่ปรับให้เรียบ (Hanning) กับอนุกรมเวลาของข้อมูลจากนั้นตรวจจับจุดสูงสุด สิ่งที่ฉันได้คือ: ถ้าฉันต้องการให้การตรวจจับการตอบสนองมีวัตถุประสงค์มากกว่า "คุณเห็นการลดลงอย่างต่อเนื่อง" อะไรคือวิธีที่ดีที่สุด มันคือการหาระยะทางของยอดเขาจากพื้นฐานที่กำหนดโดยการถดถอยเชิงเส้นหรือไม่? (ฉันเป็นงูใหญ่และไม่มีความเข้าใจในสถิติ) ขอบคุณ

2
วิธีการค้นหาเมื่อกราฟถึงจุดสูงสุดและที่ราบสูง?
นี่อาจฟังดูธรรมดามาก แต่ฉันมีปัญหานี้: ฉันมีคิวของข้อมูลที่มีขนาดหน้าต่าง 300 ข้อมูลใหม่ถูกเพิ่มที่ปลายด้านหนึ่งค่าเก่าจะถูกลบออกจากปลายอีกด้าน ฉันคาดว่าข้อมูลคิวจะคงที่หรือมากกว่านั้นเช่น 10,12,15,10,20 จากนั้นเริ่มเพิ่มขึ้นอย่างรวดเร็ว: 15,10,20,22,25,26,28,30,32 ... ไปจนถึง 150 หรือมากกว่านั้น ข้อมูลอาจมีความผันผวนเล็กน้อยจากนั้นจะลงไปตามความลาดชันที่คล้ายกัน (120,118,116,115 ... ) ไปจนถึง 20 หรือมากกว่านั้น ฉันพยายามระบุจุดเปลี่ยนในชุดข้อมูลนี้โดยทางโปรแกรม แต่โค้ดของฉันตรวจพบจุดสูงสุดบ่อยกว่าที่ฉันต้องการ ฉันจะระบุได้อย่างไรเมื่อกราฟเพิ่มขึ้นเมื่อมาถึงจุดเปลี่ยนที่แน่นอนและเมื่อมันเริ่มลดลง ฉันควรลองดูที่อัตราการเปลี่ยนแปลงของอัตราการเปลี่ยนแปลงหรือไม่

3
อัลกอริทึมที่ดีที่สุดสำหรับการจำแนกข้อมูลมอเตอร์อนุกรมเวลา
ฉันกำลังทำงานในโครงการควบคุมเครื่อง เราสามารถวัดกระแสของมอเตอร์ในระหว่างการใช้งาน ข้อมูลตัวอย่างจากมอเตอร์สองตัวที่ทำงานได้สำเร็จอยู่ด้านล่าง ร่องรอยสีแดงแสดงกระแสไฟฟ้าจากมอเตอร์หนึ่งอันและสีน้ำเงินจะติดตามกระแสไฟฟ้าจากมอเตอร์อื่น ฉันต้องการลองใช้อัลกอริทึมในการระบุปัญหาเกี่ยวกับพฤติกรรมของเครื่อง ปัญหาอาจเกิดจากมอเตอร์กระแสไฟฟ้าสูงเกินไปใกล้กับศูนย์มอเตอร์กระแสไฟฟ้ากระแสที่เพิ่มขึ้นเมื่อสิ้นสุดการทำงานอนุกรมเวลาที่สั้นกว่าปกติสิ่งใดก็ตามที่ไม่เหมือนการทำงานทั่วไปด้านล่าง ใครช่วยแนะนำอัลกอริทึมที่ดีสำหรับการบรรลุนี้ สิ่งเดียวที่ฉันคุ้นเคยคือเครือข่ายประสาท ฉันใส่ไฟล์ Excel ของข้อมูลจริงที่มอเตอร์กระแส

1
การใส่ข้อมูลหลายครั้งสำหรับข้อมูลการนับที่ขาดหายไปในอนุกรมเวลาจากการศึกษาแบบพาเนล
ฉันกำลังพยายามที่จะจัดการกับปัญหาที่เกี่ยวข้องกับการใส่ข้อมูลที่หายไปจากการศึกษาข้อมูลแบบพาเนล (ไม่แน่ใจว่าฉันกำลังใช้ 'การศึกษาข้อมูลแบบพาเนล' อย่างถูกต้อง - อย่างที่ฉันได้เรียนรู้ในวันนี้) ถึงปี 2009 ตลอดทั้งเดือนชายและหญิงสำหรับ 8 อำเภอที่แตกต่างกันและสำหรับกลุ่มอายุ 4 ขวบ ชื่อไฟล์มีลักษณะดังนี้: District Gender Year Month AgeGroup TotalDeaths Northern Male 2006 11 01-4 0 Northern Male 2006 11 05-14 1 Northern Male 2006 11 15+ 83 Northern Male 2006 12 0 3 Northern Male 2006 12 01-4 0 …

6
การทดสอบความเสถียรในอนุกรมเวลา
มีวิธีมาตรฐาน (หรือดีที่สุด) สำหรับการทดสอบเมื่ออนุกรมเวลาที่กำหนดมีความเสถียรหรือไม่? แรงจูงใจบางอย่าง ฉันมีระบบแบบไดนามิกสุ่มที่ผลค่าในแต่ละขั้นตอนเวลา{N} ระบบนี้มีพฤติกรรมชั่วคราวจนกว่าจะถึงขั้นตอนแล้วทำให้ค่าเฉลี่ยโดยมีข้อผิดพลาด ฉันไม่ทราบว่าเป็น ,หรือข้อผิดพลาดใด ๆ ฉันยินดีที่จะตั้งสมมติฐาน (เช่นข้อผิดพลาดแบบเกาส์รอบxเสื้อxเสื้อx_tt ∈ Nเสื้อ∈ยังไม่มีข้อความt \in \mathbb{N}เสื้อ* * * *เสื้อ* * * *t^*x* * * *x* * * *x^*เสื้อ* * * *เสื้อ* * * *t^*x* * * *x* * * *x^*x* * * *x* * * *x^*ตัวอย่างเช่น) แต่หากฉันต้องการสมมติฐานที่น้อยกว่าก็ยิ่งดี สิ่งเดียวที่ฉันรู้แน่นอนคือมีเพียงจุดเดียวที่ระบบเข้าหากันและความผันผวนรอบจุดคงที่นั้นเล็กกว่าความผันผวนในช่วงเวลาชั่วคราว กระบวนการนี้เป็นแบบ monotonic-ish ด้วยฉันสามารถสันนิษฐานได้ว่าเริ่มต้นใกล้และปีนขึ้นไปทาง …

5
การกำหนดเกณฑ์อัตโนมัติสำหรับการตรวจจับความผิดปกติ
ฉันกำลังทำงานกับอนุกรมเวลาของคะแนนความผิดปกติ (พื้นหลังคือการตรวจจับความผิดปกติในเครือข่ายคอมพิวเตอร์) ทุกนาทีฉันได้รับคะแนนความผิดปกติซึ่งบอกฉันว่า "ไม่คาดฝัน" หรือผิดปกติสถานะปัจจุบันของเครือข่ายคืออะไร ยิ่งคะแนนสูงเท่าไรสถานะปัจจุบันก็ยิ่งผิดปกติมากเท่านั้น คะแนนที่ใกล้เคียงกับ 5 เป็นไปได้ในทางทฤษฎี แต่เกิดขึ้นแทบจะไม่เคยเกิดขึ้นเลยxเสื้อ∈ [ 0 , 5 ]xเสื้อ∈[0,5]x_t \in [0, 5] ตอนนี้ฉันต้องการอัลกอริธึมหรือสูตรที่กำหนดเกณฑ์โดยอัตโนมัติสำหรับอนุกรมเวลาผิดปกตินี้ ทันทีที่คะแนนผิดปกติเกินเกณฑ์นี้สัญญาณเตือนจะเริ่มทำงาน การแจกแจงความถี่ด้านล่างเป็นตัวอย่างสำหรับอนุกรมเวลาที่ผิดปกติมากกว่า 1 วัน อย่างไรก็ตามมันไม่ปลอดภัยที่จะสมมติว่าซีรีย์ความผิดปกติทุกครั้งจะมีลักษณะเช่นนั้น ในตัวอย่างพิเศษนี้เกณฑ์ความผิดปกติเช่น. 99-quantile จะเข้าท่าเนื่องจากคะแนนไม่กี่อันทางขวามากถือได้ว่าเป็นความผิดปกติ และการแจกแจงความถี่เดียวกันกับอนุกรมเวลา (ช่วงนั้นมีค่าตั้งแต่ 0 ถึง 1 เนื่องจากไม่มีคะแนนความผิดปกติสูงกว่าในอนุกรมเวลา): แต่น่าเสียดายที่การแจกแจงความถี่อาจมีรูปร่างที่ .99-quantile คือไม่ได้มีประโยชน์ ตัวอย่างด้านล่าง หางขวาอยู่ในระดับต่ำมากดังนั้นหากใช้. 99-quantile เป็นจุดเริ่มต้นสิ่งนี้อาจส่งผลให้เกิดผลบวกปลอมหลายอย่าง การแจกแจงความถี่นี้ดูเหมือนจะไม่มีความผิดปกติดังนั้นเกณฑ์ควรอยู่นอกการกระจายที่ประมาณ 0.25 สรุปแล้วความแตกต่างระหว่างสองตัวอย่างนี้คือตัวอย่างแรกดูเหมือนว่าจะมีความผิดปกติในขณะที่อีกอันหนึ่งไม่มี จากมุมมองที่ไร้เดียงสาของฉันอัลกอริทึมควรพิจารณาสองกรณีนี้: หากการแจกแจงความถี่มีหางขวาขนาดใหญ่ (เช่นคะแนนผิดปกติสองเท่า) ดังนั้น. 99-quantile อาจเป็นเกณฑ์ที่ดี หากการแจกแจงความถี่มีหางขวาสั้นมาก …

4
วิธีการทดสอบไคสแควร์หลังการทดสอบหลายตารางในตาราง 2 X 3
ชุดข้อมูลของฉันประกอบด้วยการเสียชีวิตโดยรวมหรือการอยู่รอดของสิ่งมีชีวิตที่ไซต์สามประเภททั้งฝั่งกลางและกลาง ตัวเลขในตารางด้านล่างแสดงถึงจำนวนเว็บไซต์ 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 ฉันต้องการทราบว่า # ของเว็บไซต์ที่มีอัตราการตาย 100% มีความสำคัญตามประเภทของไซต์หรือไม่ ถ้าฉันใช้ไคสแควร์ 2 x 3 ฉันจะได้ผลลัพธ์ที่สำคัญ มีการเปรียบเทียบแบบคู่หลังที่ฉันสามารถเรียกใช้หรือฉันควรใช้ ANOVA จิสติกส์หรือการถดถอยด้วยการแจกแจงแบบทวินามหรือไม่ ขอบคุณ!

6
ชื่อสามัญที่ดีสำหรับแผนภูมิของสิ่งต่าง ๆ ตามเวลาของวันคืออะไร
เรากำลังสร้างแผนภูมิที่แสดงปริมาณการใช้งานตามช่วงเวลาของวันในช่วงเวลาที่กำหนด ดังนั้นแกน y คือการรับส่งข้อมูล, แกน x คือเที่ยงคืน, 1am, 2am, และมันอาจเป็นวันในสัปดาห์ ชื่อสามัญของแผนภูมิประเภทนี้คืออะไร? ฉันมากับ "แผนภูมิวงกลม" เป็นมาตรฐานหรือไม่ มีไหม ปรับปรุง: เพียงเพิ่มความชัดเจนมากขึ้นสิ่งที่แสดงในแผนภูมิบนสุดไม่ใช่วันเดียวเป็นการรวมหลายวัน เช่นเมื่อเดือนที่แล้วมีค่าเฉลี่ย 6 โมงเช้าต่ำกว่าเที่ยง ในทำนองเดียวกันในแผนภูมิด้านล่างในปีที่ผ่านมาการจราจรลดลงในวันเสาร์


1
การแก้ปัญหาชั่วคราวสำหรับการทดสอบนัยสำคัญของอนุกรมเวลาคืออะไร?
ฉันต้องการคำแนะนำบางอย่างเกี่ยวกับระดับที่เหมาะสมของการรวมกำไรเพื่อใช้สำหรับความแตกต่างของวิธีการทดสอบกับข้อมูลอนุกรมเวลา ฉันเป็นห่วงเกี่ยวกับการจำลองแบบทางโลกและแบบบูชายัญซึ่งดูเหมือนจะตึงเครียดในแอปพลิเคชันนี้ นี่คือการอ้างอิงถึงการศึกษาเกี่ยวกับบุรุษมากกว่าการทดลองบิดเบือน พิจารณาแบบฝึกหัดการติดตาม : ระบบเซ็นเซอร์ตรวจวัดปริมาณออกซิเจนละลาย (DO) ในหลาย ๆ สถานที่ทั่วทั้งความกว้างและความลึกของบ่อ การวัดสำหรับเซ็นเซอร์แต่ละตัวจะถูกบันทึกวันละสองครั้งเนื่องจาก DO รู้จักกันในแต่ละวัน ค่าสองค่าจะถูกเฉลี่ยเพื่อบันทึกค่ารายวัน สัปดาห์ละครั้งผลลัพธ์รายวันจะถูกรวมเข้าด้วยกันเพื่อมาถึงระดับความเข้มข้นของ DO ในแต่ละสัปดาห์สำหรับบ่อทั้งหมด ผลลัพธ์รายสัปดาห์เหล่านั้นจะถูกรายงานเป็นระยะและรวมต่อไป - ผลลัพธ์รายสัปดาห์จะถูกเฉลี่ยเพื่อให้ความเข้มข้น DO รายเดือนสำหรับบ่อ ผลลัพธ์รายเดือนถูกเฉลี่ยเพื่อให้ค่ารายปี ค่าเฉลี่ยรายปีจะเฉลี่ยตัวเองเพื่อรายงานความเข้มข้น DO ที่ลดลงสำหรับบ่อ เป้าหมายคือเพื่อตอบคำถามเช่น: ความเข้มข้นของ DO ในสระน้ำในปี X สูงกว่า, ต่ำกว่าหรือเท่ากับความเข้มข้นในปี Y หรือไม่ ความเข้มข้นของ DO เฉลี่ยในช่วงสิบปีที่ผ่านมานั้นแตกต่างจากทศวรรษที่ผ่านมาหรือไม่? ความเข้มข้นของ DO ในบ่อตอบสนองต่ออินพุตที่มีขนาดใหญ่จำนวนมากและแตกต่างกันมาก จำเป็นต้องมีการทดสอบที่สำคัญ วิธีการคือการใช้การเปรียบเทียบการทดสอบ T- วิธีการ ระบุว่าค่าของ decadal เป็นค่าเฉลี่ยของค่าประจำปีและค่ารายปีเป็นค่าเฉลี่ยของค่ารายเดือนสิ่งนี้ดูเหมือนจะเหมาะสม นี่คือคำถาม - …

2
การเรียนรู้ที่เพิ่มขึ้นสำหรับโมเดลอนุกรมเวลา LOESS
ขณะนี้ฉันกำลังทำงานกับข้อมูลอนุกรมเวลาฉันรู้ว่าฉันสามารถใช้แบบจำลอง LOESS / ARIMA ข้อมูลถูกเขียนไปยังเวกเตอร์ที่มีความยาว 1,000 ซึ่งเป็นคิวการอัพเดททุก 15 นาที ดังนั้นข้อมูลเก่าจะโผล่ออกมาในขณะที่ข้อมูลใหม่พุชในเวกเตอร์ ฉันสามารถรันโมเดลทั้งหมดบนตัวกำหนดตารางเวลาอีกครั้งเช่นฝึกอบรมใหม่ทุก ๆ 15 นาทีนั่นคือใช้ค่าทั้งหมด 1,000 เพื่อฝึกแบบจำลอง LOESS อย่างไรก็ตามมันไม่มีประสิทธิภาพมากเพราะทุกครั้งที่ใส่ค่าเพียงหนึ่งในขณะที่อีก 999 vlaues ยังคงเหมือนเดิม ดังนั้นฉันจะบรรลุประสิทธิภาพที่ดีขึ้นได้อย่างไร ขอบคุณมาก

3
วิธีการสุ่มตัวอย่างอนุกรมเวลา XTS ใน R ได้อย่างไร
ฉันมีXTSอนุกรมเวลาที่เว้นระยะผิดปกติ(มีPOSIXctค่าเป็นประเภทดัชนี) ฉันจะสร้างซีรีย์เวลาใหม่ที่สุ่มตัวอย่างในช่วงเวลา 10 นาทีได้อย่างไร แต่แต่ละช่วงเวลาตัวอย่างจะถูกจัดให้สอดคล้องกับรอบเวลา (13:00:00, 13:10:00, 13:20:00, ... ) . หากช่วงเวลาการสุ่มตัวอย่างไม่ตรงกับค่าซีรี่ส์ดั้งเดิมฉันต้องการใช้ช่วงเวลาก่อนหน้า

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

3
วิธีการพยากรณ์สำหรับอนุกรมเวลา
ฉันไม่คุ้นเคยกับการวิเคราะห์ข้อมูลอนุกรมเวลา อย่างไรก็ตามฉันมีสิ่งที่ฉันคิดว่าเป็นงานทำนายง่าย ๆ ที่อยู่ ฉันมีข้อมูลประมาณห้าปีจากกระบวนการสร้างทั่วไป ในแต่ละปีแสดงถึงฟังก์ชั่นที่เพิ่มขึ้นแบบ monotonically โดยมีองค์ประกอบที่ไม่ใช่เชิงเส้น ฉันนับในแต่ละสัปดาห์ในรอบ 40 สัปดาห์ในแต่ละปี กระบวนการเริ่มต้นฟังก์ชั่นเริ่มต้นที่ศูนย์เพิ่มขึ้นอย่างรวดเร็วในช่วงครึ่งแรกของฟังก์ชั่นชะลอตัวในช่วงครึ่งหลังก่อนที่จะปรับระดับในช่วงห้าสัปดาห์ที่ผ่านมา กระบวนการนี้มีความสอดคล้องกันตลอดหลายปีที่ผ่านมาซึ่งมีความแตกต่างกันเล็กน้อยในเรื่องอัตราการเปลี่ยนแปลงและปริมาณของเซ็กเมนต์ต่าง ๆ ในแต่ละปี y1={0,Nt1,Nt2,...Nt39,Nt40}y1={0,Nt1,Nt2,...Nt39,Nt40} y_{1}=\{0, N_{t1}, N_{t2}, ... N_{t39}, N_{t40}\} ⋮⋮ \vdots y5={0,Nt1,Nt2,...Nt39,Nt40}y5={0,Nt1,Nt2,...Nt39,Nt40} y_{5}=\{0, N_{t1}, N_{t2}, ... N_{t39}, N_{t40}\} โดยที่เท่ากับจำนวน ณ เวลา xNtxNtxN_{tx} เป้าหมายคือการใช้ที่ (หรือดีกว่าเพื่อหรือลาดไปยังจุดนั้น) และคาดการณ์ที่t40ตัวอย่างเช่นถ้าคือ 5,000 ค่าที่คาดหวังของคืออะไรในปีนั้น ดังนั้นคำถามคือคุณจะสร้างแบบจำลองข้อมูลดังกล่าวอย่างไร ง่ายพอที่จะสรุปและมองเห็นได้ แต่ฉันต้องการแบบจำลองเพื่ออำนวยความสะดวกในการทำนายและรวมการวัดข้อผิดพลาดNNNtxtxtxt0t0t0txtxtxNNNt40t40t40Nt10Nt10N_{t10}Nt40Nt40N_{t40}

7
ความสัมพันธ์ระหว่างตัวแปรสองตัวที่มีขนาดไม่เท่ากัน
ในปัญหาที่ฉันกำลังทำงานอยู่ฉันมีตัวแปรสุ่มสองตัวคือ X และ Y ฉันต้องหาว่าพวกเขาสองคนมีความสัมพันธ์กันอย่างไร แต่พวกมันมีมิติที่แตกต่างกัน อันดับของพื้นที่แถวของ X คือ 4350 และอันดับของพื้นที่แถวของ Y นั้นใหญ่ขึ้นอย่างมากในหลักหมื่น ทั้ง X และ Y มีจำนวนคอลัมน์เท่ากัน ฉันต้องการตัวชี้วัดความสัมพันธ์ระหว่างตัวแปรทั้งสองและ r ของ Pearson ต้องการ X และ Y เพื่อให้มีมิติที่เท่ากัน (อย่างน้อย R ต้องให้ rv สองตัวเป็น) ฉันมีความหวังในการสร้างความสัมพันธ์ระหว่างสองสิ่งนี้หรือไม่หรือฉันควรหาวิธีตัดการสังเกตจาก Y หรือไม่? EDIT การเพิ่มข้อมูลจากความคิดเห็นซึ่งควรอยู่ในคำถาม ฉันคิดว่าฉันลืมที่จะพูดถึงเรื่องนี้ X และ Y คือราคาหุ้น บริษัท X เปิดตัวต่อสาธารณชนในช่วงเวลาที่สั้นกว่า Y ฉันอยากจะบอกว่าราคาของ X และ Y …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.