คำถามติดแท็ก cross-correlation

การวัดความสัมพันธ์ระหว่างอนุกรมเวลาที่ต่างกันในเวลาเดียวกันหรือต่างกัน

8
หาก A และ B สัมพันธ์กับ C เหตุใด A และ B จึงไม่สัมพันธ์กัน?
ฉันรู้ด้วยสังเกตุว่าเป็นอย่างนั้น ฉันเพิ่งพัฒนาแบบจำลองที่ใช้กับปริศนานี้ ฉันยังสงสัยด้วยว่าไม่จำเป็นต้องตอบใช่หรือไม่ใช่ ฉันหมายความว่าถ้าทั้ง A และ B มีความสัมพันธ์กับ C นี่อาจมีความหมายบางอย่างเกี่ยวกับความสัมพันธ์ระหว่าง A และ B แต่ความหมายนี้อาจอ่อนแอ มันอาจเป็นเพียงทิศทางของการเข้าสู่ระบบและไม่มีอะไรอื่น นี่คือสิ่งที่ฉันหมายถึง ... สมมุติว่า A และ B ทั้งสองมีความสัมพันธ์กับ C 0.5 โดยที่ความสัมพันธ์ระหว่าง A และ B อาจเป็น 1.0 ฉันคิดว่ามันอาจจะ 0.5 หรือต่ำกว่า แต่ฉันคิดว่ามันไม่น่าเป็นไปได้ที่จะเป็นลบ คุณเห็นด้วยไหม นอกจากนี้ยังมีนัยถ้าคุณกำลังพิจารณาค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันหรือแทนที่จะเป็นค่าสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน (อันดับ)? การสังเกตเชิงประจักษ์ล่าสุดของฉันเกี่ยวข้องกับสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

1
อนุกรมเวลาหลายตัวแปรใน R. วิธีการค้นหาความสัมพันธ์ล้าหลังและสร้างแบบจำลองสำหรับการพยากรณ์
ฉันใหม่ในหน้านี้และค่อนข้างใหม่ในสถิติและอาร์ฉันกำลังทำงานในโครงการสำหรับวิทยาลัยโดยมีวัตถุประสงค์เพื่อค้นหาความสัมพันธ์ระหว่างฝนและระดับน้ำไหลในแม่น้ำ เมื่อได้รับการพิสูจน์ความสัมพันธ์ฉันต้องการที่จะคาดการณ์ / ทำนายมัน ข้อมูลที่ ฉันมีชุดข้อมูลเป็นเวลาหลายปี (ถ่ายทุกๆ 5 นาที) สำหรับแม่น้ำที่มี: ปริมาณน้ำฝนหน่วยเป็นมิลลิเมตร แม่น้ำไหลในลูกบาศก์เมตรต่อวินาที แม่น้ำนี้ไม่มีหิมะดังนั้นโมเดลจึงขึ้นอยู่กับฝนและเวลาเท่านั้น มีการแช่แข็งอุณหภูมิเป็นครั้งคราว แต่ฉันกำลังคิดที่จะลบช่วงเวลาเหล่านั้นออกจากข้อมูลเป็นค่าผิดปกติเนื่องจากสถานการณ์นั้นอยู่นอกขอบเขตสำหรับโครงการของฉัน ตัวอย่างที่ นี่คุณมีตัวอย่างข้อมูลสองสามแปลงจากฝนและน้ำขึ้นในไม่กี่ชั่วโมงต่อมา เส้นสีแดงคือการไหลของแม่น้ำ สีส้มคือฝน คุณสามารถเห็นฝนตกทุกครั้งก่อนที่น้ำจะไหลขึ้นมาในแม่น้ำ มีฝนเริ่มอีกครั้งในตอนท้ายของอนุกรมเวลา แต่มันจะส่งผลกระทบต่อการไหลของแม่น้ำในภายหลัง ความสัมพันธ์อยู่ที่นั่น นี่คือสิ่งที่ฉันทำใน R เพื่อพิสูจน์ความสัมพันธ์โดยใช้ ccf ใน R: ข้ามสหสัมพันธ์ ตัวแปรชั้นนำ ความล่าช้า นี่คือสาย R ของฉันที่ใช้สำหรับตัวอย่างที่สอง (หนึ่งช่วงเวลาปริมาณน้ำฝน): ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain") การตีความของฉันคือ: ฝนจะนำไปสู่ ​​(เกิดขึ้นก่อน) ≈ 450≈450\approx 450 ≈ …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
การวิเคราะห์ความสัมพันธ์ข้ามระหว่างกระบวนการจุด
ฉันต้องการคำแนะนำเกี่ยวกับวิธีการวิเคราะห์ที่ฉันใช้เพื่อทราบว่าเป็นไปได้หรือไม่ ฉันวัดกระบวนการสองจุดได้และและฉันต้องการตรวจสอบ หากมีเหตุการณ์ในมีความสัมพันธ์อย่างใดเพื่อเหตุการณ์ใน 2 T 2 = T 2 1 , T 2 2 , . . , t 2 m T 1 T 2T1= t11, t12, . . . , t1nT1=t11,t21,...,tn1T^1 = t^1_1, t^1_2, ..., t^1_nT2= t21, t22, . . . , t2ม.T2=t12,t22,...,tm2T^2 = t^2_1, t^2_2, ..., t^2_mT1T1T^1T2T2T^2 หนึ่งในวิธีการที่ฉันได้พบในวรรณกรรมคือการสร้างฮิสโตแกรมข้ามสหสัมพันธ์: …


3
อัลกอริทึมใดที่ฉันสามารถใช้เพื่อค้นหาความสัมพันธ์ระหว่างเหตุการณ์
ฉันยังใหม่กับการเรียนรู้ของเครื่องดังนั้นฉันจึงพยายามค้นหาวรรณกรรมบางอย่าง แต่ฉันไม่แน่ใจด้วยซ้ำว่าจะให้ Google ทำอะไร ข้อมูลของฉันอยู่ในรูปแบบต่อไปนี้: User A performs Action P User B performs Action Q User C performs Action R ... User C performs Action X User A performs Action Y User B performs Action Z ... ที่การดำเนินการแต่ละรายการมีลักษณะบางอย่าง (วันที่เวลาลูกค้า ฯลฯ ) มีผู้ใช้ประมาณ 300 คนและเรามีการดำเนินการประมาณ 20,000 รายการ คำถาม : ฉันต้องการตรวจสอบว่ามีสาเหตุ / …

2
เปรียบเทียบค่าสัมประสิทธิ์สหสัมพันธ์
ฉันมีชุดข้อมูลสองชุดที่มีค่า ~ 250.000 สำหรับตัวอย่าง 78 และ 35 ตัวอย่างบางส่วนเป็นสมาชิกของครอบครัวและอาจมีผลกระทบของข้อมูล ฉันคำนวณความสัมพันธ์แบบคู่และมันแตกต่างกันระหว่าง 0.7 และ 0.95 แต่อยากทราบว่ามีความแตกต่างอย่างมีนัยสำคัญในค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างครอบครัวกับครอบครัวหรือไม่? วิธีที่ดีที่สุดในการทำเช่นนี้คืออะไร? ขอบคุณ

1
การวิเคราะห์อนุกรมเวลาแบบอะซิงโครนัส
ฉันพยายามวิเคราะห์ช่วงเวลารอคอยของอนุกรมเวลาของราคาหุ้นสองแห่ง ในการวิเคราะห์อนุกรมเวลาปกติเราสามารถทำ Cross Correlaton, VECM (Granger Causality) อย่างไรก็ตามวิธีการหนึ่งจะจัดการเดียวกันในอนุกรมเวลาเว้นระยะไม่สม่ำเสมอ สมมติฐานคือเครื่องมือหนึ่งนำไปสู่อีกอันหนึ่ง ฉันมีข้อมูลสำหรับสัญลักษณ์ทั้งสองถึงไมโครวินาที ฉันดูแพ็คเกจ RTAQ และลองใช้ VECM RTAQ นั้นเพิ่มเติมในอนุกรมเวลาที่ไม่เปลี่ยนแปลงในขณะที่ VECM ไม่สำคัญในช่วงเวลาเหล่านี้ > dput(STOCKS[,])) structure(c(29979, 29980, 29980, 29980, 29981, 29981, 29991, 29992, 29993, 29991, 29990, 29992), .Dim = c(6L, 2L), .Dimnames = list(NULL, c("Pair_Bid", "Calc_Bid" )), index = structure(c(1340686178.55163, 1340686181.40801, 1340686187.2642, 1340686187.52668, 1340686187.78777, 1340686189.36693), …

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
ความสัมพันธ์ข้ามกับข้อมูลร่วมกัน
อะไรคือความแตกต่างระหว่างสหสัมพันธ์ข้ามและข้อมูลซึ่งกันและกัน ปัญหาประเภทใดที่สามารถแก้ไขได้โดยใช้มาตรการเหล่านี้และเมื่อใดควรใช้อีกข้อหนึ่ง ขอบคุณสำหรับความคิดเห็น เพื่อชี้แจงคำถามที่ได้รับแจ้งจากความสนใจในการวิเคราะห์ iomage มากกว่าการวิเคราะห์อนุกรมเวลาแม้ว่าการตรัสรู้ใด ๆ ในพื้นที่นั้นจะได้รับการชื่นชม

1
วิธีการวิเคราะห์ความสัมพันธ์ 'เบียร์และผ้าอ้อม'
ฉันมีข้อมูลที่เทียบเท่ากับ: shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... ฉันต้องการทำการวิเคราะห์บางอย่างกับชุดข้อมูลนี้เพื่อรับเมทริกซ์สหสัมพันธ์ที่จะมีความหมายคล้ายกับ: หากคุณซื้อ x คุณมีแนวโน้มที่จะซื้อ y ใช้ไพ ธ อน (หรือบางทีอาจเป็นอะไรก็ได้ยกเว้น MATLAB) ฉันจะทำยังไงต่อไป แนวทางพื้นฐานบางอย่างหรือตัวชี้ไปยังที่ที่ฉันควรดูจะช่วย ขอบคุณ, แก้ไข - สิ่งที่ฉันได้เรียนรู้: ปัญหาเหล่านี้เรียกว่าการค้นพบกฎการเชื่อมโยง Wikipedia มีบทความที่ดีที่ครอบคลุมอัลกอริทึมทั่วไปบางประการที่ควรทำ อัลกอริทึมแบบดั้งเดิมที่ทำเช่นนั้นน่าจะเป็น Apriori เนื่องจาก Agrawal และ อัล นั่นทำให้ฉันเป็นสีส้มแพคเกจหลาม data interconnect สำหรับ Linux วิธีที่ดีที่สุดในการติดตั้งนั้นมาจากแหล่งที่มาโดยใช้ setup.py ที่ให้มา ออเรนจ์โดยค่าเริ่มต้นจะอ่านอินพุตจากไฟล์ซึ่งจัดรูปแบบด้วยวิธีใดวิธีหนึ่งที่รองรับ ในที่สุดการเรียนรู้กฎของ Apriori อย่างง่าย ๆก็เป็นสีส้ม
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.