คำถามติดแท็ก correlation

การวัดระดับความสัมพันธ์เชิงเส้นระหว่างตัวแปรหนึ่งตัว

2
เมื่อความแปรปรวนทางไกลมีความเหมาะสมน้อยกว่าความแปรปรวนเชิงเส้นตรงหรือไม่
ฉันได้รับการแนะนำเพียง (ราง) เพื่อBrownian / ระยะทางแปรปรวน ดูเหมือนว่ามีประโยชน์โดยเฉพาะอย่างยิ่งในสถานการณ์ที่ไม่ใช่เชิงเส้นเมื่อทำการทดสอบเพื่อการพึ่งพา แต่ดูเหมือนว่าจะไม่ได้ใช้บ่อยนักถึงแม้ว่าความแปรปรวนร่วม / ความสัมพันธ์มักใช้กับข้อมูลที่ไม่เป็นเชิงเส้น / ไม่เป็นระเบียบ ฉันคิดว่าอาจมีข้อเสียเปรียบในการแปรปรวนระยะทาง แล้วพวกมันคืออะไรและทำไมทุกคนไม่ใช้ความแปรปรวนแบบระยะทางเสมอ

5
ตัวอย่างของค่าสัมประสิทธิ์สหสัมพันธ์ที่แข็งแกร่งกับค่า p สูง
ฉันสงสัยว่าเป็นไปได้หรือไม่ที่จะมีค่าสัมประสิทธิ์สหสัมพันธ์ที่สูงมาก (พูด. 9 หรือสูงกว่า) ด้วยค่า p สูง (พูด. 25 หรือสูงกว่า)? นี่คือตัวอย่างของสัมประสิทธิ์สหสัมพันธ์ต่ำที่มีค่า p สูง: set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y cor.test(x,y) cor = 0.03908927, p = 0.6994 สัมประสิทธิ์สหสัมพันธ์สูงค่า p ต่ำ: y <- rnorm(100) x <- rnorm(100)+2*y cor.test(x,y) cor = 0.8807809, p = 2.2e-16 ค่าสัมประสิทธิ์สหสัมพันธ์ต่ำค่า p ต่ำ: y <- rnorm(100000) x …

3
สัมประสิทธิ์การตัดสินใจ (
ฉันต้องการเข้าใจความคิดของอย่างเต็มที่อธิบายถึงจำนวนของการเปลี่ยนแปลงระหว่างตัวแปร คำอธิบายทุกเว็บเป็นบิตกลและป้าน ฉันต้องการที่จะ "รับ" แนวคิดไม่ใช่แค่ใช้ตัวเลขโดยอัตโนมัติR2R2r^2 เช่นชั่วโมงที่เรียนเทียบกับคะแนนทดสอบ RRr = .8 R2R2r^2 = .64 ดังนั้นสิ่งนี้หมายความว่าอย่างไร 64% ของคะแนนความแปรปรวนสามารถอธิบายเป็นชั่วโมงได้หรือไม่ เราจะรู้ได้อย่างไรว่าเพียงแค่ยกกำลังสอง?

1
การสร้างตัวแปรสุ่มที่มีความสัมพันธ์แบบทวินาม
ฉันสงสัยว่ามันอาจจะเป็นไปได้ที่จะสร้างตัวแปรทวินามแบบสหสัมพันธ์โดยใช้วิธีการแปลงเชิงเส้นหรือไม่? ด้านล่างฉันลองทำอะไรง่ายๆใน R แล้วมันสร้างความสัมพันธ์กันบ้าง แต่ฉันสงสัยว่ามีวิธีการทำเช่นนี้หรือไม่ X1 = rbinom(1e4, 6, .5) ; X2 = rbinom(1e4, 6, .5) ; X3 = rbinom(1e4, 6, .5) ; a = .5 Y1 = X1 + (a*X2) ; Y2 = X2 + (a*X3) ## Y1 and Y2 are supposed to be correlated cor(Y1, Y2)

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

5
ความหมายเชิงสัญชาตญาณของการมีความสัมพันธ์เชิงเส้นระหว่างบันทึกของตัวแปรสองตัวคืออะไร?
ฉันมีตัวแปรสองตัวที่ไม่แสดงความสัมพันธ์มากนักเมื่อพล็อตต่อกันอย่างที่เป็นอยู่ แต่ความสัมพันธ์เชิงเส้นที่ชัดเจนมากเมื่อฉันพล็อตบันทึกของตัวแปรแต่ละตัวจะมีความสัมพันธ์กัน ดังนั้นฉันจะจบลงด้วยรูปแบบของประเภท: log(Y)=alog(X)+blog⁡(Y)=alog⁡(X)+b\log(Y) = a \log(X) + bซึ่งยอดเยี่ยมในเชิงคณิตศาสตร์ แต่ดูเหมือนจะไม่มีค่าที่อธิบายได้ของตัวแบบเชิงเส้นปกติ ฉันจะตีความรูปแบบดังกล่าวได้อย่างไร

1
ตัวแปรสุ่มมีความสัมพันธ์หากว่าอันดับของพวกเขามีความสัมพันธ์กันหรือไม่
สมมติว่าเป็นตัวแปรสุ่มแบบต่อเนื่องโดยมีช่วงเวลาที่ จำกัด ประชากรรุ่นของสเปียร์แมนยศค่าสัมประสิทธิ์สหสัมพันธ์สามารถกำหนดเป็นผลิตภัณฑ์ที่ช่วงเวลาที่มีค่าสัมประสิทธิ์ρของเพียร์สันน่าจะเป็นปริพันธ์แปลงF_X (X)และF_Y (Y)ที่F_X, F_Yเป็น CDF ของXและYคือρ s F X ( X ) F Y ( Y ) F X , F Y X YX, วายX,YX,Yρsρsρ_sFX( X)FX(X)F_X(X)FY( Y)FY(Y)F_Y(Y)FX, FYFX,FYF_X,F_YXXXYYY ρs( X, วาย) = ρ ( F( X) , F( Y) )ρs(X,Y)=ρ(F(X),F(Y))ρ_s(X,Y)=ρ(F(X),F(Y))(Y)) ฉันสงสัยว่าคนทั่วไปสามารถสรุปได้หรือไม่ ρ (X, วาย) ≠ 0 ↔ ρ …

2
สัมประสิทธิ์สหสัมพันธ์ของ Pearson แข็งแกร่งแค่ไหนต่อการละเมิดกฎเกณฑ์ทั่วไป?
ข้อมูลของตัวแปรบางประเภทมีแนวโน้มที่ไม่ปกติเมื่อวัดจากประชากรโดยเฉพาะ (เช่นระดับของภาวะซึมเศร้าในประชากรของคนที่มีโรคซึมเศร้า) จากการที่ Pearson ใช้เกณฑ์ปกติสถิติการทดสอบภายใต้เงื่อนไขที่ไม่เป็นมาตรฐานนั้นแข็งแกร่งแค่ไหน? ฉันมีตัวแปรหลายตัวที่ฉันต้องการค่าสัมประสิทธิ์สหสัมพันธ์ แต่ความเบ้ของ Z สำหรับตัวแปรเหล่านี้บางอย่างนั้นมีความสำคัญที่p <.001 (และนั่นก็เป็นตัวอย่างที่ค่อนข้างเล็ก) ฉันได้ลองเปลี่ยนรูปแล้ว แต่การปรับปรุงการกระจายตัวนั้นดีที่สุดเพียงเล็กน้อย ฉันจะต้องติดกับการวิเคราะห์ที่ไม่ใช่พารามิเตอร์หรือไม่ และไม่เพียง แต่สำหรับสหสัมพันธ์ แต่สำหรับการวิเคราะห์ประเภทอื่นด้วย

4
ค่าเฉลี่ยความสัมพันธ์
สมมุติว่าฉันทดสอบว่าตัวแปรYขึ้นอยู่กับตัวแปรอย่างไรXภายใต้เงื่อนไขการทดลองที่แตกต่างกันและรับกราฟต่อไปนี้: เส้นประในกราฟด้านบนแสดงการถดถอยเชิงเส้นสำหรับชุดข้อมูลแต่ละชุด (การตั้งค่าการทดลอง) และตัวเลขในตำนานแสดงถึงสหสัมพันธ์ของเพียร์สันของชุดข้อมูลแต่ละชุด ผมอยากจะคำนวณ "ความสัมพันธ์เฉลี่ย" (หรือ "หมายถึงความสัมพันธ์") ระหว่างและX Yฉันขอเฉลี่ยrค่าได้ไหม สิ่งที่เกี่ยวกับ "การกำหนดเกณฑ์ค่าเฉลี่ย", ? ฉันควรจะคำนวณค่าเฉลี่ยและกว่าจะใช้ตารางของค่าว่าหรือฉันควรคำนวณค่าเฉลี่ยของแต่ละ 's?R 2R2R2R^2rR2R2R^2

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
อัลกอริทึม MIC สำหรับตรวจจับความสัมพันธ์ที่ไม่ใช่เชิงเส้นสามารถอธิบายได้อย่างง่ายดายหรือไม่?
อีกไม่นานฉันอ่านบทความสองเรื่อง อย่างแรกคือเกี่ยวกับประวัติของสหสัมพันธ์และที่สองเกี่ยวกับวิธีการใหม่ที่เรียกว่า Maximal Information Coefficient (MIC) ฉันต้องการความช่วยเหลือของคุณเกี่ยวกับการทำความเข้าใจกับวิธี MIC เพื่อประเมินความสัมพันธ์แบบไม่เป็นเชิงเส้นระหว่างตัวแปร นอกจากนี้คำแนะนำสำหรับการใช้งานใน R สามารถพบได้บนเว็บไซต์ของผู้เขียน (ภายใต้ดาวน์โหลด ): ฉันหวังว่านี่จะเป็นแพลตฟอร์มที่ดีในการพูดคุยและเข้าใจวิธีการนี้ ความสนใจของฉันที่จะหารือเกี่ยวกับสัญชาตญาณเบื้องหลังวิธีนี้และสามารถขยายออกไปได้อย่างไรตามที่ผู้เขียนกล่าว " ... เราต้องการส่วนขยายของ MIC (X, Y) ถึง MIC (X, Y | Z) เราจะต้องการทราบว่าต้องใช้ข้อมูลจำนวนเท่าใดในการประมาณค่า MIC ที่มีเสถียรภาพและมีความอ่อนไหวต่อค่าผิดปกติอย่างไร - หรือความสัมพันธ์ที่สูงขึ้นมิติมันจะพลาดและอื่น ๆ MIC เป็นขั้นตอนที่ดีข้างหน้า แต่มีขั้นตอนอื่น ๆ อีกมากมายที่จะใช้.. "

4
ความสัมพันธ์ระหว่างสหสัมพันธ์และสาเหตุ
จากหน้าวิกิพีเดียหัวข้อความสัมพันธ์ไม่ได้หมายความถึงเวรกรรม , สำหรับเหตุการณ์ที่มีความสัมพันธ์สองเหตุการณ์ A และ B ความสัมพันธ์ที่เป็นไปได้ที่แตกต่างกัน ได้แก่ : สาเหตุ B (สาเหตุโดยตรง); B ทำให้เกิด A (การกลับรายการตรงกันข้าม); A และ B เป็นผลสืบเนื่องจากสาเหตุที่พบบ่อย แต่ไม่ก่อให้เกิดซึ่งกันและกัน A และ B ทั้งสองทำให้ C ซึ่งเป็นเงื่อนไข (อย่างชัดเจนหรือโดยปริยาย) เมื่อ; สาเหตุ B และ B ทำให้ A (สาเหตุสองทิศทางหรือเป็นรอบ); สาเหตุ C ซึ่งทำให้ B (สาเหตุทางอ้อม); ไม่มีการเชื่อมต่อระหว่าง A และ B ความสัมพันธ์เป็นเรื่องบังเอิญ จุดที่สี่หมายถึงอะไร A และ B …

5
วิธีใช้การสลายตัว Cholesky หรือทางเลือกสำหรับการจำลองข้อมูลที่สัมพันธ์กัน
ฉันใช้การสลายตัวของ Cholesky เพื่อจำลองตัวแปรสุ่มที่มีความสัมพันธ์ซึ่งได้รับเมทริกซ์สหสัมพันธ์ สิ่งนี้คือผลลัพธ์ไม่เคยทำซ้ำโครงสร้างความสัมพันธ์ตามที่ได้รับ นี่คือตัวอย่างเล็ก ๆ ใน Python เพื่อแสดงสถานการณ์ import numpy as np n_obs = 10000 means = [1, 2, 3] sds = [1, 2, 3] # standard deviations # generating random independent variables observations = np.vstack([np.random.normal(loc=mean, scale=sd, size=n_obs) for mean, sd in zip(means, sds)]) # observations, a row per …

3
สูตรสำหรับสร้างตัวแปรสุ่มที่สัมพันธ์กันทำงานอย่างไร
หากเรามีตัวแปรสุ่มแบบธรรมดา 2 ตัวตัวแปรที่ไม่เกี่ยวข้องX1,X2X1,X2X_1, X_2เราสามารถสร้างตัวแปรสุ่มที่สัมพันธ์กัน 2 สูตร Y=ρX1+1−ρ2−−−−−√X2Y=ρX1+1−ρ2X2Y=\rho X_1+ \sqrt{1-\rho^2} X_2 แล้วจะมีความสัมพันธ์ρกับX 1YYYρρ\rhoX1X1X_1 บางคนสามารถอธิบายได้ว่าสูตรนี้มาจากไหน

3
ฉันจะสร้างข้อมูลด้วยเมทริกซ์สหสัมพันธ์ที่ได้รับการกำหนดล่วงหน้าได้อย่างไร
ฉันพยายามที่จะสร้างสุ่มลำดับความสัมพันธ์กับค่าเฉลี่ย =แปรปรวน = , ค่าสัมประสิทธิ์สหสัมพันธ์ = 0.8ในรหัสด้านล่างนี้ฉันใช้& เป็นส่วนเบี่ยงเบนมาตรฐานและ& เป็นวิธีการ1 0.80001110.80.80.8s1s2m1m2 p = 0.8 u = randn(1, n) v = randn(1, n) x = s1 * u + m1 y = s2 * (p * u + sqrt(1 - p^2) * v) + m2 นี้ทำให้ผมที่ถูกต้องcorrcoef()0.8 ระหว่างและx yคำถามของฉันคือวิธีการที่ฉันสามารถสร้างชุดหมายความว่าถ้าผมต้องการzที่ยังมีความสัมพันธ์กับy(ที่มีความสัมพันธ์เดียวกัน ) แต่ไม่ได้อยู่กับ มีสูตรเฉพาะที่ฉันต้องรู้หรือไม่? ผมพบว่าหนึ่งแต่ไม่สามารถเข้าใจมันr=0.8r=0.8r=0.8x

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.