คำถามติดแท็ก correlation

การวัดระดับความสัมพันธ์เชิงเส้นระหว่างตัวแปรหนึ่งตัว

6
R: คำนวณความสัมพันธ์โดยกลุ่ม
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ใน R ฉันมีกรอบข้อมูลประกอบไปด้วยฉลากระดับC (ปัจจัย) และสองวัดM1และM2 ฉันจะคำนวณความสัมพันธ์ระหว่างM1และM2ในแต่ละชั้นเรียนได้อย่างไร โดยหลักการแล้วฉันจะได้กรอบข้อมูลกลับมาหนึ่งแถวสำหรับแต่ละชั้นเรียนและสองคอลัมน์นั่นคือป้ายชื่อชั้นCและสหสัมพันธ์
17 r  correlation 

2
จะตีความสัมประสิทธิ์สหสัมพันธ์ของแมทธิวได้อย่างไร?
คำตอบสำหรับคำถามความสัมพันธ์ระหว่างค่าสัมประสิทธิ์สหสัมพันธ์, แมตทิวส์และเพียร์สัน? แสดงให้เห็นว่าทั้งสามวิธีสัมประสิทธิ์เทียบเท่า ฉันไม่ได้มาจากสถิติดังนั้นมันควรเป็นคำถามง่าย ๆ กระดาษ Matthews (www.sciencedirect.com/science/article/pii/0005279575901099) อธิบายสิ่งต่อไปนี้: "A correlation of: C = 1 indicates perfect agreement, C = 0 is expected for a prediction no better than random, and C = -1 indicates total disagreement between prediction and observation"`. ตามที่ Wikipedia ( http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient ) ความสัมพันธ์ของเพียร์สันถูกอธิบายว่า: giving a value …

1
การวัดความสัมพันธ์ที่เหมาะสมของตัวแปรด้วยองค์ประกอบ PCA คืออะไร (บน biplot / plot plot)
ฉันกำลังใช้FactoMineRเพื่อลดชุดข้อมูลการวัดของฉันเป็นตัวแปรแฝง แผนที่ตัวแปรด้านบนมีความชัดเจนสำหรับฉันในการตีความ แต่ฉันสับสนเมื่อมันมาถึงความสัมพันธ์ระหว่างตัวแปรและองค์ประกอบ 1 มองที่แผนที่ตัวแปรddpและcovอยู่ใกล้กับส่วนประกอบในแผนที่ddpAbsมากขึ้นอีกเล็กน้อย ไป แต่นี่ไม่ใช่สิ่งที่สหสัมพันธ์แสดง: $Dim.1 $Dim.1$quanti correlation p.value jittAbs 0.9388158 1.166116e-11 rpvi 0.9388158 1.166116e-11 sd 0.9359214 1.912641e-11 ddpAbs 0.9327135 3.224252e-11 rapAbs 0.9327135 3.224252e-11 ppq5 0.9319101 3.660014e-11 ppq5Abs 0.9247266 1.066303e-10 cov 0.9150209 3.865897e-10 npvi 0.8853941 9.005243e-09 ddp 0.8554260 1.002460e-07 rap 0.8554260 1.002460e-07 jitt 0.8181207 1.042053e-06 cov5_x 0.6596751 4.533596e-04 …

7
การถดถอยเชิงเส้นอย่างง่ายหมายความถึงสาเหตุหรือไม่?
ฉันรู้ว่าความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ แต่เป็นจุดแข็งและทิศทางของความสัมพันธ์ การถดถอยเชิงเส้นอย่างง่ายหมายความถึงสาเหตุหรือไม่? หรือการทดสอบสถิติเชิงอนุมาน (t-test ฯลฯ ) จำเป็นสำหรับสิ่งนั้นหรือไม่?

2
ใช้เมทริกซ์สหสัมพันธ์เพื่อเลือกตัวทำนายสำหรับการถดถอยที่ถูกต้องหรือไม่?
ไม่กี่วันที่ผ่านมานักวิจัยของฉันบอกฉันเกี่ยวกับวิธีการของเขาในการเลือกตัวแปรให้เป็นแบบจำลองการถดถอยเชิงเส้น ฉันเดาว่ามันไม่ดี แต่ฉันต้องถามคนอื่นเพื่อให้แน่ใจ วิธีการคือ: ดูเมทริกซ์สหสัมพันธ์ระหว่างตัวแปรทั้งหมด (รวมถึงตัวแปร Dependent Y) และเลือกตัวทำนาย X เหล่านั้นซึ่งสัมพันธ์กับ Y มากที่สุด เขาไม่ได้พูดถึงเกณฑ์ใด ๆ ถาม:เขาพูดถูกมั้ย [ฉันคิดว่าวิธีการเลือกนี้ไม่ถูกต้องเนื่องจากมีหลายสิ่งหลายอย่างเช่นเป็นทฤษฎีที่บอกว่าควรเลือกตัวทำนายหรือละเว้นอคติตัวแปร (OVB)

4
ทำไมความเป็นอิสระหมายถึงความสัมพันธ์เป็นศูนย์?
ก่อนอื่นฉันไม่ได้ถามสิ่งนี้: ทำไมความสัมพันธ์แบบศูนย์ไม่มีนัยถึงความเป็นอิสระ? นี่คือที่อยู่(ค่อนข้างดี)ที่นี่: /math/444408/why-does-zero-correlation-not-imply-independence สิ่งที่ฉันถามอยู่ตรงข้าม ... บอกว่าตัวแปรสองตัวเป็นอิสระจากกัน พวกเขาไม่สามารถมีความสัมพันธ์กันเล็กน้อยโดยไม่ได้ตั้งใจหรือไม่? มันไม่ควรจะเป็น ... ความเป็นอิสระหมายถึงสหสัมพันธ์น้อยมาก?

4
เป็นไปได้ไหมที่เวกเตอร์ 3 ตัวนั้นมีความสัมพันธ์เชิงลบแบบคู่ทั้งหมด
ให้เวกเตอร์สามตัว ,และเป็นไปได้หรือไม่ที่สหสัมพันธ์ระหว่างและ ,และและและนั้นเป็นลบทั้งหมด? นั่นเป็นไปได้ไหมaaabbbcccaaabbbaaacccbbbccc corr(a,b)&lt;0corr(a,c)&lt;0corr(b,c)&lt;0corr(a,b)&lt;0corr(a,c)&lt;0corr(b,c)&lt;0\begin{align} \text{corr}(a,b) < 0\\ \text{corr}(a,c) < 0 \\ \text{corr}(b,c) < 0\\ \end{align}

2
ทำไมเพียร์สันρเป็นเพียงตัวชี้วัดของความสัมพันธ์ที่ละเอียดถี่ถ้วนหากการกระจายข้อต่อเป็นหลายตัวแปรปกติ?
การยืนยันนี้เกิดขึ้นจากการตอบคำถามสูงสุดของคำถามนี้ ฉันคิดว่าคำถาม 'ทำไม' แตกต่างกันพอสมควรที่จะรับประกันเธรดใหม่ Googling "การวัดความสัมพันธ์ครบถ้วนสมบูรณ์" ไม่ได้สร้างความนิยมใด ๆ และฉันไม่แน่ใจว่าวลีนั้นหมายถึงอะไร

4
ข้อมูลที่เชื่อมโยงในบริบทของสัมประสิทธิ์สหสัมพันธ์อันดับคืออะไร
ฉันไม่ได้อยู่ในฟิลด์สถิติ ฉันเห็นคำว่า "ผูกข้อมูล" ในขณะที่อ่านเกี่ยวกับค่าสัมประสิทธิ์สหสัมพันธ์อันดับ ข้อมูลที่เชื่อมโยงคืออะไร? ตัวอย่างของข้อมูลที่เชื่อมโยงคืออะไร?

1
ความสัมพันธ์ของตัวแปรสุ่มแบบล็อก - ปกติ
กำหนดตัวแปรสุ่มปกติX1X1X_1และX2X2X_2มีสัมประสิทธิ์สหสัมพันธ์ฉันจะค้นหาความสัมพันธ์ระหว่างตัวแปรสุ่ม lognormalและอย่างไรρρ\rhoY1Y1Y_1Y2Y2Y_2 Y1=a1exp(μ1T+T−−√X1)Y1=a1exp⁡(μ1T+TX1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}X_1) Y2=a2exp(μ2T+T−−√X2)Y2=a2exp⁡(μ2T+TX2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}X_2) Now, if X1=σ1Z1X1=σ1Z1X_1 = \sigma_1 Z_1 and X2=σ1Z2X2=σ1Z2X_2 = \sigma_1 Z_2, where Z1Z1Z_1 and Z2Z2Z_2 are standard normals, from the linear transformation property, we get: Y1=a1exp(μ1T+T−−√σ1Z1)Y1=a1exp⁡(μ1T+Tσ1Z1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}\sigma_1 Z_1) Y2=a2exp(μ2T+T−−√σ2(ρZ1+1−ρ2−−−−−√Z2)Y2=a2exp⁡(μ2T+Tσ2(ρZ1+1−ρ2Z2)Y_2 …

1
มีความสัมพันธ์ใด ๆ ระหว่างความเหมือนโคไซน์ความสัมพันธ์ของแพร์สันและคะแนน z
ฉันสงสัยว่ามีความสัมพันธ์ใด ๆ ระหว่างมาตรการทั้งสามนี้หรือไม่ ฉันไม่สามารถเชื่อมโยงระหว่างพวกเขาได้โดยอ้างถึงคำจำกัดความ (อาจเป็นเพราะฉันยังใหม่กับคำจำกัดความเหล่านี้และฉันมีเวลาค่อนข้างน้อยในการเข้าใจพวกเขา) ฉันรู้ว่าช่วงของความคล้ายคลึงโคไซน์นั้นมีค่าตั้งแต่ 0 - 1 และความสัมพันธ์ของเพียร์สันสามารถอยู่ในช่วงตั้งแต่ -1 ถึง 1 และฉันไม่แน่ใจว่าอยู่ในช่วงของคะแนน z อย่างไรก็ตามฉันไม่ทราบว่าคุณค่าความคล้ายคลึงกันของโคไซน์สามารถบอกอะไรคุณได้บ้างเกี่ยวกับความสัมพันธ์ของเพียร์สันหรือคะแนน z และในทางกลับกัน

3
เมื่อไหร่ที่เราสามารถพูดถึง collinearity
ในตัวแบบเชิงเส้นเราต้องตรวจสอบว่าความสัมพันธ์มีอยู่ในตัวแปรอธิบายหรือไม่ หากพวกเขาสัมพันธ์กันมากเกินไปก็จะมีความเป็นเส้นตรงกัน (นั่นคือตัวแปรอธิบายบางส่วน) ตอนนี้ฉันแค่ดูความสัมพันธ์แบบคู่ระหว่างตัวแปรอธิบายแต่ละอย่าง คำถามที่ 1: อะไรคือการจำแนกความสัมพันธ์มากเกินไป? ตัวอย่างเช่นความสัมพันธ์ของเพียร์สันคือ 0.5 มากเกินไปหรือไม่ คำถามที่ 2: เราสามารถพิจารณาได้อย่างสมบูรณ์ว่ามีค่าความเป็นคู่ระหว่างตัวแปรสองตัวตามค่าสัมประสิทธิ์สหสัมพันธ์หรือไม่หรือขึ้นอยู่กับปัจจัยอื่น ๆ คำถามที่ 3: การตรวจสอบกราฟิกของ Scatterplot ของตัวแปรสองตัวนั้นเพิ่มอะไรลงไปในสิ่งที่สัมประสิทธิ์สหสัมพันธ์บ่งชี้หรือไม่?

2
เทคนิคใดบ้างสำหรับการสุ่มตัวอย่างสองตัวแปรสุ่มที่สัมพันธ์กัน?
เทคนิคใดบ้างสำหรับการสุ่มตัวอย่างตัวแปรสุ่มที่มีความสัมพันธ์สองตัว: ถ้าการแจกแจงความน่าจะเป็นของพวกเขาถูกแปร (เช่น log-normal) หากพวกเขามีการแจกแจงแบบไม่อิงพารามิเตอร์ ข้อมูลเป็นอนุกรมเวลาสองชุดที่เราสามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้ เราต้องการจำลองข้อมูลเหล่านี้ในอนาคตโดยสมมติว่าความสัมพันธ์ทางประวัติศาสตร์และอนุกรมเวลา CDF นั้นคงที่ สำหรับกรณี (2) อะนาล็อก 1-D จะสร้าง CDF และตัวอย่างจากมัน ดังนั้นฉันเดาว่าฉันสามารถสร้าง CDF 2 มิติและทำสิ่งเดียวกัน อย่างไรก็ตามฉันสงสัยว่ามีวิธีที่จะเข้าใกล้โดยใช้ 1-D CDFs แต่ละรายการและเชื่อมโยงตัวเลือกอย่างใด ขอบคุณ!

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
จะเข้าใจสูตรสัมประสิทธิ์สหสัมพันธ์ได้อย่างไร
ทุกคนสามารถช่วยฉันเข้าใจสูตรสหสัมพันธ์ของเพียร์สันได้ไหม ตัวอย่างrrr = ค่าเฉลี่ยของผลิตภัณฑ์ของคะแนนมาตรฐานของตัวแปรXXXและYYYY ฉันเข้าใจว่าทำไมพวกเขาต้องสร้างมาตรฐานXXXและYYYแต่จะเข้าใจผลิตภัณฑ์ของทั้งสองคะแนนได้อย่างไร สูตรนี้เรียกอีกอย่างว่า "สัมประสิทธิ์สหสัมพันธ์ของโมเมนต์ผลิตภัณฑ์" แต่เหตุผลในการดำเนินการของผลิตภัณฑ์คืออะไร ฉันไม่แน่ใจว่าฉันได้ทำคำถามของฉันชัดเจนหรือไม่ แต่ฉันต้องการที่จะจำสูตรอย่างสังหรณ์ใจ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.