คำถามติดแท็ก correlation

การวัดระดับความสัมพันธ์เชิงเส้นระหว่างตัวแปรหนึ่งตัว

29
ตัวอย่างสำหรับการสอน: ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ
มีการพูดกันว่า: "ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ" เมื่อฉันสอนฉันมักจะใช้ตัวอย่างมาตรฐานต่อไปนี้เพื่ออธิบายประเด็นนี้: จำนวนนกกระสาและอัตราการเกิดในเดนมาร์ก จำนวนนักบวชในอเมริกาและโรคพิษสุราเรื้อรัง; ในการเริ่มต้นของศตวรรษที่ 20 มันก็สังเกตเห็นว่ามีความสัมพันธ์ที่แข็งแกร่งระหว่าง 'จำนวนของวิทยุ' และ 'จำนวนของคนที่อยู่ในโรงพยาบาลบ้า' และสิ่งที่ฉันชอบ: โจรสลัดทำให้โลกร้อนขึ้น อย่างไรก็ตามฉันไม่ได้มีการอ้างอิงใด ๆ สำหรับตัวอย่างเหล่านี้และในขณะที่สนุกพวกเขาเป็นเท็จอย่างเห็นได้ชัด ใครบ้างมีตัวอย่างที่ดีอื่น ๆ ?

6
ไม่มีความสัมพันธ์กันไม่ได้หมายความว่าไม่มีเวรกรรม?
ฉันรู้ว่าความสัมพันธ์ไม่ได้บ่งบอกถึงความเป็นเหตุเป็นผล แต่การขาดความสัมพันธ์นั้นหมายถึงการขาดความเป็นเหตุเป็นผล?

8
สร้างตัวแปรสุ่มที่มีความสัมพันธ์ที่กำหนดไว้กับตัวแปรที่มีอยู่
สำหรับการศึกษาการจำลองฉันต้องสร้างตัวแปรสุ่มที่แสดง prefined (ประชากร) ความสัมพันธ์กับตัวแปรที่มีอยู่YYYY ฉันดูในRแพ็คเกจcopulaและCDVineสามารถสร้างการแจกแจงหลายตัวแปรแบบสุ่มด้วยโครงสร้างการพึ่งพาที่กำหนด อย่างไรก็ตามเป็นไปไม่ได้ที่จะแก้ไขหนึ่งในตัวแปรที่เป็นผลลัพธ์ของตัวแปรที่มีอยู่ ความคิดและลิงก์ไปยังฟังก์ชั่นที่มีอยู่นั้นได้รับการชื่นชม! สรุป: คำตอบที่ถูกต้องสองคำขึ้นมาพร้อมกับโซลูชันที่แตกต่าง: R สคริปต์โดย Caracal ซึ่งจะคำนวณตัวแปรสุ่มกับที่แน่นอน (ตัวอย่าง) ความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า R ฟังก์ชั่นฉันพบตัวเองซึ่งจะคำนวณตัวแปรสุ่มที่มีการกำหนดประชากรความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า [@ttnphns 'นอกจากนี้: ฉันใช้เสรีภาพในการขยายชื่อคำถามจากกรณีตัวแปรคงที่เดียวเป็นจำนวนคงที่ของตัวแปรคงที่; เช่นวิธีการสร้างตัวแปรที่มีคอร์เรชั่นที่กำหนดไว้ล่วงหน้าพร้อมกับตัวแปรคงที่บางตัวที่มีอยู่]

4
สัมประสิทธิ์สหสัมพันธ์ต่างจากความชันถดถอยอย่างไร
ฉันคาดว่าค่าสัมประสิทธิ์สหสัมพันธ์จะเหมือนกับความชันถดถอย (เบต้า) แต่เมื่อเปรียบเทียบกับทั้งสองมันต่างกัน พวกเขาต่างกันอย่างไร - พวกเขาให้ข้อมูลที่แตกต่างกันอย่างไร

5
Kendall Tau หรือ Rho's Spearman?
ในกรณีใดที่หนึ่งควรชอบหนึ่งมากกว่าอีก? ฉันพบคนที่อ้างว่าเป็นประโยชน์สำหรับเคนดัลล์ด้วยเหตุผลด้านการสอนมีเหตุผลอื่นอีกไหม?

1
ความสัมพันธ์แบบใดที่ทำให้เมทริกซ์เอกพจน์และความหมายของเอกพจน์หรือความใกล้เคียงเอกฐานคืออะไร
ฉันกำลังคำนวณบางอย่างกับเมทริกซ์ที่แตกต่างกัน (ส่วนใหญ่ในการถดถอยโลจิสติก) และฉันมักจะได้รับข้อผิดพลาด "เมทริกซ์คือเอกพจน์" ที่ฉันต้องย้อนกลับไปและลบตัวแปรที่เกี่ยวข้อง คำถามของฉันที่นี่คือสิ่งที่คุณจะพิจารณาเมทริกซ์ที่มีความสัมพันธ์ "สูง" มีค่าขีด จำกัด ของความสัมพันธ์เพื่อเป็นตัวแทนของคำนี้หรือไม่? เช่นเดียวกับตัวแปรที่มีความสัมพันธ์ 0.97 กับอีกอันหนึ่งมันสูงพอที่จะทำให้เมทริกซ์เอกพจน์หรือไม่? ขออภัยหากคำถามนี้เป็นพื้นฐานมากฉันไม่สามารถหาการอ้างอิงใด ๆ ที่พูดถึงปัญหานี้ (คำแนะนำเกี่ยวกับการอ้างอิงใด ๆ จะเป็นประโยชน์อย่างมาก!)

4
ดูแล้วคุณจะพบ (ความสัมพันธ์)
ฉันมีการวัดหลายร้อย ตอนนี้ฉันกำลังพิจารณาใช้ซอฟต์แวร์บางชนิดเพื่อเชื่อมโยงทุกการวัดกับทุกการวัด ซึ่งหมายความว่ามีความสัมพันธ์นับพัน ในกลุ่มคนเหล่านี้ควรมีความสัมพันธ์ทางสถิติสูงแม้ว่าข้อมูลจะสุ่มอย่างสมบูรณ์ (แต่ละการวัดมีเพียง 100 ดาต้าพอยน์) เมื่อฉันพบความสัมพันธ์ฉันจะรวมข้อมูลเกี่ยวกับความยากลำบากที่ฉันมองหาความสัมพันธ์ลงไปได้อย่างไร ฉันไม่ได้อยู่ในระดับสูงในสถิติดังนั้นโปรดอดทนกับฉัน

8
หาก A และ B สัมพันธ์กับ C เหตุใด A และ B จึงไม่สัมพันธ์กัน?
ฉันรู้ด้วยสังเกตุว่าเป็นอย่างนั้น ฉันเพิ่งพัฒนาแบบจำลองที่ใช้กับปริศนานี้ ฉันยังสงสัยด้วยว่าไม่จำเป็นต้องตอบใช่หรือไม่ใช่ ฉันหมายความว่าถ้าทั้ง A และ B มีความสัมพันธ์กับ C นี่อาจมีความหมายบางอย่างเกี่ยวกับความสัมพันธ์ระหว่าง A และ B แต่ความหมายนี้อาจอ่อนแอ มันอาจเป็นเพียงทิศทางของการเข้าสู่ระบบและไม่มีอะไรอื่น นี่คือสิ่งที่ฉันหมายถึง ... สมมุติว่า A และ B ทั้งสองมีความสัมพันธ์กับ C 0.5 โดยที่ความสัมพันธ์ระหว่าง A และ B อาจเป็น 1.0 ฉันคิดว่ามันอาจจะ 0.5 หรือต่ำกว่า แต่ฉันคิดว่ามันไม่น่าเป็นไปได้ที่จะเป็นลบ คุณเห็นด้วยไหม นอกจากนี้ยังมีนัยถ้าคุณกำลังพิจารณาค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันหรือแทนที่จะเป็นค่าสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน (อันดับ)? การสังเกตเชิงประจักษ์ล่าสุดของฉันเกี่ยวข้องกับสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน

4
จะสร้างตัวเลขสุ่มที่มีความสัมพันธ์กันอย่างไร (ให้หมายถึงผลต่างและระดับความสัมพันธ์)
ฉันขอโทษถ้ามันดูธรรมดาไปหน่อย แต่ฉันคิดว่าฉันแค่ต้องการยืนยันความเข้าใจที่นี่ ฉันเข้าใจว่าฉันต้องทำสิ่งนี้ในสองขั้นตอนและฉันก็เริ่มพยายามฝึกความสัมพันธ์ แต่ก็เริ่มดูเหมือนจะเกี่ยวข้องจริงๆ ฉันกำลังมองหาคำอธิบายที่กระชับ (นึกคิดด้วยคำแนะนำต่อการแก้ปัญหา pseudocode) ของวิธีที่ดีและรวดเร็วในการสร้างตัวเลขสุ่มที่สัมพันธ์กัน ด้วยความสูงและน้ำหนักของตัวแปรเทียมสองตัวที่มีความหมายและความแปรปรวนที่รู้จักกันและความสัมพันธ์ที่กำหนดฉันคิดว่าฉันพยายามเข้าใจว่าขั้นตอนที่สองนี้ควรเป็นอย่างไร height = gaussianPdf(height.mean, height.variance) weight = gaussianPdf(correlated_mean(height.mean, correlation_coefficient), correlated_variance(height.variance, correlation_coefficient)) ฉันจะคำนวณค่าเฉลี่ยและความแปรปรวนได้อย่างไร แต่ฉันต้องการยืนยันว่านี่เป็นปัญหาที่เกี่ยวข้องจริงๆที่นี่ ฉันจำเป็นต้องใช้วิธีจัดการกับเมทริกซ์หรือไม่? หรือฉันมีสิ่งอื่นที่ผิดปกติมากในแนวทางพื้นฐานของปัญหานี้


4
ทำไมค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ XY มีแนวโน้มที่จะเป็น 0.7
นำมาจากสถิติเชิงปฏิบัติสำหรับการวิจัยทางการแพทย์ที่ Douglas Altman เขียนไว้ในหน้า 285: ... สำหรับสองปริมาณ X และ Y ใด ๆ X จะสัมพันธ์กับ XY แน่นอนแม้ว่า X และ Y เป็นตัวอย่างของตัวเลขสุ่มเราคาดหวังว่าความสัมพันธ์ของ X และ XY จะเท่ากับ 0.7 ฉันพยายามใน R และดูเหมือนว่าจะเป็นกรณี: x <- rnorm(1000000, 10, 2) y <- rnorm(1000000, 10, 2) cor(x, x-y) xu <- sample(1:100, size = 1000000, replace = T) yu …

4
สหสัมพันธ์ = 0.2 หมายความว่ามีการเชื่อมโยง“ ใน 1 ใน 5 คนเท่านั้น” หรือไม่
ในสมอง Idiot: นักประสาทวิทยาอธิบายว่าหัวของคุณเป็นจริงขึ้นอยู่กับ Dean Dean เขียน ความสัมพันธ์ระหว่างส่วนสูงและสติปัญญามักอ้างว่ามีค่าประมาณซึ่งหมายถึงความสูงและสติปัญญานั้นมีความสัมพันธ์กันในในคน0.20.20.2111555 สำหรับฉันเสียงนี้ผิด: ฉันเข้าใจความสัมพันธ์มากขึ้นเช่นข้อผิดพลาด (ขาด) ที่เราได้รับเมื่อเราพยายามที่จะทำนายหนึ่งการวัด (นี่คือความฉลาด) หากสิ่งเดียวที่เรารู้เกี่ยวกับบุคคลนั้นคือการวัดอื่น ๆ หากค่าสหสัมพันธ์เป็นหรือดังนั้นเราจะไม่ทำผิดพลาดในการทำนายของเราหากค่าสหสัมพันธ์เท่ากับว่ามีข้อผิดพลาดมากกว่า ดังนั้นความสัมพันธ์จะมีผลกับทุกคนไม่ใช่แค่ในคน111−1−1-10.80.80.8111555 ฉันได้ดูคำถามนี้แต่ฉันไม่เก่งพอที่จะเข้าใจคำตอบ นี้คำตอบที่พูดเกี่ยวกับความแข็งแกร่งของความสัมพันธ์เชิงเส้นดูเหมือนว่าในสายซึ่งความเข้าใจของผม แต่ผมไม่แน่ใจว่า

3
วิธีการใช้เพียร์สันสหสัมพันธ์อย่างถูกต้องกับอนุกรมเวลา
ฉันมี 2 ซีรีย์ (ราบรื่นทั้งคู่) ที่ฉันอยากจะครอสสัมพันธ์เพื่อดูว่าพวกมันมีความสัมพันธ์กันอย่างไร ฉันตั้งใจจะใช้สัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน สิ่งนี้เหมาะสมหรือไม่ คำถามที่สองของฉันคือฉันสามารถเลือกตัวอย่าง 2 ซีรี่ส์ได้ตามต้องการ เช่นฉันสามารถเลือกจำนวนข้อมูลที่ฉันต้องการเรา สิ่งนี้จะส่งผลต่อสัมประสิทธิ์สหสัมพันธ์ที่ส่งออกหรือไม่ ฉันจำเป็นต้องพิจารณาเรื่องนี้หรือไม่? เพื่อประกอบการอธิบาย option(i) [1, 4, 7, 10] & [6, 9, 6, 9, 6] option(ii) [1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9,8,7,6]

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

3
การคำนวณสหสัมพันธ์ของเพียร์สันหรือสเปียร์แมนนั้นมีความหมายหรือไม่ระหว่างสองเวกเตอร์บูลีน
มีเวกเตอร์บูลีนสองตัวซึ่งมี 0 และ 1 เท่านั้น หากฉันคำนวณความสัมพันธ์ของ Pearson หรือ Spearman พวกเขามีความหมายหรือสมเหตุสมผลหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.