คำถามติดแท็ก correlation

การวัดระดับความสัมพันธ์เชิงเส้นระหว่างตัวแปรหนึ่งตัว

18
จะเกิดอะไรขึ้นถ้าตัวแปรอธิบายและการตอบสนองถูกจัดเรียงอย่างอิสระก่อนการถดถอย
สมมติว่าเรามีชุดข้อมูลมี points เราต้องการที่จะดำเนินการถดถอยเชิงเส้น แต่แรกที่เราจัดเรียงค่าและค่าเป็นอิสระจากกันสร้างชุดข้อมูลY_j) มีการตีความความหมายของการถดถอยในชุดข้อมูลใหม่หรือไม่? สิ่งนี้มีชื่อหรือไม่?(Xi,Yi)(Xi,Yi)(X_i,Y_i)nnnY i ( X i , Y j )XiXiX_iYiYiY_i( Xผม, วายJ)(Xi,Yj)(X_i,Y_j) ฉันคิดว่านี่เป็นคำถามที่งี่เง่าดังนั้นฉันขอโทษฉันไม่ได้รับการฝึกฝนอย่างเป็นทางการในสถิติ ในใจของฉันสิ่งนี้ทำลายข้อมูลของเราอย่างสมบูรณ์และการถดถอยไม่มีความหมาย แต่ผู้จัดการของฉันบอกว่าเขาได้รับ "การถดถอยที่ดีขึ้นเกือบตลอดเวลา" เมื่อเขาทำสิ่งนี้ (ที่นี่ "ดีกว่า" หมายถึงการคาดการณ์ได้มากขึ้น) ฉันมีความรู้สึกว่าเขากำลังหลอกลวงตัวเอง แก้ไข: ขอบคุณสำหรับตัวอย่างที่ดีและอดทนของคุณทั้งหมด ฉันแสดงให้เขาเห็นตัวอย่างโดย @ RUser4512 และ @gung และเขายังคงหยุดยั้ง เขากลายเป็นหงุดหงิดและฉันเหนื่อยมาก ฉันรู้สึกหงุดหงิด ฉันอาจจะเริ่มหางานอื่น ๆ เร็ว ๆ นี้

7
PCA เกี่ยวกับสหสัมพันธ์หรือความแปรปรวนร่วม?
อะไรคือความแตกต่างที่สำคัญระหว่างการวิเคราะห์องค์ประกอบหลัก (PCA) ในเมทริกซ์สหสัมพันธ์และเมทริกซ์ความแปรปรวนร่วม? พวกเขาให้ผลลัพธ์เดียวกันหรือไม่

8
Facebook กำลังจะสิ้นสุดหรือไม่
เมื่อเร็ว ๆนี้บทความนี้ได้รับความสนใจอย่างมาก (เช่นจากWSJ ) ผู้เขียนสรุปว่า Facebook จะสูญเสียสมาชิก 80% ภายในปี 2560 พวกเขาอ้างถึงการคาดการณ์ของแบบจำลอง SIRซึ่งเป็นแบบจำลองแบบแยกส่วนที่ใช้บ่อยในการระบาดวิทยา ข้อมูลของพวกเขามาจากการค้นหาของ Google สำหรับ "Facebook" และผู้เขียนใช้อนิจกรรมของ Myspace เพื่อตรวจสอบข้อสรุปของพวกเขา คำถาม: ผู้เขียนทำผิด "ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ" หรือไม่? รุ่นและตรรกะนี้อาจใช้งานกับ MySpace ได้ แต่มันใช้ได้กับเครือข่ายโซเชียลใด ๆ หรือไม่? อัปเดต : Facebook กลับมาอีกครั้ง เพื่อให้สอดคล้องกับหลักการทางวิทยาศาสตร์ "สหสัมพันธ์เท่ากับสาเหตุ" การวิจัยของเราแสดงให้เห็นอย่างชัดเจนว่าพรินซ์ตันอาจตกอยู่ในอันตรายจากการหายไปอย่างสิ้นเชิง เราไม่คิดว่าพรินซ์ตันหรืออากาศของโลกกำลังจะไปทุกที่เร็ว ๆ นี้ เรารักพรินซ์ตัน (และอากาศ) และเพิ่มการเตือนครั้งสุดท้ายว่า“ ไม่ใช่การวิจัยทั้งหมดที่สร้างขึ้นเท่ากัน - และวิธีการวิเคราะห์บางอย่างนำไปสู่ข้อสรุปที่บ้า

6
ความสัมพันธ์กับตัวแปรหมวดหมู่ที่ไม่ได้เรียงลำดับ
ฉันมีชื่อไฟล์ที่มีข้อสังเกตและตัวแปรมากมาย บางส่วนมีการจัดหมวดหมู่ (ไม่เรียงลำดับ) และอื่น ๆ เป็นตัวเลข ฉันกำลังมองหาความสัมพันธ์ระหว่างตัวแปรเหล่านี้ ฉันสามารถคำนวณสหสัมพันธ์ของตัวแปรเชิงตัวเลข (Spearman's correlation) ได้ แต่: ฉันไม่ทราบวิธีการวัดความสัมพันธ์ระหว่างตัวแปรเด็ดขาดที่ไม่เรียงลำดับ ฉันไม่รู้วิธีวัดความสัมพันธ์ระหว่างตัวแปรเด็ดขาดที่ไม่เรียงลำดับกับตัวแปรตัวเลข ไม่มีใครรู้ว่าสิ่งนี้สามารถทำได้? ถ้าเป็นเช่นนั้นมีฟังก์ชั่น R ที่ใช้วิธีการเหล่านี้หรือไม่?

5
วิธีการเลือกระหว่าง Pearson และ Spearman correlation
จะรู้ได้อย่างไรเมื่อต้องเลือกระหว่างสเปียร์แมนและเพียร์สันR ? ตัวแปรของฉันรวมถึงความพึงพอใจและคะแนนถูกตีความโดยใช้ผลรวมของคะแนน อย่างไรก็ตามคะแนนเหล่านี้ก็สามารถจัดอันดับρρ\rhorrr

8
สาเหตุบ่งบอกถึงความสัมพันธ์หรือไม่?
ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุเนื่องจากอาจมีคำอธิบายมากมายสำหรับสหสัมพันธ์ แต่สาเหตุแสดงถึงความสัมพันธ์หรือไม่? โดยสังหรณ์ใจฉันจะคิดว่าการปรากฏตัวของสาเหตุหมายถึงมีความสัมพันธ์จำเป็น แต่สัญชาตญาณของฉันไม่ได้ให้บริการฉันอย่างดีในสถิติ สาเหตุบ่งบอกถึงความสัมพันธ์หรือไม่?

4
เพียร์สันหรือสเปียร์แมนมีความสัมพันธ์กับข้อมูลที่ไม่ปกติ
ฉันได้รับคำถามนี้บ่อยครั้งเพียงพอในการให้คำปรึกษาด้านสถิติที่ฉันคิดว่าฉันโพสต์ไว้ที่นี่ ฉันมีคำตอบซึ่งโพสต์ด้านล่าง แต่ฉันกระตือรือร้นที่จะได้ยินสิ่งที่คนอื่นพูด คำถาม:หากคุณมีตัวแปรสองตัวที่ไม่ได้มีการแจกแจงแบบปกติคุณควรใช้ Rho ของ Spearman สำหรับความสัมพันธ์หรือไม่?

6
ควรลบตัวแปรที่มีความสัมพันธ์สูงก่อนทำ PCA หรือไม่
ฉันกำลังอ่านกระดาษที่ผู้เขียนทิ้งตัวแปรหลายตัวเนื่องจากมีความสัมพันธ์สูงกับตัวแปรอื่น ๆ ก่อนทำ PCA จำนวนตัวแปรทั้งหมดประมาณ 20 สิ่งนี้ให้ประโยชน์ใด ๆ หรือไม่? ดูเหมือนว่าค่าใช้จ่ายสำหรับฉันเป็น PCA ควรจัดการสิ่งนี้โดยอัตโนมัติ
111 correlation  pca 

6
คุณจะอธิบายความแตกต่างระหว่างสหสัมพันธ์และความแปรปรวนร่วมได้อย่างไร
การติดตามคำถามนี้คุณจะอธิบายความแปรปรวนร่วมของคนที่เข้าใจค่าเฉลี่ยได้อย่างไร ซึ่งกล่าวถึงปัญหาของการอธิบายความแปรปรวนร่วมกับบุคคลทั่วไปทำให้เกิดคำถามคล้ายกันขึ้นมาในใจ หนึ่งจะอธิบายให้ neophyte สถิติความแตกต่างระหว่างความแปรปรวนร่วมและสหสัมพันธ์อย่างไร ดูเหมือนว่าทั้งสองอ้างถึงการเปลี่ยนแปลงในตัวแปรหนึ่งที่เชื่อมโยงกลับไปยังตัวแปรอื่น คล้ายกับคำถามที่อ้างถึงการขาดสูตรจะดีกว่า


9
การถดถอยเชิงเส้นใน y กับ x กับ x กับ y แตกต่างกันอย่างไร?
สัมประสิทธิ์สหสัมพันธ์ของ Pearson ของ x และ y ไม่ว่าคุณจะคำนวณ pearson (x, y) หรือ pearson (y, x) นี่แสดงให้เห็นว่าการทำการถดถอยเชิงเส้นของ y ที่ให้ x หรือ x ที่ให้ y ควรเหมือนกัน แต่ฉันไม่คิดว่าเป็นเช่นนั้น ใครบางคนสามารถแสดงความคิดเห็นได้เมื่อความสัมพันธ์ไม่สมมาตรและวิธีการที่เกี่ยวข้องกับสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน (ซึ่งฉันคิดเสมอว่าเป็นการสรุปว่าเหมาะสมที่สุด)

2
ความแปรปรวนร่วมในภาษาธรรมดาคืออะไร?
ความแปรปรวนในภาษาธรรมดาคืออะไรและวิธีการที่จะเชื่อมโยงกับเงื่อนไขการพึ่งพาอาศัยกัน , ความสัมพันธ์และโครงสร้างความแปรปรวนความแปรปรวนที่เกี่ยวกับการออกแบบซ้ำมาตรการ?

16
ภายใต้เงื่อนไขใดที่ความสัมพันธ์บ่งบอกถึงสาเหตุ?
เราทุกคนรู้ว่ามนต์ "ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ" ซึ่งตีกลองในนักเรียนสถิติปีแรกทั้งหมด มีตัวอย่างที่ดีที่นี่เพื่อแสดงความคิด แต่บางครั้งความสัมพันธ์ก็บอกเป็นนัยถึงสาเหตุ ตัวอย่างต่อไปนี้มาจากหน้า Wikipedia นี้ ตัวอย่างเช่นเราสามารถทำการทดสอบในฝาแฝดที่เหมือนกันซึ่งเป็นที่ทราบกันว่าได้คะแนนที่เท่ากันในการทดสอบ คู่หนึ่งถูกส่งไปเรียนหกชั่วโมงขณะที่อีกคู่ถูกส่งไปที่สวนสนุก หากคะแนนการทดสอบของพวกเขาแตกต่างกันไปในระดับใหญ่สิ่งนี้จะเป็นหลักฐานที่ชัดเจนว่าการศึกษา (หรือไปที่สวนสนุก) มีผลต่อคะแนนการทดสอบ ในกรณีนี้ความสัมพันธ์ระหว่างการเรียนและคะแนนการทดสอบจะบอกเป็นนัยถึงสาเหตุ มีสถานการณ์อื่นที่ความสัมพันธ์หมายถึงสาเหตุหรือไม่

1
ความสัมพันธ์ระหว่างตัวแปร (IV) และตัวแปรต่อเนื่อง (DV)
ฉันมีตัวแปรเล็กน้อย (หัวข้อที่แตกต่างกันของการสนทนา, เขียนเป็น topic0 = 0 ฯลฯ ) และจำนวนของตัวแปรสเกล (DV) เช่นความยาวของการสนทนา ฉันจะหาค่าสหสัมพันธ์ระหว่างตัวแปรที่ระบุและสเกลได้อย่างไร

3
ตัวอย่าง: การถดถอย LASSO โดยใช้ glmnet สำหรับผลลัพธ์ไบนารี
ฉันเริ่มตะลุยกับการใช้งานglmnetกับการถดถอยแบบ LASSOซึ่งผลลัพธ์ของความสนใจของฉันนั้นเป็นแบบขั้วคู่ ฉันได้สร้างกรอบข้อมูลจำลองขนาดเล็กด้านล่าง: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.