คำถามติดแท็ก pearson-r

ค่าสัมประสิทธิ์สหสัมพันธ์ขณะผลิตผลของเพียร์สันเป็นการวัดความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร X และ Yโดยให้ค่าระหว่าง +1 ถึง −1

5
วิธีการเลือกระหว่าง Pearson และ Spearman correlation
จะรู้ได้อย่างไรเมื่อต้องเลือกระหว่างสเปียร์แมนและเพียร์สันR ? ตัวแปรของฉันรวมถึงความพึงพอใจและคะแนนถูกตีความโดยใช้ผลรวมของคะแนน อย่างไรก็ตามคะแนนเหล่านี้ก็สามารถจัดอันดับρρ\rhorrr

4
เพียร์สันหรือสเปียร์แมนมีความสัมพันธ์กับข้อมูลที่ไม่ปกติ
ฉันได้รับคำถามนี้บ่อยครั้งเพียงพอในการให้คำปรึกษาด้านสถิติที่ฉันคิดว่าฉันโพสต์ไว้ที่นี่ ฉันมีคำตอบซึ่งโพสต์ด้านล่าง แต่ฉันกระตือรือร้นที่จะได้ยินสิ่งที่คนอื่นพูด คำถาม:หากคุณมีตัวแปรสองตัวที่ไม่ได้มีการแจกแจงแบบปกติคุณควรใช้ Rho ของ Spearman สำหรับความสัมพันธ์หรือไม่?

9
การถดถอยเชิงเส้นใน y กับ x กับ x กับ y แตกต่างกันอย่างไร?
สัมประสิทธิ์สหสัมพันธ์ของ Pearson ของ x และ y ไม่ว่าคุณจะคำนวณ pearson (x, y) หรือ pearson (y, x) นี่แสดงให้เห็นว่าการทำการถดถอยเชิงเส้นของ y ที่ให้ x หรือ x ที่ให้ y ควรเหมือนกัน แต่ฉันไม่คิดว่าเป็นเช่นนั้น ใครบางคนสามารถแสดงความคิดเห็นได้เมื่อความสัมพันธ์ไม่สมมาตรและวิธีการที่เกี่ยวข้องกับสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน (ซึ่งฉันคิดเสมอว่าเป็นการสรุปว่าเหมาะสมที่สุด)

3
วิธีการใช้เพียร์สันสหสัมพันธ์อย่างถูกต้องกับอนุกรมเวลา
ฉันมี 2 ซีรีย์ (ราบรื่นทั้งคู่) ที่ฉันอยากจะครอสสัมพันธ์เพื่อดูว่าพวกมันมีความสัมพันธ์กันอย่างไร ฉันตั้งใจจะใช้สัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน สิ่งนี้เหมาะสมหรือไม่ คำถามที่สองของฉันคือฉันสามารถเลือกตัวอย่าง 2 ซีรี่ส์ได้ตามต้องการ เช่นฉันสามารถเลือกจำนวนข้อมูลที่ฉันต้องการเรา สิ่งนี้จะส่งผลต่อสัมประสิทธิ์สหสัมพันธ์ที่ส่งออกหรือไม่ ฉันจำเป็นต้องพิจารณาเรื่องนี้หรือไม่? เพื่อประกอบการอธิบาย option(i) [1, 4, 7, 10] & [6, 9, 6, 9, 6] option(ii) [1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9,8,7,6]

3
การคำนวณสหสัมพันธ์ของเพียร์สันหรือสเปียร์แมนนั้นมีความหมายหรือไม่ระหว่างสองเวกเตอร์บูลีน
มีเวกเตอร์บูลีนสองตัวซึ่งมี 0 และ 1 เท่านั้น หากฉันคำนวณความสัมพันธ์ของ Pearson หรือ Spearman พวกเขามีความหมายหรือสมเหตุสมผลหรือไม่

3
หากการถดถอยเชิงเส้นสัมพันธ์กับสหสัมพันธ์ของเพียร์สันมีเทคนิคการถดถอยใด ๆ ที่เกี่ยวข้องกับสหสัมพันธ์ของเคนดัลล์และสเปียร์แมนหรือไม่?
บางทีคำถามนี้อาจไร้เดียงสา แต่: หากการถดถอยเชิงเส้นสัมพันธ์อย่างใกล้ชิดกับสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันมีเทคนิคการถดถอยใด ๆ ที่เกี่ยวข้องกับสัมประสิทธิ์สหสัมพันธ์ของเคนดัลล์และสเปียร์แมนหรือไม่?

3
การหาค่า p-pearson ในสหสัมพันธ์ p
เป็นไปได้หรือไม่ที่จะหาค่า p-pearson correlation ใน R? เพื่อค้นหาความสัมพันธ์ลูกแพร์สันฉันมักจะทำเช่นนี้ col1 = c(1,2,3,4) col2 = c(1,4,3,5) cor(col1,col2) # [1] 0.8315218 แต่ฉันจะหาค่า p ของสิ่งนี้ได้อย่างไร

2
หด VS เป็นกลาง : ประมาณของ
ในหัวของฉันมีความสับสนเกี่ยวกับตัวประมาณสองประเภทของค่าประชากรของสัมประสิทธิ์สหสัมพันธ์เพียร์สัน A. ฟิชเชอร์ (2458)แสดงให้เห็นว่าสำหรับประชากรปกติ bivariate เชิงประจักษ์คือตัวเอนเอียงของลำเอียงแม้ว่าอคติจะมีจำนวนมากพอสมควรจริงเพียงเล็กน้อยสำหรับกลุ่มตัวอย่างขนาดเล็ก ( ) ตัวอย่างดูถูกในแง่ที่ว่ามันอยู่ใกล้กับกว่า\(ยกเว้นเมื่อสมัยเป็นหรือสำหรับแล้วเป็นกลาง.) หลายเกือบประมาณเป็นกลางของได้รับการเสนอที่ดีที่สุดคนหนึ่งอาจจะเป็นOlkin และแพรตต์ (1958)ρ n &lt; 30 r ρrrrρρ\rhon&lt;30n&lt;30n<30rrrρρ\rhoρ 0 ± 1 r000ρρ\rho000±1±1\pm 1rrrρρ\rhoแก้ไข :rrr runbiased=r[1+1−r22(n−3)]runbiased=r[1+1−r22(n−3)]r_\text{unbiased} = r \left [1+\frac{1-r^2}{2(n-3)} \right ] B.มีการกล่าวกันว่าในการถดถอยพบว่าประเมินค่าประชากร R-square ที่สอดคล้องกัน หรือมีการถดถอยง่ายๆก็คือว่า overestimates 2 จากข้อเท็จจริงนั้นฉันได้เห็นข้อความมากมายที่บอกว่านั้นมีอคติเชิงบวกเมื่อเทียบกับซึ่งหมายถึงค่าสัมบูรณ์:นั้นไกลจากมากกว่า (นั่นเป็นคำสั่งจริงหรือไม่) ข้อความบอกว่ามันเป็นปัญหาเดียวกันกับการประมาณค่าเกินของค่าเบี่ยงเบนมาตรฐานโดยค่าตัวอย่าง มีหลายสูตรที่จะ "ปรับ" สังเกตใกล้กับพารามิเตอร์ประชากรของ Wherry's (1931)r 2 ρ 2 rR2R2R^2r2r2r^2ρ2ρ2\rho^2rrrr 0 ρ …

6
การทำเมทริกซ์สหสัมพันธ์ 3x3 ให้สัมประสิทธิ์สองตัวของสามตัว
ฉันถูกถามคำถามนี้ในการสัมภาษณ์ ให้บอกว่าเรามีเมทริกซ์สหสัมพันธ์ของรูปแบบ ⎡⎣⎢10.60.80.61γ0.8γ1⎤⎦⎥[10.60.80.61γ0.8γ1]\begin{bmatrix}1&0.6&0.8\\0.6&1&\gamma\\0.8&\gamma&1\end{bmatrix} ฉันถูกขอให้ค้นหาค่าของแกมม่าเนื่องจากเมทริกซ์สหสัมพันธ์นี้ ฉันคิดว่าฉันสามารถทำบางสิ่งกับค่าลักษณะเฉพาะได้เนื่องจากพวกเขาควรจะมากกว่าหรือเท่ากับ 0 (เมทริกซ์ควรเป็น semidefinite บวก) - แต่ฉันไม่คิดว่าวิธีการนี้จะให้คำตอบ ฉันไม่มีเคล็ดลับ คุณกรุณาให้คำแนะนำเพื่อแก้ปัญหาเดียวกันได้หรือไม่?

1
ตัวแปรสุ่มมีความสัมพันธ์หากว่าอันดับของพวกเขามีความสัมพันธ์กันหรือไม่
สมมติว่าเป็นตัวแปรสุ่มแบบต่อเนื่องโดยมีช่วงเวลาที่ จำกัด ประชากรรุ่นของสเปียร์แมนยศค่าสัมประสิทธิ์สหสัมพันธ์สามารถกำหนดเป็นผลิตภัณฑ์ที่ช่วงเวลาที่มีค่าสัมประสิทธิ์ρของเพียร์สันน่าจะเป็นปริพันธ์แปลงF_X (X)และF_Y (Y)ที่F_X, F_Yเป็น CDF ของXและYคือρ s F X ( X ) F Y ( Y ) F X , F Y X YX, วายX,YX,Yρsρsρ_sFX( X)FX(X)F_X(X)FY( Y)FY(Y)F_Y(Y)FX, FYFX,FYF_X,F_YXXXYYY ρs( X, วาย) = ρ ( F( X) , F( Y) )ρs(X,Y)=ρ(F(X),F(Y))ρ_s(X,Y)=ρ(F(X),F(Y))(Y)) ฉันสงสัยว่าคนทั่วไปสามารถสรุปได้หรือไม่ ρ (X, วาย) ≠ 0 ↔ ρ …

3
เพียร์สันเป็นพารามิเตอร์ทำไมและ Spearman ไม่ใช่พารามิเตอร์
เห็นได้ชัดว่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันเป็นพารามิเตอร์และโรของสเปียร์แมนไม่ใช่พารามิเตอร์ ฉันมีปัญหาในการเข้าใจสิ่งนี้ ตามที่ฉันเข้าใจแล้ว Pearson คำนวณเป็น และคำนวณ Spearman ด้วยวิธีเดียวกันยกเว้นเราแทนที่ค่าทั้งหมดด้วยอันดับของพวกเขาrxy=cov(X,Y)σxσyrxy=cov(X,Y)σxσy r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} Wikipedia พูดว่า ความแตกต่างระหว่างโมเดลพารามิเตอร์และโมเดลที่ไม่ใช่พารามิเตอร์คืออดีตมีพารามิเตอร์จำนวนคงที่ในขณะที่รุ่นหลังจะเพิ่มจำนวนพารามิเตอร์ด้วยจำนวนข้อมูลการฝึกอบรม แต่ฉันไม่เห็นพารามิเตอร์ใด ๆ ยกเว้นกลุ่มตัวอย่างเอง บางคนบอกว่าการทดสอบพาราเมทริกถือว่าการแจกแจงแบบปกติและบอกต่อไปว่าเพียร์สันถือว่าข้อมูลการแจกแจงแบบปกติ แต่ฉันล้มเหลวที่จะดูว่าทำไมเพียร์สันถึงต้องการ ดังนั้นคำถามของฉันคืออะไรที่ทำให้พารามิเตอร์และไม่ใช่พารามิเตอร์ในบริบทของสถิติ? เพียร์สันกับสเปียร์แมนพอดีกันยังไง

3
ความคล้ายคลึงของ Pearson สหสัมพันธ์สำหรับ 3 ตัวแปร
ฉันสนใจว่า "ความสัมพันธ์" ของตัวแปรสามตัวเป็นอะไรหรือไม่และถ้าเป็นเช่นนั้นจะเป็นอย่างไร ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน E{(X−μX)(Y−μY)}Var(X)Var(Y)−−−−−−−−−−−−√E{(X−μX)(Y−μY)}Var(X)Var(Y)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)\}}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}} ตอนนี้คำถามสำหรับ 3 ตัวแปร: คือ E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)−−−−−−−−−−−−−−−−−−√E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)(Z-\mu_Z)\}} {\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)\mathrm{Var}(Z)}} อะไร? ใน R ดูเหมือนว่าสิ่งที่ตีความได้: &gt; a &lt;- rnorm(100); b &lt;- rnorm(100); c &lt;- rnorm(100) &gt; mean((a-mean(a)) * (b-mean(b)) * (c-mean(c))) / (sd(a) * sd(b) * sd(c)) [1] -0.3476942 ปกติแล้วเราจะดูความสัมพันธ์ระหว่าง 2 ตัวแปรที่กำหนดค่าคงที่ของตัวแปรที่สาม มีคนอธิบายไหม

2
จะตีความสัมประสิทธิ์สหสัมพันธ์ของแมทธิวได้อย่างไร?
คำตอบสำหรับคำถามความสัมพันธ์ระหว่างค่าสัมประสิทธิ์สหสัมพันธ์, แมตทิวส์และเพียร์สัน? แสดงให้เห็นว่าทั้งสามวิธีสัมประสิทธิ์เทียบเท่า ฉันไม่ได้มาจากสถิติดังนั้นมันควรเป็นคำถามง่าย ๆ กระดาษ Matthews (www.sciencedirect.com/science/article/pii/0005279575901099) อธิบายสิ่งต่อไปนี้: "A correlation of: C = 1 indicates perfect agreement, C = 0 is expected for a prediction no better than random, and C = -1 indicates total disagreement between prediction and observation"`. ตามที่ Wikipedia ( http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient ) ความสัมพันธ์ของเพียร์สันถูกอธิบายว่า: giving a value …

2
ทำไมเพียร์สันρเป็นเพียงตัวชี้วัดของความสัมพันธ์ที่ละเอียดถี่ถ้วนหากการกระจายข้อต่อเป็นหลายตัวแปรปกติ?
การยืนยันนี้เกิดขึ้นจากการตอบคำถามสูงสุดของคำถามนี้ ฉันคิดว่าคำถาม 'ทำไม' แตกต่างกันพอสมควรที่จะรับประกันเธรดใหม่ Googling "การวัดความสัมพันธ์ครบถ้วนสมบูรณ์" ไม่ได้สร้างความนิยมใด ๆ และฉันไม่แน่ใจว่าวลีนั้นหมายถึงอะไร

1
จะเข้าใจสูตรสัมประสิทธิ์สหสัมพันธ์ได้อย่างไร
ทุกคนสามารถช่วยฉันเข้าใจสูตรสหสัมพันธ์ของเพียร์สันได้ไหม ตัวอย่างrrr = ค่าเฉลี่ยของผลิตภัณฑ์ของคะแนนมาตรฐานของตัวแปรXXXและYYYY ฉันเข้าใจว่าทำไมพวกเขาต้องสร้างมาตรฐานXXXและYYYแต่จะเข้าใจผลิตภัณฑ์ของทั้งสองคะแนนได้อย่างไร สูตรนี้เรียกอีกอย่างว่า "สัมประสิทธิ์สหสัมพันธ์ของโมเมนต์ผลิตภัณฑ์" แต่เหตุผลในการดำเนินการของผลิตภัณฑ์คืออะไร ฉันไม่แน่ใจว่าฉันได้ทำคำถามของฉันชัดเจนหรือไม่ แต่ฉันต้องการที่จะจำสูตรอย่างสังหรณ์ใจ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.