Comment on sample correlation. In comparing two small independent samples
of the same size, the sample
correlation is often noticeably different from r=0. [Nothing here contradicts @OmG's Answer (+1) on the population correlation ρ.]
Consider correlations between a million pairs of independent
samples of size n=5 from the exponential distribution with rate 1.
set.seed(616)
r = replicate( 10^6, cor(rexp(5), rexp(5)) )
mean(abs(r) > .5)
[1] 0.386212
mean(r)
[1] -0.0005904455
hist(r, prob=T, br=40, col="skyblue2")
abline(v=c(-.5,.5), col="red", lwd=2)
For example, here is the scatterplot of first of the million pairs of samples of size 5, for which
r=−0.5716.
ไม่มีอะไรพิเศษเกี่ยวกับการแจกแจงแบบเอ็กซ์โพเนนเชียลในเรื่องนี้ การเปลี่ยนการกระจายพาเรนต์เป็นมาตรฐานปกติให้ผลลัพธ์ดังต่อไปนี้
set.seed(2019)
...
mean(abs(r) > .5)
[1] 0.391061
mean(r)
[1] 1.43269e-05
ในทางตรงกันข้ามนี่คือฮิสโตแกรมที่สัมพันธ์กันของคู่ตัวอย่างขนาดปกติ n = 20
หมายเหตุ:หน้าอื่น ๆ ในเว็บไซต์นี้กล่าวถึงการกระจายRในรายละเอียดเพิ่มเติม หนึ่งในนั้นคือQ & A