Pearson相关系数(Pearson Correlation Coefficient)品德与社会教学反思
Pearson’s r,称为⽪尔逊相关系数(Pearson correlation coefficient),⽤来反映两个随机变量之间的线性相关程度。 要理解⽪尔逊相关系数,⾸先要理解协⽅差(Covariance)。协⽅差可以反映两个随机变量之间的关系,如果⼀个变量跟随着另⼀个变量⼀起变⼤或者变⼩,那么这两个变量的协⽅差就是正值,就表⽰这两个变量之间呈正相关关系,反之相反。
如果协⽅差的值是个很⼤的正数,我们可以得到两个可能的结论:中国主权信用评级
(1) 两个变量之间呈很强的正相关性奥迪a86.0
细叶楠(2) 两个变量之间并没有很强的正相关性,协⽅差的值很⼤是因为X或Y的标准差很⼤
那么到底哪个结论正确呢?只要把X和Y变量的标准差,从协⽅差中剔除不就知道了吗?协⽅差能告诉我们两个随机变量之间的关系,但是却没法衡量变量之间相关性的强弱。因此,为了更好地度量两个随机变量之间的相关程度,引⼊了⽪尔逊相关系数。可以看到,⽪尔逊相关系数就是⽤协⽅差除以两个变量的标准差得到的。 代码如下:
>setwd("F:\\CSDN\\blog"女行长的沉沦