統計學/线性相关
外观
< 統計學
线性相关的概念及其统计描述
[编辑]两个随机变量X、Y之间呈线性趋势的关系称为线性相关(linear correlation),又称简单相关(sample correlation),简称相关(correlation),线性相关的性质可由散点图直观地说明。
线性相关系数的意义及计算
[编辑]线性相关系数(linear correlation coefficient)又称Pearson积矩相关系数(Pearson product moment correlation coefficient),是定量描述两个变量间线性关系密切程度和相关方向的统计指标,其定义为
r(X,Y)=[1]
其中,Cov(X,Y)为X与Y的协方差,Var(X)为X的方差,Var(Y)为Y的方差。
当上式右端分别为总体协方差和总体方差时,左端便是总体相关系数,记为ρ。若ρ≠0,称X和Y线性相关,简称相关;若ρ=0,则称X和Y无线性相关。当上式右端分别为样本协方差和样本方差时,左端便是样本相关系数,记为r。
协方差(covariance)的定义及其含义:
当样本值为(x1,y1),(x2,y2),…,(xn,yn)时,将X和Y的样本均数分别记为和,
X的样本方差=
Y的样本方差=
类似地,有定义式
X和Y地样本协方差=[2]
可见,样本协方差是离均差乘积在样本中地平均。同样,离均差乘积在总体中的平均就是总体协方差。与总体方差一样,在实际中,总体协方差常常是未知的。