统计学/线性相关

维基教科书,自由的教学读本
跳到导航 跳到搜索

线性相关的概念及其统计描述[编辑]

两个随机变量X、Y之间呈线性趋势的关系称为线性相关(linear correlation),又称简单相关(sample correlation),简称相关(correlation),线性相关的性质可由散点图直观地说明。

线性相关系数的意义及计算[编辑]

线性相关系数(linear correlation coefficient)又称Pearson积矩相关系数(Pearson product moment correlation coefficient),是定量描述两个变量间线性关系密切程度和相关方向的统计指标,其定义为
r(X,Y)=[1]
其中,Cov(X,Y)为X与Y的协方差,Var(X)为X的方差,Var(Y)为Y的方差。
当上式右端分别为总体协方差和总体方差时,左端便是总体相关系数,记为ρ。若ρ≠0,称X和Y线性相关,简称相关;若ρ=0,则称X和Y无线性相关。当上式右端分别为样本协方差和样本方差时,左端便是样本相关系数,记为r。
协方差(covariance)的定义及其含义:
当样本值为(x1,y1),(x2,y2),…,(xn,yn)时,将X和Y的样本均数分别记为
X的样本方差=
Y的样本方差=
类似地,有定义式
X和Y地样本协方差=[2]
可见,样本协方差是离均差乘积在样本中地平均。同样,离均差乘积在总体中的平均就是总体协方差。与总体方差一样,在实际中,总体协方差常常是未知的。

线性相关系数的统计推断[编辑]

线性相关分析应用中应注意的问题[编辑]

简单线性相关的样本量估算[编辑]