統計學/線性相關

維基教科書,自由的教學讀本

線性相關的概念及其統計描述[編輯]

兩個隨機變量X、Y之間呈線性趨勢的關係稱為線性相關(linear correlation),又稱簡單相關(sample correlation),簡稱相關(correlation),線性相關的性質可由散點圖直觀地說明。

線性相關係數的意義及計算[編輯]

線性相關係數(linear correlation coefficient)又稱Pearson積矩相關係數(Pearson product moment correlation coefficient),是定量描述兩個變量間線性關係密切程度和相關方向的統計指標,其定義為
r(X,Y)=[1]
其中,Cov(X,Y)為X與Y的協方差,Var(X)為X的方差,Var(Y)為Y的方差。
當上式右端分別為總體協方差和總體方差時,左端便是總體相關係數,記為ρ。若ρ≠0,稱X和Y線性相關,簡稱相關;若ρ=0,則稱X和Y無線性相關。當上式右端分別為樣本協方差和樣本方差時,左端便是樣本相關係數,記為r。
協方差(covariance)的定義及其含義:
當樣本值為(x1,y1),(x2,y2),…,(xn,yn)時,將X和Y的樣本均數分別記為
X的樣本方差=
Y的樣本方差=
類似地,有定義式
X和Y地樣本協方差=[2]
可見,樣本協方差是離均差乘積在樣本中地平均。同樣,離均差乘積在總體中的平均就是總體協方差。與總體方差一樣,在實際中,總體協方差常常是未知的。

線性相關係數的統計推斷[編輯]

線性相關分析應用中應注意的問題[編輯]

簡單線性相關的樣本量估算[編輯]