跳转到内容

统计学/抽样分布与抽样误差

维基教科书,自由的教学读本

从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差(sampling error)。从同一总体随机抽取若干份样本,所得样本统计量之间也不尽相同,这也是抽样误差的表现。抽样误差是不可避免的,但抽样误差是有规律的,而且是可以被认识的。

样本均数的抽样分布与抽样误差[编辑]

在服从正态分布的总体中进行随机抽样,样本均数的抽样分布具有以下特点:

  • 样本均数恰好等于总体均数是及其罕见的;
  • 样本均数之间存在差异;
  • 样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布;
  • 样本均数之间的变异明显小于原始变量值之间的变异。

样本均数的标准差,通常称为均数的标准误(standard error of mean, SEM或SE),可用于反映均数抽样误差的大小。
根据数理统计学原理,若随机变量X的均数为μ,方差为σ2,则样本均数的均数仍为μ,样本均数的标准差,即均数的标准误为:

又根据正态分布原理,若随机变量X服从正态分布,则样本均数也服从正态分布,因此,若随机变量X~N(μ,σ2),则样本均数~N(μ,

样本频率的抽样分布与抽样误差[编辑]