跳转到内容

数理统计/假设检验基础

维基教科书,自由的教学读本

数理统计/假设检验基础

[编辑]

学习目标

[编辑]
目标项 内容
假设框架 原假设、备择假设、检验统计量、拒绝域
错误类型 第一类错误、第二类错误、检验功效
常见检验 均值、方差、比例与两样本检验
侧重能力 说明
构造统计量 使用枢轴量或似然比
控制显著性 给定 设计拒绝域
计算功效 评估样本量与效应大小
常见误区 对策
把 p 值当成原假设为真的概率 解释为在原假设下的数据极端度
仅看显著不看效应与区间 同时报效应大小与置信区间
多重比较未校正 采用校正或预注册

基本概念

[编辑]
假设
原假设 与备择 。选择显著性水平 与检验统计量 ,定义拒绝域
p 值
为真时,观测到不少于当前极端的统计量的概率。若 ,拒绝
概念 记号 含义
第一类错误 拒真
第二类错误 受假
功效 拒假成功概率
结果呈现 规范 提示
p 值 精确或阈值(如 < 0.05) 给出方法与双/单侧
效应大小 差值/比值/标准化量 结合置信区间
前提条件 分布、独立、方差同质等 必要时稳健替代

单总体检验

[编辑]
均值(方差已知,正态或大样本)
,双侧拒绝域
均值(方差未知,正态)
,双侧拒绝域
方差(正态)
,按单/双侧给出拒绝域。
比例(大样本)
目标 统计量 分布 备注
均值-已知方差 正态 亦作近似
均值-未知方差 正态前提
方差 比例化 正态前提
比例 正态近似 样本量要求

两总体检验

[编辑]
两均值差
方差相等时用合并方差 t;不等方差时用不等方差 t(自由度近似)。
两方差比
,据单/双侧设拒绝域。
两比例差
,大样本下 ,其中 为合并比例(用于原假设 )。
目标 条件 统计量/分布
均值差 正态/大样本;独立 t 检验
方差比 正态;独立 F 检验
比例差 样本量适中偏大 Z 检验(合并比例)

p 值与功效

[编辑]
p 值计算
根据检验统计量在 下的分布计算尾部概率,双侧需乘以 2 或对称处理。
功效分析
给定效应大小与样本量,计算 ;反过来可据目标功效求所需样本量。
要素 作用 提示
效应大小 决定功效 标准化差/比值
样本量 提升功效 代价与可行性
显著性 控制一类错 常见 0.05/0.01

决策与报告

[编辑]
同时报告 p 值、效应大小与置信区间,说明假设与方法。避免“仅显著”的结论。
报告项 示例(范式) 说明
统计量与自由度 明确分布信息
p 值 精确或阈值
区间 95% 区间: 与显著性互证

章节测验

[编辑]
单选题一
下列哪种说法正确?
  1. p 值等于原假设为真的概率
  2. ,应拒绝
  3. p 值越大越说明备择为真
  4. 只要样本大就一定显著
显示答案/解析
答案:2。p 值是数据在 下的极端度量。
单选题二
比较两总体方差常用统计量是:
显示答案/解析
答案:2。
计算题
某单样本 t 检验,,求双侧检验的统计量与是否在 下拒绝。
显示答案/解析
解:,自由度 24;临界值 ,不拒绝

跨章导航

[编辑]
跳转 页面
上一节 区间估计
下一节 充分统计量与Rao–Blackwell
返回目录 目录