数理统计/假设检验基础
外观
< 数理统计
数理统计/假设检验基础
[编辑]学习目标
[编辑]| 目标项 | 内容 |
|---|---|
| 假设框架 | 原假设、备择假设、检验统计量、拒绝域 |
| 错误类型 | 第一类错误、第二类错误、检验功效 |
| 常见检验 | 均值、方差、比例与两样本检验 |
| 侧重能力 | 说明 |
|---|---|
| 构造统计量 | 使用枢轴量或似然比 |
| 控制显著性 | 给定 设计拒绝域 |
| 计算功效 | 评估样本量与效应大小 |
| 常见误区 | 对策 |
|---|---|
| 把 p 值当成原假设为真的概率 | 解释为在原假设下的数据极端度 |
| 仅看显著不看效应与区间 | 同时报效应大小与置信区间 |
| 多重比较未校正 | 采用校正或预注册 |
基本概念
[编辑]- 假设
- 原假设 与备择 。选择显著性水平 与检验统计量 ,定义拒绝域 。
- p 值
- 在 为真时,观测到不少于当前极端的统计量的概率。若 ,拒绝 。
| 概念 | 记号 | 含义 |
|---|---|---|
| 第一类错误 | 拒真 | |
| 第二类错误 | 受假 | |
| 功效 | 拒假成功概率 |
| 结果呈现 | 规范 | 提示 |
|---|---|---|
| p 值 | 精确或阈值(如 < 0.05) | 给出方法与双/单侧 |
| 效应大小 | 差值/比值/标准化量 | 结合置信区间 |
| 前提条件 | 分布、独立、方差同质等 | 必要时稳健替代 |
单总体检验
[编辑]- 均值(方差已知,正态或大样本)
- ,双侧拒绝域 。
- 均值(方差未知,正态)
- ,双侧拒绝域 。
- 方差(正态)
- ,按单/双侧给出拒绝域。
- 比例(大样本)
- ,。
| 目标 | 统计量 | 分布 | 备注 |
|---|---|---|---|
| 均值-已知方差 | 正态 | 亦作近似 | |
| 均值-未知方差 | 正态前提 | ||
| 方差 | 比例化 | 正态前提 | |
| 比例 | 正态近似 | 样本量要求 |
两总体检验
[编辑]- 两均值差
- 方差相等时用合并方差 t;不等方差时用不等方差 t(自由度近似)。
- 两方差比
- ,据单/双侧设拒绝域。
- 两比例差
- ,大样本下 ,其中 为合并比例(用于原假设 )。
| 目标 | 条件 | 统计量/分布 |
|---|---|---|
| 均值差 | 正态/大样本;独立 | t 检验 |
| 方差比 | 正态;独立 | F 检验 |
| 比例差 | 样本量适中偏大 | Z 检验(合并比例) |
p 值与功效
[编辑]- p 值计算
- 根据检验统计量在 下的分布计算尾部概率,双侧需乘以 2 或对称处理。
- 功效分析
- 给定效应大小与样本量,计算 ;反过来可据目标功效求所需样本量。
| 要素 | 作用 | 提示 |
|---|---|---|
| 效应大小 | 决定功效 | 标准化差/比值 |
| 样本量 | 提升功效 | 代价与可行性 |
| 显著性 | 控制一类错 | 常见 0.05/0.01 |
决策与报告
[编辑]- 同时报告 p 值、效应大小与置信区间,说明假设与方法。避免“仅显著”的结论。
| 报告项 | 示例(范式) | 说明 |
|---|---|---|
| 统计量与自由度 | 明确分布信息 | |
| p 值 | 精确或阈值 | |
| 区间 | 95% 区间: | 与显著性互证 |
章节测验
[编辑]- 单选题一
- 下列哪种说法正确?
- p 值等于原假设为真的概率
- 若 且 ,应拒绝
- p 值越大越说明备择为真
- 只要样本大就一定显著
显示答案/解析
答案:2。p 值是数据在 下的极端度量。
- 单选题二
- 比较两总体方差常用统计量是:
显示答案/解析
答案:2。
- 计算题
- 某单样本 t 检验,,,,,求双侧检验的统计量与是否在 下拒绝。
显示答案/解析
解:,自由度 24;临界值 ,不拒绝 。
跨章导航
[编辑]| 跳转 | 页面 |
|---|---|
| 上一节 | 区间估计 |
| 下一节 | 充分统计量与Rao–Blackwell |
| 返回目录 | 目录 |