數理統計/假設檢驗基礎
外觀
< 数理统计
數理統計/假設檢驗基礎
[編輯]學習目標
[編輯]| 目標項 | 內容 |
|---|---|
| 假設框架 | 原假設、備擇假設、檢驗統計量、拒絕域 |
| 錯誤類型 | 第一類錯誤、第二類錯誤、檢驗功效 |
| 常見檢驗 | 均值、方差、比例與兩樣本檢驗 |
| 側重能力 | 說明 |
|---|---|
| 構造統計量 | 使用樞軸量或似然比 |
| 控制顯著性 | 給定 設計拒絕域 |
| 計算功效 | 評估樣本量與效應大小 |
| 常見誤區 | 對策 |
|---|---|
| 把 p 值當成原假設為真的概率 | 解釋為在原假設下的數據極端度 |
| 僅看顯著不看效應與區間 | 同時報效應大小與置信區間 |
| 多重比較未校正 | 採用校正或預註冊 |
基本概念
[編輯]- 假設
- 原假設 與備擇 。選擇顯著性水平 與檢驗統計量 ,定義拒絕域 。
- p 值
- 在 為真時,觀測到不少於當前極端的統計量的概率。若 ,拒絕 。
| 概念 | 記號 | 含義 |
|---|---|---|
| 第一類錯誤 | 拒真 | |
| 第二類錯誤 | 受假 | |
| 功效 | 拒假成功概率 |
| 結果呈現 | 規範 | 提示 |
|---|---|---|
| p 值 | 精確或閾值(如 < 0.05) | 給出方法與雙/單側 |
| 效應大小 | 差值/比值/標準化量 | 結合置信區間 |
| 前提條件 | 分布、獨立、方差同質等 | 必要時穩健替代 |
單總體檢驗
[編輯]- 均值(方差已知,正態或大樣本)
- ,雙側拒絕域 。
- 均值(方差未知,正態)
- ,雙側拒絕域 。
- 方差(正態)
- ,按單/雙側給出拒絕域。
- 比例(大樣本)
- ,。
| 目標 | 統計量 | 分布 | 備註 |
|---|---|---|---|
| 均值-已知方差 | 正態 | 亦作近似 | |
| 均值-未知方差 | 正態前提 | ||
| 方差 | 比例化 | 正態前提 | |
| 比例 | 正態近似 | 樣本量要求 |
兩總體檢驗
[編輯]- 兩均值差
- 方差相等時用合併方差 t;不等方差時用不等方差 t(自由度近似)。
- 兩方差比
- ,據單/雙側設拒絕域。
- 兩比例差
- ,大樣本下 ,其中 為合併比例(用於原假設 )。
| 目標 | 條件 | 統計量/分布 |
|---|---|---|
| 均值差 | 正態/大樣本;獨立 | t 檢驗 |
| 方差比 | 正態;獨立 | F 檢驗 |
| 比例差 | 樣本量適中偏大 | Z 檢驗(合併比例) |
p 值與功效
[編輯]- p 值計算
- 根據檢驗統計量在 下的分布計算尾部概率,雙側需乘以 2 或對稱處理。
- 功效分析
- 給定效應大小與樣本量,計算 ;反過來可據目標功效求所需樣本量。
| 要素 | 作用 | 提示 |
|---|---|---|
| 效應大小 | 決定功效 | 標準化差/比值 |
| 樣本量 | 提升功效 | 代價與可行性 |
| 顯著性 | 控制一類錯 | 常見 0.05/0.01 |
決策與報告
[編輯]- 同時報告 p 值、效應大小與置信區間,說明假設與方法。避免「僅顯著」的結論。
| 報告項 | 示例(範式) | 說明 |
|---|---|---|
| 統計量與自由度 | 明確分布信息 | |
| p 值 | 精確或閾值 | |
| 區間 | 95% 區間: | 與顯著性互證 |
章節測驗
[編輯]- 單選題一
- 下列哪種說法正確?
- p 值等於原假設為真的概率
- 若 且 ,應拒絕
- p 值越大越說明備擇為真
- 只要樣本大就一定顯著
顯示答案/解析
答案:2。p 值是數據在 下的極端度量。
- 單選題二
- 比較兩總體方差常用統計量是:
顯示答案/解析
答案:2。
- 計算題
- 某單樣本 t 檢驗,,,,,求雙側檢驗的統計量與是否在 下拒絕。
顯示答案/解析
解:,自由度 24;臨界值 ,不拒絕 。
跨章導航
[編輯]| 跳轉 | 頁面 |
|---|---|
| 上一節 | 區間估計 |
| 下一節 | 充分統計量與Rao–Blackwell |
| 返回目錄 | 目錄 |