跳至內容

數理統計/假設檢驗基礎

維基教科書,自由的教學讀本

數理統計/假設檢驗基礎

[編輯]

學習目標

[編輯]
目標項 內容
假設框架 原假設、備擇假設、檢驗統計量、拒絕域
錯誤類型 第一類錯誤、第二類錯誤、檢驗功效
常見檢驗 均值、方差、比例與兩樣本檢驗
側重能力 說明
構造統計量 使用樞軸量或似然比
控制顯著性 給定 設計拒絕域
計算功效 評估樣本量與效應大小
常見誤區 對策
把 p 值當成原假設為真的概率 解釋為在原假設下的數據極端度
僅看顯著不看效應與區間 同時報效應大小與置信區間
多重比較未校正 採用校正或預註冊

基本概念

[編輯]
假設
原假設 與備擇 。選擇顯著性水平 與檢驗統計量 ,定義拒絕域
p 值
為真時,觀測到不少於當前極端的統計量的概率。若 ,拒絕
概念 記號 含義
第一類錯誤 拒真
第二類錯誤 受假
功效 拒假成功概率
結果呈現 規範 提示
p 值 精確或閾值(如 < 0.05) 給出方法與雙/單側
效應大小 差值/比值/標準化量 結合置信區間
前提條件 分布、獨立、方差同質等 必要時穩健替代

單總體檢驗

[編輯]
均值(方差已知,正態或大樣本)
,雙側拒絕域
均值(方差未知,正態)
,雙側拒絕域
方差(正態)
,按單/雙側給出拒絕域。
比例(大樣本)
目標 統計量 分布 備註
均值-已知方差 正態 亦作近似
均值-未知方差 正態前提
方差 比例化 正態前提
比例 正態近似 樣本量要求

兩總體檢驗

[編輯]
兩均值差
方差相等時用合併方差 t;不等方差時用不等方差 t(自由度近似)。
兩方差比
,據單/雙側設拒絕域。
兩比例差
,大樣本下 ,其中 為合併比例(用於原假設 )。
目標 條件 統計量/分布
均值差 正態/大樣本;獨立 t 檢驗
方差比 正態;獨立 F 檢驗
比例差 樣本量適中偏大 Z 檢驗(合併比例)

p 值與功效

[編輯]
p 值計算
根據檢驗統計量在 下的分布計算尾部概率,雙側需乘以 2 或對稱處理。
功效分析
給定效應大小與樣本量,計算 ;反過來可據目標功效求所需樣本量。
要素 作用 提示
效應大小 決定功效 標準化差/比值
樣本量 提升功效 代價與可行性
顯著性 控制一類錯 常見 0.05/0.01

決策與報告

[編輯]
同時報告 p 值、效應大小與置信區間,說明假設與方法。避免「僅顯著」的結論。
報告項 示例(範式) 說明
統計量與自由度 明確分布信息
p 值 精確或閾值
區間 95% 區間: 與顯著性互證

章節測驗

[編輯]
單選題一
下列哪種說法正確?
  1. p 值等於原假設為真的概率
  2. ,應拒絕
  3. p 值越大越說明備擇為真
  4. 只要樣本大就一定顯著
顯示答案/解析
答案:2。p 值是數據在 下的極端度量。
單選題二
比較兩總體方差常用統計量是:
顯示答案/解析
答案:2。
計算題
某單樣本 t 檢驗,,求雙側檢驗的統計量與是否在 下拒絕。
顯示答案/解析
解:,自由度 24;臨界值 ,不拒絕

跨章導航

[編輯]
跳轉 頁面
上一節 區間估計
下一節 充分統計量與Rao–Blackwell
返回目錄 目錄