跳至內容

數理統計/隨機樣本與統計量

維基教科書,自由的教學讀本

數理統計/隨機樣本與統計量

[編輯]

學習目標

[編輯]
目標項 內容
隨機樣本的定義 獨立同分布樣本、樣本路徑、樣本空間
統計量概念 僅由樣本構成、無未知參數
抽樣分布 樣本均值、樣本方差、比率與差的分布
側重能力 說明
構造統計量 針對目標參數設計合適統計量
推導分布 運用變換與獨立性求抽樣分布
近似與極限定理 大樣本下的正態近似與t近似
常見誤區 對策
把含未知參數的量當統計量 檢查是否僅含樣本
忽略自由度 樣本方差分母應為
誤用正態近似 明確樣本量與條件是否滿足

基本定義

[編輯]
隨機樣本
為來自同一分布 的獨立同分布變量,稱為大小為 的隨機樣本。
統計量
由樣本 構成、不含未知參數的函數
常見統計量
樣本均值 ;樣本方差 ;樣本中位數、樣本分位數等。
概念 數學表達 說明
隨機樣本 相互獨立且同分布
統計量 不含未知參數
樣本均值 集中趨勢
定義 備註
樣本方差 無偏性更好
樣本標準差 尺度與原量一致
k分位數 使得比例為k的數值 用順序統計量定義
判斷 是統計量? 原因
僅由樣本構成
僅由樣本構成
含未知參數

順序統計量

[編輯]
定義
將樣本從小到大排序得 ,稱為順序統計量。
典型量
最小值 ,最大值 ,中位數
順序統計量 含義 應用
最小值 可靠性、極端事件
最大值 閾值設定
中位數 居中位置 抗異常值
關係 形式 說明
極差 離散程度粗指標
四分位距 穩健尺度
分位函數 分布特徵
注意點 影響
樣本量小 分位數波動大
重複值多 排序並列處理
偏態分布 中位數優於均值

樣本均值與樣本方差

[編輯]
均值的期望與方差
,則
方差的無偏性
期望 方差 備註
集中性隨 增強
依賴四階矩 無偏估計
略有偏 複雜 常用作尺度
場景 近似 條件
大樣本 近似正態 中心極限定理
正態母體 正態、 獨立同分布正態
不確定方差 用t分布 方差未知
實操要點 說明
報告均值±標準誤 標準誤為
同時給出中位數 抗異常值
作圖檢查 直方圖、箱線圖

抽樣分布(正態母體情形)

[編輯]
獨立同分布。
;且 相互獨立。
構造
統計量 分布 自由度/參數
正態 均值 ,方差
卡方
t
結論 用途 備註
獨立 推導t分布 正態下的特性
t分布較肥尾 小樣本更穩健 自由度越大越接近正態
卡方分布可構造區間 方差區間估計 依賴正態假設
檢查條件 否則改用
正態性 非參數或變換
獨立性 分組或建模相關性
無異常值 穩健統計量

比例與差值的統計量

[編輯]
比例
為成敗變量,成功機率為 ,樣本比例 ,有
兩獨立樣本均值差
的期望為 ,方差為 (獨立)。
統計量 期望 方差 近似分布
大樣本正態
條件滿足時正態或t
兩比例差 正態近似
情形 標準誤 說明
單比例 正態近似時使用
兩均值(方差相等) 合併方差 t檢驗框架
兩均值(方差不等) Welch 標準誤 自由度調整
注意點 處理
比例極端 正態近似差 用精確方法或變換
樣本不獨立 配對設計 用差值法
方差異質 使用穩健或Welch方法 避免錯誤結論

例子:以「挖礦掉率」為背景的小練習

[編輯]
場景
某資源塊掉落稀有物的機率為 。獨立挖掘 次,得到的稀有物個數 ,樣本比例 作為 的估計。
表達式 期望/方差
計數
比例
標準誤 估計不確定性
近似條件 經驗規則 說明
正態近似 兩端不極端
小樣本 精確方法 二項精確
相關性 不滿足獨立 需調整
輸出 解釋
點估計 直觀頻率
區間估計 覆蓋真實機率
置信水平 覆蓋率聲明

章節測驗

[編輯]
單選題一
問:下列哪一個是統計量?
顯示答案/解析
答案:。其餘含未知參數或直接為總體參數。
單選題二
問:樣本方差 的分母取 的主要目的是什麼?
  1. 計算方便
  2. 使其為總體方差的無偏估計
  3. 使其更小
  4. 與標準差配套
顯示答案/解析
答案:使其為總體方差的無偏估計。
判斷題
斷言:正態母體下, 獨立。
顯示答案/解析
答案:對。這一性質用於構造t分布。
計算小問(可選)
已知獨立樣本量 ,觀測到 ,給出比例的標準誤。
顯示答案/解析
標準誤


跨章導航

[編輯]
跳轉 頁面
上一節 機率論複習
下一節 點估計
返回目錄 目錄