數理統計/隨機樣本與統計量
外觀
< 数理统计
數理統計/隨機樣本與統計量
[編輯]學習目標
[編輯]| 目標項 | 內容 |
|---|---|
| 隨機樣本的定義 | 獨立同分布樣本、樣本路徑、樣本空間 |
| 統計量概念 | 僅由樣本構成、無未知參數 |
| 抽樣分布 | 樣本均值、樣本方差、比率與差的分布 |
| 側重能力 | 說明 |
|---|---|
| 構造統計量 | 針對目標參數設計合適統計量 |
| 推導分布 | 運用變換與獨立性求抽樣分布 |
| 近似與極限定理 | 大樣本下的正態近似與t近似 |
| 常見誤區 | 對策 |
|---|---|
| 把含未知參數的量當統計量 | 檢查是否僅含樣本 |
| 忽略自由度 | 樣本方差分母應為 |
| 誤用正態近似 | 明確樣本量與條件是否滿足 |
基本定義
[編輯]- 隨機樣本
- 為來自同一分布 的獨立同分布變量,稱為大小為 的隨機樣本。
- 統計量
- 由樣本 構成、不含未知參數的函數 。
- 常見統計量
- 樣本均值 ;樣本方差 ;樣本中位數、樣本分位數等。
| 概念 | 數學表達 | 說明 |
|---|---|---|
| 隨機樣本 | 相互獨立且同分布 | |
| 統計量 | 不含未知參數 | |
| 樣本均值 | 集中趨勢 |
| 量 | 定義 | 備註 |
|---|---|---|
| 樣本方差 | 無偏性更好 | |
| 樣本標準差 | 尺度與原量一致 | |
| k分位數 | 使得比例為k的數值 | 用順序統計量定義 |
| 判斷 | 是統計量? | 原因 |
|---|---|---|
| 是 | 僅由樣本構成 | |
| 是 | 僅由樣本構成 | |
| 否 | 含未知參數 |
順序統計量
[編輯]- 定義
- 將樣本從小到大排序得 ,稱為順序統計量。
- 典型量
- 最小值 ,最大值 ,中位數 。
| 順序統計量 | 含義 | 應用 |
|---|---|---|
| 最小值 | 可靠性、極端事件 | |
| 最大值 | 閾值設定 | |
| 中位數 | 居中位置 | 抗異常值 |
| 關係 | 形式 | 說明 |
|---|---|---|
| 極差 | 離散程度粗指標 | |
| 四分位距 | 穩健尺度 | |
| 分位函數 | 分布特徵 |
| 注意點 | 影響 |
|---|---|
| 樣本量小 | 分位數波動大 |
| 重複值多 | 排序並列處理 |
| 偏態分布 | 中位數優於均值 |
樣本均值與樣本方差
[編輯]- 均值的期望與方差
- 若 ,則 ,。
- 方差的無偏性
- 。
| 量 | 期望 | 方差 | 備註 |
|---|---|---|---|
| 集中性隨 增強 | |||
| 依賴四階矩 | 無偏估計 | ||
| 略有偏 | 複雜 | 常用作尺度 |
| 場景 | 近似 | 條件 |
|---|---|---|
| 大樣本 | 近似正態 | 中心極限定理 |
| 正態母體 | 正態、 | 獨立同分布正態 |
| 不確定方差 | 用t分布 | 方差未知 |
| 實操要點 | 說明 |
|---|---|
| 報告均值±標準誤 | 標準誤為 |
| 同時給出中位數 | 抗異常值 |
| 作圖檢查 | 直方圖、箱線圖 |
抽樣分布(正態母體情形)
[編輯]- 設 獨立同分布。
- 則 ;;且 與 相互獨立。
- 構造 。
| 統計量 | 分布 | 自由度/參數 |
|---|---|---|
| 正態 | 均值 ,方差 | |
| 卡方 | ||
| t |
| 結論 | 用途 | 備註 |
|---|---|---|
| 與 獨立 | 推導t分布 | 正態下的特性 |
| t分布較肥尾 | 小樣本更穩健 | 自由度越大越接近正態 |
| 卡方分布可構造區間 | 方差區間估計 | 依賴正態假設 |
| 檢查條件 | 否則改用 |
|---|---|
| 正態性 | 非參數或變換 |
| 獨立性 | 分組或建模相關性 |
| 無異常值 | 穩健統計量 |
比例與差值的統計量
[編輯]- 比例
- 設 為成敗變量,成功機率為 ,樣本比例 ,有 ,。
- 兩獨立樣本均值差
- 的期望為 ,方差為 (獨立)。
| 統計量 | 期望 | 方差 | 近似分布 |
|---|---|---|---|
| 大樣本正態 | |||
| 條件滿足時正態或t | |||
| 兩比例差 | 正態近似 |
| 情形 | 標準誤 | 說明 |
|---|---|---|
| 單比例 | 正態近似時使用 | |
| 兩均值(方差相等) | 合併方差 | t檢驗框架 |
| 兩均值(方差不等) | Welch 標準誤 | 自由度調整 |
| 注意點 | 處理 | |
|---|---|---|
| 比例極端 | 正態近似差 | 用精確方法或變換 |
| 樣本不獨立 | 配對設計 | 用差值法 |
| 方差異質 | 使用穩健或Welch方法 | 避免錯誤結論 |
例子:以「挖礦掉率」為背景的小練習
[編輯]- 場景
- 某資源塊掉落稀有物的機率為 。獨立挖掘 次,得到的稀有物個數 ,樣本比例 作為 的估計。
| 量 | 表達式 | 期望/方差 |
|---|---|---|
| 計數 | , | |
| 比例 | , | |
| 標準誤 | 估計不確定性 |
| 近似條件 | 經驗規則 | 說明 |
|---|---|---|
| 正態近似 | 且 | 兩端不極端 |
| 小樣本 | 精確方法 | 二項精確 |
| 相關性 | 不滿足獨立 | 需調整 |
| 輸出 | 解釋 |
|---|---|
| 點估計 | 直觀頻率 |
| 區間估計 | 覆蓋真實機率 |
| 置信水平 | 覆蓋率聲明 |
章節測驗
[編輯]- 單選題一
- 問:下列哪一個是統計量?
顯示答案/解析
答案:。其餘含未知參數或直接為總體參數。
- 單選題二
- 問:樣本方差 的分母取 的主要目的是什麼?
- 計算方便
- 使其為總體方差的無偏估計
- 使其更小
- 與標準差配套
顯示答案/解析
答案:使其為總體方差的無偏估計。
- 判斷題
- 斷言:正態母體下, 與 獨立。
- 對
- 錯
顯示答案/解析
答案:對。這一性質用於構造t分布。
- 計算小問(可選)
- 已知獨立樣本量 ,觀測到 ,給出比例的標準誤。
顯示答案/解析
標準誤 。
跨章導航
[編輯]| 跳轉 | 頁面 |
|---|---|
| 上一節 | 機率論複習 |
| 下一節 | 點估計 |
| 返回目錄 | 目錄 |