跳至內容

數理統計/前言

維基教科書,自由的教學讀本

數理統計/前言

[編輯]

本書目標

[編輯]

本書旨在系統梳理數理統計的核心概念、方法與應用路徑,強調從概率到統計推斷的邏輯鏈條,幫助讀者在實踐中正確選擇與解釋統計方法。

適用讀者

[編輯]
  • 已具備基礎概率論知識的讀者
  • 希望將統計推斷用於工程、數據科學、自然科學研究的學習者
  • 需要統一複習統計學理論脈絡的準備者

學習路徑導航

[編輯]
路徑節點 關鍵主題 目標能力
概率論複習 分布、矩、極限定理 從樣本到總體的概率連接
樣本與統計量 隨機樣本、統計量、抽樣分布 認識估計對象與工具
點估計與區間估計 不偏性、有效性、置信區間 構造與評估估計
假設檢驗 Neyman–Pearson 範式、p 值、功效 決策與錯誤控制
似然與貝葉斯 MLE、似然比、先驗與後驗 兩大推斷範式與比較
線性模型與方差分析 正態線性模型、ANOVA 建模與方差分解
非參數與重抽樣 秩檢驗、Bootstrap 弱分布假設與計算推斷
高維與正則化 Lasso、嶺回歸、信息準則 複雜模型與選擇
時間序列/生存分析 相關結構、截尾與風險 特殊數據結構推斷

關鍵理念

[編輯]
核心理念 簡述
模型與數據的匹配 統計推斷依賴於模型假設;假設越強,結論越敏感
不確定性的度量 置信區間、標準誤、後驗分布都是不確定性的表達
可重複性與穩健性 抽樣波動是常態;估計與檢驗需要穩健策略
可解釋性優先 結果報告應包含方法、假設、限制以及效應量

名詞速覽

[編輯]
總體
研究對象的全體,統計推斷的目標指向。
樣本
從總體抽取的觀測集合,是推斷的依據。
統計量
樣本的函數,用於估計、檢驗或描述。
估計量
用於近似總體參數的統計量。
置信區間
以概率方式刻畫參數不確定性的區間估計。
p 值
在原假設為真時,觀察到至少同等極端數據的概率。

為什麼「概率」先行

[編輯]

在統計推斷中,概率論提供了從隨機機制到分布結果的映射:只有理解抽樣的隨機性與極限定理,才能解釋估計的波動、置信區間的頻率含義,以及檢驗中的第一類與第二類錯誤。概率是統計的語言,模型是假設的容器。

方法選擇總覽

[編輯]
場景 典型方法 關鍵假設 輸出要點
小樣本、近正態 t 檢驗/正態區間估計 近似正態、方差同質 均值差異、區間與p值
非正態/秩穩健 Wilcoxon/秩和檢驗 連續分布、對稱性(可選) 位置差異的秩度量
多組均值比較 單因素ANOVA 組內正態、方差同質 組間方差分解與多重比較
高維特徵選擇 嶺/Lasso 線性可加、懲罰項 穩定預測與可解釋稀疏性
分布未知的區間 Bootstrap 可重抽樣、樣本代表性 經驗分布下的標準誤與區間

常見誤區

[編輯]
  • 僅報告 p 值,而忽略效應量與區間
  • 將非顯著誤判為無效應
  • 將置信區間誤解為參數的概率區間
  • 忽視模型設定與診斷,過度依賴默認方法

全書結構

[編輯]
  • 概率論複習
  • 隨機樣本與統計量
  • 點估計、區間估計
  • 假設檢驗基礎
  • 似然方法與MLE
  • 貝葉斯方法
  • 非參數方法
  • 線性模型與方差分析
  • 回歸診斷與模型選擇
  • 重抽樣方法
  • 高維與正則化
  • 時間序列入門
  • 生存分析與打分檢驗
  • 參考文獻

跨章導航

[編輯]