跳至內容

統計學/logistic回歸模型

維基教科書,自由的教學讀本

logistic回歸模型

[編輯]
  • 由於因變量Y為二分類變量,不滿足線性回歸分析條件,首先對π進行數據變換:
    • logit(π)=ln(π/(1-π))=ln(Odds)
  • 這個變換將取值在0~1間的π值轉換為值域在(-∞,+∞)的logit(π)值。
  • 然後,建立logit(π)與自變量的線性模型。
    • logit(π)=β₀+β₁X₁+...+βpXp [1a]
    • 或ln(Odds)=β₀+β₁X₁+...+βpXp [1b]
    • 或ln(π/(1-π))=β₀+β₁X₁+...+βpXp [1c]
  • 變換式[1c],得
    • π/(1-π)=e(β₀+β₁X₁+...+βpXp [2]
  • 求解π,得
    • π=e(β₀+β₁X₁+...+βpXp/(1+e(β₀+β₁X₁+...+βpXp) [3]
    • 或π=1/(1+e-(β₀+β₁X₁+...+βpXp) [4]
  • 可見,在已知某一個體的自變量(X₁,X₂,...Xp)情況下,採用式[3]或式[4],可以得到該個體機率π(Y=1)的預測值。
  • 上述公式中,β₀為常數項(截距),β₁,β₂,...,βp為回歸系數。因為式[3]和式[4]的右端在數學上屬於logistic函數,所以式[1a]、式[1b]、式[3]與式[4]均稱為logistic回歸模型。

模型參數的意義

[編輯]