統計學/logistic回归模型
外观
< 統計學
logistic回归模型
[编辑]- 由于因变量Y为二分类变量,不满足线性回归分析条件,首先对π进行数据变换:
- logit(π)=ln(π/(1-π))=ln(Odds)
- 这个变换将取值在0~1间的π值转换为值域在(-∞,+∞)的logit(π)值。
- 然后,建立logit(π)与自变量的线性模型。
- logit(π)=β₀+β₁X₁+...+βpXp [1a]
- 或ln(Odds)=β₀+β₁X₁+...+βpXp [1b]
- 或ln(π/(1-π))=β₀+β₁X₁+...+βpXp [1c]
- 变换式[1c],得
- π/(1-π)=e(β₀+β₁X₁+...+βpXp) [2]
- 求解π,得
- π=e(β₀+β₁X₁+...+βpXp)/(1+e(β₀+β₁X₁+...+βpXp)) [3]
- 或π=1/(1+e-(β₀+β₁X₁+...+βpXp)) [4]
- 可见,在已知某一个体的自变量(X₁,X₂,...Xp)情况下,采用式[3]或式[4],可以得到该个体概率π(Y=1)的预测值。
- 上述公式中,β₀为常数项(截距),β₁,β₂,...,βp为回归系数。因为式[3]和式[4]的右端在数学上属于logistic函数,所以式[1a]、式[1b]、式[3]与式[4]均称为logistic回归模型。