logistic回归模型

由于因变量Y为二分类变量，不满足线性回归分析条件，首先对π进行数据变换：
- logit（π）=ln（π/（1-π））=ln（Odds）
这个变换将取值在0～1间的π值转换为值域在（-∞，+∞）的logit（π）值。
然后，建立logit（π）与自变量的线性模型。
- logit（π）=β₀+β₁X₁+...+β_pX_p ［1a］
- 或ln（Odds）=β₀+β₁X₁+...+β_pX_p ［1b］
- 或ln（π/（1-π））=β₀+β₁X₁+...+β_pX_p ［1c］
变换式［1c］，得
- π/（1-π）=e^{（β₀+β₁X₁+...+β_pX_p）} ［2］
求解π，得
- π=e^{（β₀+β₁X₁+...+β_pX_p）}/（1+e^{（β₀+β₁X₁+...+β_pX_p）}）［3］
- 或π=1/（1+e^{-（β₀+β₁X₁+...+β_pX_p）}）［4］
可见，在已知某一个体的自变量（X₁，X₂，...X_p）情况下，采用式［3］或式［4］，可以得到该个体概率π（Y=1）的预测值。
上述公式中，β₀为常数项（截距），β₁，β₂，...，β_p为回归系数。因为式［3］和式［4］的右端在数学上属于logistic函数，所以式［1a］、式［1b］、式［3］与式［4］均称为logistic回归模型。

統計學/logistic回归模型