数理统计/高维与正则化
外观
< 数理统计
数理统计/高维与正则化
[编辑]学习目标
[编辑]| 目标项 | 内容 |
|---|---|
| 高维现象 | p≈n 与 p≫n 的挑战 |
| 正则化 | 岭回归、Lasso、弹性网 |
| 选择与评估 | λ路径、CV与信息准则 |
| 能力要点 | 说明 |
|---|---|
| 稳定估计 | 缓解多重共线性与过拟合 |
| 稀疏选择 | L1惩罚与变量筛选 |
| 调参与验证 | K折CV与一标一准 |
正则化回归
[编辑]- 岭回归最小化 ;Lasso 最小化 ;弹性网为二者加权组合。
| 方法 | 惩罚 | 特点 |
|---|---|---|
| 岭 | 稳定、不断零 | |
| Lasso | 稀疏、可变量选择 | |
| 弹性网 | 组效应与稀疏兼顾 |
评估与选择
[编辑]- 通过 路径与交叉验证选择;高维情形下亦参考信息准则(如EBIC)。
| 工具 | 作用 | 备注 |
|---|---|---|
| CV曲线 | 估计泛化误差 | 选择 |
| 一标一准 | 偏稳健选择 | |
| 稳定性选择 | 子采样频率 | 变量稳健性 |
高维现象与注意
[编辑]- 距离集中、过拟合风险升高;需中心化/标准化,关注可解释性与重复性。
| 风险 | 描述 | 缓解 |
|---|---|---|
| 过拟合 | 训练误差虚高 | 强惩罚/CV |
| 共线性 | 估计不稳 | 岭/弹性网 |
| 漂移 | 特征选择不稳定 | 稳定性选择 |
章节测验
[编辑]- 单选题
- 哪个方法能产生稀疏解(系数恰为0)?
- 岭回归
- Lasso
- 主成分回归
- 线性最小二乘
显示答案/解析
答案:2。
- 判断题
- 选择 往往更保守、更简化模型。
- 对
- 错
显示答案/解析
答案:对。
跨章导航
[编辑]| 跳转 | 页面 |
|---|---|
| 上一节 | 重抽样方法 |
| 返回目录 | 目录 |