跳转到内容

数理统计/高维与正则化

维基教科书,自由的教学读本

数理统计/高维与正则化

[编辑]

学习目标

[编辑]
目标项 内容
高维现象 p≈n 与 p≫n 的挑战
正则化 岭回归、Lasso、弹性网
选择与评估 λ路径、CV与信息准则
能力要点 说明
稳定估计 缓解多重共线性与过拟合
稀疏选择 L1惩罚与变量筛选
调参与验证 K折CV与一标一准

正则化回归

[编辑]
岭回归最小化 ;Lasso 最小化 ;弹性网为二者加权组合。
方法 惩罚 特点
稳定、不断零
Lasso 稀疏、可变量选择
弹性网 组效应与稀疏兼顾

评估与选择

[编辑]
通过 路径与交叉验证选择;高维情形下亦参考信息准则(如EBIC)。
工具 作用 备注
CV曲线 估计泛化误差 选择
一标一准 偏稳健选择
稳定性选择 子采样频率 变量稳健性

高维现象与注意

[编辑]
距离集中、过拟合风险升高;需中心化/标准化,关注可解释性与重复性。
风险 描述 缓解
过拟合 训练误差虚高 强惩罚/CV
共线性 估计不稳 岭/弹性网
漂移 特征选择不稳定 稳定性选择

章节测验

[编辑]
单选题
哪个方法能产生稀疏解(系数恰为0)?
  1. 岭回归
  2. Lasso
  3. 主成分回归
  4. 线性最小二乘
显示答案/解析
答案:2。
判断题
选择 往往更保守、更简化模型。
显示答案/解析
答案:对。

跨章导航

[编辑]
跳转 页面
上一节 重抽样方法
返回目录 目录