博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习基石笔记-Lecture 14 Regularization
阅读量:5118 次
发布时间:2019-06-13

本文共 686 字,大约阅读时间需要 2 分钟。

正则化的思想,引入的方式:想改善高阶假设空间overfitting的状况,从高阶退回低阶,即限制w的某些维度使之为零。

通过放宽限制和使用软约束(softer constraint),问题改写成:

 

那如何求解右边的有约束最优化问题呢?

首先把Ein写成矩阵形式

 

如果没有约束,最优解就是linear regression的解,有约束后,w只能在红色的圆圈里面。

本来w应该沿着负梯度的方向移动,但是它不能移出圆圈,就是不能在 红线(normal)方向上移动。

因此将负梯度方法沿着normal做分解,w只能沿着绿色的箭头移动。什么时候w不能再移动了呢(就是不能再下降了),就是负梯度与normal平行的时候。那么这个时候的w就是问题的解。

最后问题演化成求w,使得

如果lamda已知,那么w可求得

 

另外来看,求解 可以等价于求解最小化问题

后面加上的这项就叫做正则项。

 

正则化和VC理论的联系

这里通过对最小化Ein的等价问题 Eaug 的求解,来保证VC bound.

 

Eaug的正则项可以看成是单个h的复杂度的惩罚

 

在有约束的假设空间H(C)中,w被限制了,这个空间的vc维要低于原始空间。

 

常用的正则项:L2和L1

L1正则的最优求解思路和L2是一样的,最优解会出现在角上,这样w在一些维度上为0,起到了特征选择的作用。

 

关于lamda的选择,和噪音大小有关。噪音大的话lamda也要大一些。但是通常我们并不知道噪音多大。。(下节讲到做validation)

 

转载于:https://www.cnblogs.com/akanecode/p/7054668.html

你可能感兴趣的文章
遍历Map对象
查看>>
MySQL索引背后的数据结构及算法原理
查看>>
#Leetcode# 209. Minimum Size Subarray Sum
查看>>
SDN第四次作业
查看>>
DM8168 DVRRDK软件框架研究
查看>>
django迁移数据库错误
查看>>
yii 跳转页面
查看>>
洛谷 1449——后缀表达式(线性数据结构)
查看>>
Data truncation: Out of range value for column 'Quality' at row 1
查看>>
Dirichlet分布深入理解
查看>>
字符串处理
查看>>
HtmlUnitDriver 网页内容动态抓取
查看>>
ad logon hour
查看>>
获得进程可执行文件的路径: GetModuleFileNameEx, GetProcessImageFileName, QueryFullProcessImageName...
查看>>
证件照(1寸2寸)拍摄处理知识汇总
查看>>
罗马数字与阿拉伯数字转换
查看>>
Eclipse 反编译之 JadClipse
查看>>
Python入门-函数
查看>>
[HDU5727]Necklace(二分图最大匹配,枚举)
查看>>
距离公式汇总以及Python实现
查看>>