机器学习：正则化 - 代码天地

机器学习：正则化

其他 2018-10-31 23:11:39 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u010418035/article/details/47424941

**************************************

注：本系列博客是博主学习Stanford大学 Andrew Ng 教授的《机器学习》课程笔记。博主深感学过课程后，不进行总结很容易遗忘，根据课程加上自己对不明白问题的补充遂有此系列博客。本系列博客包括线性回归、逻辑回归、神经网络、机器学习的应用和系统设计、支持向量机、聚类、将维、异常检测、推荐系统及大规模机器学习等内容。

**************************************

正则化

过拟合问题

拟合问题举例-线性回归之房价问题：

下图左中右分别是：欠拟合、合适的拟合、过拟合

什么是过拟合(Overfitting):

如果我们有非常多的特征，那么所学的Hypothesis有可能对训练集拟合的非常好，但是对于新数据预测的很差。

拟合问题举例-逻辑回归：

与上一个例子相似，依次是欠拟合，合适的拟合以及过拟合：

过拟合问题往往源自过多的特征，例如房价问题，如果我们定义了如下的特征：

对于训练集，拟合的会非常完美：

所以针对过拟合问题，通常会考虑两种途径来解决：

成本函数

依然从房价预测问题开始，这次采用的是多项式回归：

我们可以从之前的事例中看出，正是那些高次项导致了过拟合的产生，所以如果我们能让这些高次项的系数接近0的话，我们就能很好的拟合了。

我们要做的就是在一定程度上减小θ3、θ4的值，这就是正则化的基本方法。我们要做的便是修改代价函数，在其中θ3和θ4 设置一点惩罚。这样做的话，我们在尝试最小化代价时也需要将这个惩罚纳入考虑中，并最终导致选择较小一些的θ3和θ4。

这样在最小化Cost function的时候

正则化

参数θ1 θ2 θ3……θn取小一点的值，这样的优点：

-“简化”的hypothesis；

-不容易过拟合；

对于房价问题：

对除 θ0以外的参数进行惩罚，也就是正则化：

其中λ又称为正则化参数（Regularization Parameter）。根据惯例，我们不对θ0 进行惩罚。经过正则化处理的模型与原模型的可能对比如下图所示：

对于正则化的线性回归模型来说，我们选择θ来最小化如下的正则化成本函数：

因为如果我们令λ的值很大的话，为了使 Cost Function 尽可能的小，所有的θ的值（不包括θ0）都会在一定程度上减小。但若λ的值太大了，那么θ（不包括θ0）都会趋近于 0，这样我们所得到的只能是一条平行于 x轴的直线。所以对于正则化，我们要取一个合理的λ的值，这样才能更好的应用正则化。

正则化线性回归

正则化线性回归的代价函数为：

我们的目标依旧是最小化J(θ)，由于正则化后的线性回归Cost function有了改变，因此梯度下降算法也需要相应的改变：

我们同样也可以利用正规方程来求解正则化线性回归模型，方法如下所示：

正则化逻辑回归模型

同样对于逻辑回归，我们也给代价函数增加一个正则化的表达式

要最小化该代价函数，通过求导，得出梯度下降算法为：

******************

作者：hao_09

时间：2015/8/11

文章地址：http://blog.csdn.net/lsh_2013/article/details/47424941

******************

猜你喜欢

转载自blog.csdn.net/u010418035/article/details/47424941

机器学习-正则化

机器学习_正则化

机器学习：正则化

机器学习的正则化

机器学习——正则化

【机器学习】正则化

[机器学习]正则化方法

机器学习的参数正则化

机器学习--正则化(Regularization)

机器学习：正则化技术

【机器学习】正则化方法

机器学习笔记：正则化

机器学习3——正则化

机器学习之正则化

python机器学习——正则化

【机器学习】3 正则化

机器学习中的正则化

机器学习中正则化方法

机器学习 LogsticRegression 正则化(matlab实现)

机器学习之正则化（Regularization）

机器学习理论之正则化

机器学习笔记十九：正则化思想

机器学习总结之正则化

机器学习中的损失函数与正则化

机器学习17-模型正则化

机器学习：线性回归和正则化

机器学习算法--正则化与过拟合

机器学习中正则化项

机器学习：偏差、方差与正则化

正则化及机器学习常用术语的解释

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)