MachineLearningWu_9_overfitting - 代码天地

MachineLearningWu_9_overfitting

企业开发 2023-08-01 22:37:02 阅读次数: 0

x.1 过拟合问题

在开始前，让我们先理解一下模型拟合过程中经常出现的三种情况，underfit， just right， overfit/high variance，underfit是指没有足够的特征来拟合现有数据或者iterations训练轮次过少，而overfit是指使用了远大于数据集特征的模型来拟合现有数据。

请添加图片描述

为了更好的理解，让我们再举例一个Classification的例子，

请添加图片描述

x.2 如何解决过拟合问题

对于解决过拟合问题，其中一个常用的方法是使用更多的training examples训练样本，

请添加图片描述

对于解决过拟合问题，我们还有一个方法就是前面提到的特征工程中，进行特征选择的过程，我们可以选择一些直觉上有用的特征以此来达到减少复杂度的目的，当然这种方式也存在一些不好的地方，例如一些有用的特征可能会丢失，

请添加图片描述

最后一类减少过拟合的方法叫做正则化，而实际上我们最长使用的正则化技术叫做L2正则化，它的原理是通过将部分特征的系数置为一个非常小的数以达到减少特征的作用，如下我们将x四次方的系数设置为0.0001以此达到最小化x四次方对f(x)造成的影响。注意，在实际情况中，我们往往只对weight的值进行L2正则化，而忽视bias，并不对bias的值进行正则化。

请添加图片描述

请添加图片描述

扫描二维码关注公众号，回复： 16016485 查看本文章

x.3 如何实现L2正则化

实现L2正则化，即将weight权重加入到损失函数中，例如我们不想要x的三次方和x的四次方，我们就把x的三次方和x的四次方前的可学习权重weight加入到我们的loss中，由于我们的策略要做的事情是argmin(loss)，所以我们便会想方设法使得w3和w4小，如下，

请添加图片描述

但是往往你并不知道你需要对哪一个特征进行惩罚，所以我们一视同仁地对这些特征进行惩罚，即我们对所有的特征都进行惩罚如下，其中我们往往只对weight进行惩罚而忽视bias，这种全部惩罚的方式被实验证明是极好的。

请添加图片描述

我们对下面式子的直观理解是，当lambda=0时，等于不添加对权重的乘法，会偏向于overfit过拟合；而当lambda=无穷大时，几乎就等于将权重值全部置为0，会偏向于underfit欠拟合。所以lambda要合适的选择，用于权衡data和weight中的平衡。

请添加图片描述

x.4 将L2正则化应用于Linear Regression

接下来我们将梯度下降算法应用于更新的loss，由于我们只增加了对weight的惩罚，所以wj的偏微分会产生变化，如下所示，

请添加图片描述

针对wj的变换，我们做恒等变换得到 $wj(1-\alpha * \lambda / m) + ...$ ，我们能够发现省略号…中的部分是不变的，即我们的L2正则化其实只改变了wj前的系数，例如wj * 0.9998，正则化本质上只做了shrink weight缩小权重的作用。

请添加图片描述

x.5 logistic regression

同样也可以将L2正则化应用于逻辑回归，和线性回归类似，只不过f(x)产生了变化，

请添加图片描述

猜你喜欢

转载自blog.csdn.net/qq_43369406/article/details/131628434

MachineLearningWu_9_overfitting

overfitting

神经网络学习9--过拟合 (Overfitting)的解决办法

The Problem of Overfitting

Reducing Overfitting

overfitting &&underfitting

MachineLearningWu_13_AGI

MachineLearningWu_12_BuildNNUsingNumpyOrTF

MachineLearningWu_11_NeuralNetworkLayer

MachineLearningWu_10_NeuralNetwork

MachineLearningWu_6_FeatureScaling

MachineLearningWu_5_MultipleLinearRegression

MachineLearningWu_4_GradientDescent

MachineLearningWu_3_LinearRegression

解决overfitting的方法

overfitting怎么解决

5.Underfitting and Overfitting

Reducing Overfitting in Deep CNNs

overfitting过拟合

overfitting过拟合问题

overfitting怎么解决？

什么是过拟合 (Overfitting)

过拟合 (Overfitting)

Dropout 解决 overfitting

Regularization - The problem of overfitting

MachineLearningWu_7+8_LogisticRegression/Classification

机器学习中overfitting的理解

Feature Selection Can Reduce Overfitting

［机器学习］overfitting 和regularization

如何防止过拟合(overfitting)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)