机器学习（一）—— 过拟合（Overfitting）、正则化与损失函数

其他 2019-10-24 13:58:31 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/weixin_42886817/article/details/99679966

过拟合、正则化和损失函数

什么是过拟合
如何解决过拟合？

正则化（regularization）
Dropout正则化（丢弃正则化）

损失函数

平方损失函数（最小二乘法）
对数损失函数
指数损失函数

什么是过拟合

过拟合：经训练出的模型在训练集上表现很好，可能将训练集的一些特点当做所有样本都具有的特点，导致在新的样本上的误差变大，泛化能力差。

过拟合的原因：

网络的学习能力过好
数据样本过少

欠拟合：对训练集的一般性质尚未学好

如何解决过拟合？

方法一：增加数据量
方法二：运用正则化regularization（L1,L2,…）

正则化（regularization）

W表示权重，x表示输入，y表示输出
real y表示真实输出，λ表示系数

正则化	cost函数
原始损失函数（无正则化）	设为C
L1正则化	cost=C+λ ∑ abs(w)
L2正则化	cost=C+λ ∑w²

L3,L4正则化以此类推

Dropout正则化（丢弃正则化）

所谓dropout(丢弃)，就是去除一些神经元之间的连接。

这样做对于解决过拟合问题有什么好处呢：

丢弃一些连接，意味着网络规模减小
随机丢弃，不会偏重某些权重，类似 L2正则化

其涉及的相关概念：

保留概率 keep-prob :描述一个隐藏层保留神经元（连接）的概率，作用是为了生成随机矩阵
反向随机失活 inverted dropout：用来实现dropout

损失函数

参考原文链接：
版权声明：本文为博主原创文章，遵循 CC 4.0 by-sa 版权协议，转载请附上原文出处链接和本声明。
本文链接： https://blog.csdn.net/chkay399/article/details/81878157

在上面正则化中提到了损失函数的概念，损失函数是用来估量训练出的模型的预测值与真实值之间的差距
接下来介绍一下机器学习里常用的的损失函数：

统一使用Y来表示真实数据集，X表示输入数据集合，f(X)表示预测值集合
y表示一条真实数据，x表示一条输入数据

平方损失函数（最小二乘法）

使用场景：线性回归

对数损失函数

使用场景：逻辑回归
样本预测值和实际值的误差符合高斯分布，使用极大似然估计的方法，取对数得到损失函数：

指数损失函数

使用场景：Boosting算法中较为常见

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_42886817/article/details/99679966

机器学习（一）—— 过拟合（Overfitting）、正则化与损失函数

【机器学习】P8 过拟合与欠拟合、正则化与正则化后的损失函数和梯度下降

机器学习算法--正则化与过拟合

机器学习防止过拟合---正则化

【机器学习】过拟合、欠拟合与正则化

机器学习——欠拟合、过拟合与正则化

机器学习,过拟合与欠拟合,正则化与交叉验证

[学习笔记] [机器学习] 4. [下] 线性回归（线性回归、损失函数、优化算法：正规方程，梯度下降、Boston房价预测、欠拟合和过拟合、正则化、岭回归、模型保存与模型加载）

吴恩达机器学习007过拟合&&代价函数&&正则化

机器学习中的数学原理——过拟合、正则化与惩罚函数

机器学习中的损失函数与正则化

机器学习基石13：过拟合风险（Hazard of Overfitting）

机器学习术语（假设函数、损失函数、过拟合、欠拟合）

机器学习笔记1：过拟合和正则化的理解

机器学习笔记4——过拟合与正则化

【机器学习】如何对抗过拟合（交叉验证与正则化）

机器学习笔记（五）过拟合问题及正则化

机器学习笔记 - 过拟合和正则化

周志华机器学习四过拟合与正则化

吴恩达机器学习（四）过拟合与正则化

机器学习基础---过拟合问题及正则化技术

机器学习（七）过拟合问题与正则化

机器学习：正则化项为什么能够防止过拟合？防止过拟合的方法

[机器学习笔记] 机器学习中的“过拟合（Overfitting）”和“欠拟合（Underfitting）”

斯坦福公开课《机器学习》笔记3——过拟合、避免过拟合的损失函数

欠拟合、过拟合、正则化、学习曲线

小白的机器学习学习笔记（九）----欠拟合，过拟合，正则化

机器学习中的过拟合和欠拟合现象，以及通过正则化的方式解决。

《机器学习》笔记---2 模型的损失函数与正则化

深度学习中降低过拟合(OverFitting)的方法

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)