过拟合问题-ML EveryDay - 代码天地

过拟合问题-ML EveryDay

其他 2020-03-19 21:26:01 阅读次数: 0

过拟合

所谓过拟合（over-fitting）其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在验证数据集以及测试数据集中表现不佳。

打个比喻就是当我需要建立好一个模型之后，比如是识别一只狗狗的模型，我需要对这个模型进行训练。恰好，我训练样本中的所有训练图片都是二哈，那么经过多次迭代训练之后，模型训练好了，并且在训练集中表现得很好。基本上二哈身上的所有特点都涵括进去，那么问题来了！假如我的测试样本是一只金毛呢？将一只金毛的测试样本放进这个识别狗狗的模型中，很有可能模型最后输出的结果就是金毛不是一条狗（因为这个模型基本上是按照二哈的特征去打造的）。所以这样就造成了模型过拟合，虽然在训练集上表现得很好，但是在测试集中表现得恰好相反，在性能的角度上讲就是协方差过大（variance is large），同样在测试集上的损失函数（cost function）会表现得很大。
---------------------
数据：数据不规范，数据量少，数据穿越，统计特征用到了未来的信息或者标签信息
算法：算法过于复杂

过拟合的基本调优思路是增加数据量，降低模型复杂度。
解决：
1、将数据规范化，处理缺失值，增加数据量，采样，添加噪声数据
2、正则化，控制模型复杂程度，
3、early stoping，减少迭代次数，减少树的深度，
4、学习率调大/小点、
5、融合几个模型

摘自机器学习面试题、大白话给你说清楚什么是过拟合、欠拟合以及对应措施

空想社会主义

发布了52 篇原创文章 · 获赞 27 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_37457432/article/details/90056331

过拟合问题-ML EveryDay

everyday

线性回归理解-ML EveryDay

SVM支持向量机-ML EveryDay

判别式和生成式的区别-ML EveryDay

study everyday

EveryDay笔记

Everyday a assay

(Ⅰ) Everyday flie

一个完整机器学习项目的流程-ML EveryDay

A little progress everyday

SQL SQL EVERYDAY 20181008

everyday-up

SQL SQL EVERYDAY 20181007

[Using English Everyday]138/365

[Using English Everyday]131/365

[Using English Everyday]136/365

[Using English Everyday]139/365

[Using English Everyday]137/365

ML（附录3）——过拟合与欠拟合

【ML】容量、过拟合和欠拟合

过拟合欠拟合问题

Rspec: everyday-rspec实操。

ML-31:模型误差与过拟合

【ML】_00_01_防止过拟合

【ML】机器学习之线性回归过拟合问题的解决方案

过拟合问题

overfitting过拟合问题

过拟合问题详解

模型过拟合问题

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)