西瓜书+实战+吴恩达机器学习（二）机器学习基础（偏差、方差、调试模型技巧）

其他 2019-02-26 13:34:04 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhq9695/article/details/87552883

文章目录

0. 前言
1. 偏差方差的解决方法
2. 高偏差高方差的学习曲线
3. 调试模型技巧

如果这篇文章对你有一点小小的帮助，请给个关注，点个赞喔，我会非常开心的~

0. 前言

泛化误差可分解为偏差、方差、噪声之和。

偏差：度量了学习算法的期望预测与真实结果的偏离程度
方差：度量了同样大小的数据集的变动所导致的学习性能的变化
噪声：表达了在当前任务上任何学习算法所能达到的期望泛化误差下界
泛化性能：由学习算法的能力、数据的充分性、学习任务本身难度所共同决定的

与偏差方差所对应的是欠拟合和过拟合。

欠拟合：偏差主导了泛化错误率，学习器的拟合能力不够强，不能学习到数据的普遍特性
过拟合：方差主导了泛化错误率，学习器的拟合能力过于强，甚至学习了一些数据的个性

泛化误差与偏差、方差的关系如下图所示（图源：机器学习）：

1. 偏差方差的解决方法

偏差，是指模型不能很好的学习到数据的普遍特性，所谓欠拟合：

使用更好的优化算法
增加特征数量
搜索更好的超参数
使用不同的算法架构

方差，是指模型过于好的学习了数据，甚至学习了一些数据的个性，所谓过拟合：

更多的训练数据
使用正则化
减少特征数量
搜索更好的超参数
使用不同的算法架构

贝叶斯最佳误差和训练集误差的差距，等效为偏差。

训练集误差和开发集误差的差距，等效为方差。

2. 高偏差高方差的学习曲线

横坐标为训练集大小，纵坐标为错误分类率或者代价函数。

在高偏差的情况下如下图所示（图源：吴恩达机器学习）：

在高偏差的情况下如下图所示（图源：吴恩达机器学习）：

3. 调试模型技巧

降低训练集上的代价函数，如果不能有效的降低，考虑是偏差原因
降低开发集上的代价函数，如果不能有效的降低，考虑是方差原因
降低测试集上的代价函数，如果不能有效的降低，考虑可能是开发集太小和测试集不匹配，使用更大的开发集
使其在真实世界中表现良好，如果不能有效的表现，考虑可能是开发集或测试集设置选择的不正确，或者代价函数不能有效的评估误差

对于特征不同的维度取值相差很远，可以采用特征缩放，即归一化，有助于训练。

如果这篇文章对你有一点小小的帮助，请给个关注，点个赞喔，我会非常开心的~

猜你喜欢

转载自blog.csdn.net/zhq9695/article/details/87552883

西瓜书+实战+吴恩达机器学习（二）机器学习基础（偏差、方差、调试模型技巧）

吴恩达机器学习（八）偏差与方差

西瓜书+实战+吴恩达机器学习（三）机器学习基础（多分类、类别不平衡）

西瓜书+实战+吴恩达机器学习（一）机器学习基础（数据集划分、分类回归评估指标）

西瓜书+实战+吴恩达机器学习（十一）监督学习之集成学习

西瓜书+实战+吴恩达机器学习（十二）监督学习之AdaBoost

吴恩达机器学习笔记：关于训练模型中出现高偏差和高方差的处理办法

吴恩达新书-机器学习学习笔记-（三）偏差与方差

吴恩达机器学习练习5——正则化线性回归和偏差/方差

吴恩达机器学习笔记——由方差和偏差改进神经网络

吴恩达|机器学习作业5.0.偏差与方差

吴恩达机器学习（十）——诊断法、偏差与方差、欠拟合与过拟合

吴恩达机器学习作业Python实现(五)：偏差和方差

西瓜书+实战+吴恩达机器学习（十三）监督学习之随机森林 Random Forest

西瓜书+实战+吴恩达机器学习（七）监督学习之决策树 Decision Tree

西瓜书+实战+吴恩达机器学习（六）监督学习之逻辑回归 Logistic Regression

西瓜书+实战+吴恩达机器学习（五）监督学习之线性判别分析 Linear Discriminant Analysis

西瓜书+实战+吴恩达机器学习（四）监督学习之线性回归 Linear Regression

西瓜书+实战+吴恩达机器学习（九）监督学习之k近邻 K-Nearest Neighbor

西瓜书+实战+吴恩达机器学习（八）监督学习之朴素贝叶斯 Naive Bayes

西瓜书+实战+吴恩达机器学习（十）监督学习之支持向量机 Support Vector Machine

吴恩达机器学习入门笔记6-决策树(由西瓜书补充)

吴恩达-机器学习(6)-评估学习算法、偏差与方差、构架垃圾邮件分类器、处理倾斜数据

编程作业（python）| 吴恩达机器学习（5）偏差与方差，训练集，验证集，测试集，学习曲线

吴恩达机器学习作业Python3实现(五)：方差和偏差及学习曲线绘制

机器学习基础 | 偏差与方差

【吴恩达】机器学习作业ex5--＞偏差与方差（过拟合/欠拟合）Python

吴恩达机器学习笔记（二）

吴恩达机器学习(二)

吴恩达机器学习入门笔记10/11-贝叶斯分类器/集成学习(西瓜书补充)

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

WebSocket、HTTP 与 TCP

private,public,protected的区别

Python用了这么多年，总结出超实用的功能和特点

dgwp笔记

ModuleNotFoundError: No module named 'gdbm'

数组的去重方法

Ternsorflow 学习：005-MNIST 实现模型

SpringBoot 2 源码学习笔记（二）

jaxws-spring 搭建Web Services笔记

读取properties文件并获取属性值

每日归档

更多

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)