周志华机器学习第二章总结及课后答案 - 代码天地

周志华机器学习第二章总结及课后答案

其他 2018-07-15 22:03:41 阅读次数: 0

2.1 经验误差与过拟合

通常我们把分类错误的样本总数的比例称为错误率（error rate），即如果在m个样本中有a个样本分类错误，则错误率E=a/m;相应的，1-a/m称为”精度”(accuracy),更一般的，我们把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”,学习器在训练集上的误差称为“训练误差”或“经验误差”，在新样本上的误差称为“泛化误差”。

过拟合（overfitting）：当学习器把训练样本学得“太好了”的时候，很可能已经把训练样本自身的一些特点当作了所有潜在样本都会有的一般性质，这样就会导致泛化性能下降。相反则称为欠拟合(underfitting)。
注意：我们必须认识到过拟合是无法避免的，我们所能做的只是“缓解”，或者说减小其风险。关于这一点，可大致这样理解：机器学习面临的问题是NP难甚至更难，而有效的学习算法必然在多项式时间内运行完成，若可避免过拟合，则通过经验误差最小化就能获得最优解，这就意为着我们构造性的证明了“P=NP”，因此只要相信P不等于NP过拟合就不可避免。

2.2 评估方法

留出法(hold-out)：直接将数据集D划分为两个互斥的集合，其中一个集合作为训练集S，另一个作为测试集T，即
注意：训练/测试集的划分要尽可能保持数据分布的一致性，避免因数据划分过程引入额外的偏差而对最终结果产生影响。如果实在不能保证数据分布的一致性，请参考我在深度学习中的笔记： 2.3在不同的划分上进行训练并测试。
交叉验证法(cross validation):先将数据集D划分为k个大小相似的互斥子集，即
待更新……

猜你喜欢

转载自blog.csdn.net/liushao123456789/article/details/79221331

周志华机器学习第二章总结及课后答案

周志华《机器学习》第二章课后习题

周志华版机器学习第二章习题答案

周志华机器学习总结第二章

周志华《机器学习》西瓜书课后习题解答——第二章模型评估与选择

机器学习(周志华) 参考答案第二章模型评估与选择

周志华《机器学习》第二章学习笔记

周志华机器学习笔记第二章

第二章课后总结

周志华西瓜书《机器学习笔记》学习笔记第二章《模型的评估与选择》

《机器学习》周志华(西瓜书)学习笔记第二章模型评估与选择

【机器学习】周志华读书笔记第二章模型评估与选择

读书笔记机器学习（周志华）第二章模型评估与选择

MLb-002 43《机器学习》周志华第二章：模型评估与选择

周志华《机器学习》第二章模型评估与选择笔记及习题解答

周志华《机器学习》第二章模型评估与选择——性能度量

周志华《机器学习》第二章模型评估与选择——模型评估方法

周志华《机器学习》第二章模型评估与选择——经验误差与过拟合

周志华《机器学习》第二章模型评估与选择——比较检验

C Primer Plus 第二章课后答案

数据库原理课后答案第二章

数据挖掘导论课后习题答案-第二章

操作系统第二章课后习题答案

C++Primer Plus笔记——第二章开始学习C++及课后习题答案

统计学习方法-第二章课后习题答案整理

【汇编语言】——第二章课后总结

[机器学习]第二章Numpy

机器学习第二章

第二章机器学习概述

《学习OpenCV》第二章课后题3

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

VS2017编译opensmile具体过程和遇到的问题

PowerEnglish——mini-story3总结

微信小程序数据库获取字符串在view中显示换行

Java静态代码块/构造代码块/构造函数/静态变量/成员变量(相关示例)

Keras使用tensorflowjs部署demo

window下用git连接Github

图象的全变分和去噪

LeetCode刷题笔记--119. Pascal's Triangle II

【Linux】进程间通信 - 管道

polyA|ribo-minus|differentiated cell|Genetic heterogeneity

每日归档

更多

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)