交叉验证等验证方法 - 代码天地

交叉验证等验证方法

其他 2018-09-14 11:49:05 阅读次数: 0

一.交叉验证法
1.“交叉验证法”（cross validation）先将数据集D划分为k个大小相似的互斥子集，即D=D1并D2并D3…并Dk，每个子集之间没有交集。
2.然后每次用k-1个子集的并集作为训练集，余下的那个作为测试集，这样得到k组训练/测试集。
3.可以进行k次训练和测试，最终返回的是这k个结果的均值。
4.可以随机使用不同的划分多次，比如10次10折交叉验证
通常把交叉验证法称为“k折交叉验证”（k-fold cross validation），k最常用的取值是10，为10折交叉验证

二.留出法
“留出法”（hold out）直接将数据集D划分为两个互斥的集合。其中一个集合作为训练集S，另一个集合作为测试集T，即D=S并T，S交T=空集。在S上训练出模型后，用T来评估其测试误差，作为对泛化误差的估计。
需要注意的是，训练/测试集的划分要尽可能保持数据分布的一致性。从采样的角度看待数据集的划分过程，则保留类别比例的采样方式称为“分层采样”

三.自助法
“自助法”（bootstrapping）是一个比较好的解决方案，以自助采样为基础，给定包含m个样本的数据集D，进行采样得数据集D’：每次随机从D中挑选一个样本，copy放入D’，并将样本放回初始数据集D中，使得该样本在下次采样还可能被采样到。该过程重复m次，得到包含m个样本的数据集D’。
将D’用作训练集，D/D‘用作测试集，每次使用m个训练样本，仍有约1/3没在训练集中出现用于测试，称为“包外估计”。对于数据集较小的样本较好。

猜你喜欢

转载自blog.csdn.net/JasonZhangOO/article/details/69053350

交叉验证等验证方法

交叉验证方法与实践

评估方法与CrossValidation交叉验证

机器学习-验证策略总结【交叉验证、验证集方法】

交叉验证

交叉验证(CrossValidation)方法思想简介

评估方法（交叉验证自助法）

过拟合及交叉验证方法的对比

几种交叉验证方法介绍及对比

机器学习交叉验证

交叉验证(Cross Validation)

StratifiedShuffleSplit 交叉验证

k折交叉验证

sklearn 交叉验证

sklearn交叉验证（acc）

交叉验证的原理与用法

训练模型：交叉验证

交叉验证 matlab实现

交叉验证及并行搜索

交叉验证 python

正则化与交叉验证

机器学习_交叉验证

交叉验证（Cross Validation）

GridSearchCV交叉验证

sklearn交叉验证

Matlab使用交叉验证

模型评估---交叉验证

sklearn-交叉验证

交叉验证梳理

交叉验证梳理

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)