【机器学习笔记】Machine Learning Fundamentals: Cross Validation（交叉验证） - 代码天地

【机器学习笔记】Machine Learning Fundamentals: Cross Validation（交叉验证）

其他 2020-02-18 15:26:46 阅读次数: 0

首先我们有一组医疗数据，以有无心脏疾病为标准记录各个患者的特征。

然后给出一名新患者的特征信息，判断他是否得心脏疾病。

接着我们要选出一种最合适的机器学习方法。然而方法有许多种，包括logistics regression（逻辑回归）、K-nearest neighbors（最近邻算法）、support vector machine（支持向量机、SVM）等等，我们该如何从中挑选？

Cross Validation（交叉验证）允许我们比较不同的机器学习方法，并且认识到它们在实践中的表现。

对于上述中收集到的医疗数据，我们需要做两件事情：

估算机器学习方法需要使用的参数（在机器学习的术语中被称为“算法训练（Training the Algorithm）”）
评估机器学习方法的工作成果（在机器学习的术语中被称为“算法测试（Testing the Algorithm）”）

换句话说，我们需要将源数据集划分为两个部分，一部分用于训练，另一部分用于测试。

顺带一提，75%用于训练，25%用于测试效果更佳。

交叉验证法并不关心是哪75%或是哪25%，因为它会尝试各种组合。曾作为训练数据的数据集也可用作测试数据，反之亦然。

在极端情况下，我们甚至可以把每个个体作为一部分，这种方法称为“留一交叉验证（leave one out cross validation）”。

在实际应用中，比较常见的是将数据集划分为10个部分，这种方法被称为“十折交叉验证（ten-fold cross validation）”。

扩展：有些机器学习方法（如岭回归Ridge Regression）会包含一个“调整参数（tuning parameter）”，在这种情况下，可以使用十折交叉验证来帮助寻找最佳的调整参数值。

最后，将各个机器学习方法中的所有组合结果分别叠加，进行比较，从而挑选出最合适的机器学习方法。

至肝主义圈毛君

发布了153 篇原创文章 · 获赞 184 · 访问量 5万+

私信关注

猜你喜欢

转载自blog.csdn.net/Ha1f_Awake/article/details/102900491

【机器学习笔记】Machine Learning Fundamentals: Cross Validation（交叉验证）

[Machine Learning] 交叉验证（Cross Validation）

机器学习 | machine learning | Cross Validation (CV)

（Deep Learning）交叉验证（Cross Validation）

【机器学习】交叉验证（cross-validation）

机器学习之交叉验证(Cross Validation)

机器学习----交叉验证（Cross Validation）简介

深度学习：交叉验证（Cross Validation）

Udacity机器学习入门——交叉验证（cross-validation）

机器学习中的交叉验证（cross-validation）

机器学习练习（三）——交叉验证Cross-validation

【机器学习】Cross-Validation（交叉验证）详解

机器学习模型评估与改进: 交叉验证(cross validation)

机器学习基石15：交叉验证（Cross Validation）

交叉验证(Cross Validation)

交叉验证（Cross Validation）

【机器学习】交叉验证(Cross Validation)与网格交叉验证(GridSearchCV)的区别

机器学习基础：K近邻算法（Machine Learning Fundamentals: KNN）

交叉验证（Cross Validation）简介

交叉验证(Cross-validation)

（四）交叉验证(Cross Validation)

交叉验证（Cross-validation）

什么是交叉验证(Cross Validation)？

Sklearn——交叉验证(Cross Validation)

【机器学习笔记】Machine Learning Fundamentals: Bias（偏差）、Variance（方差）、Overfit（过度拟合）

[Machine Learning with Python] Cross Validation and Grid Search: An Example of KNN

【机器学习】k-fold cross validation（k-折叠交叉验证）

斯坦福大学机器学习——交叉验证（Cross Validation）

【机器学习】几种交叉验证（cross validation）方式的比较（含代码）

机器学习代码实战——K折交叉验证（K Fold Cross Validation）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)