《Machine Learning Yearning》第12章

其他 2018-07-25 03:53:47 阅读次数: 0

第12章是对设置开发集和测试集这一部分的一个总结。

12 Takeaways: Setting up development and test sets

从能反映将来你希望获得的数据的分布上选择开发和测试集，并且想在上面做的更好。这可能跟你的训练集的分布不一样。

如果可能的话，开发集和测试集的分布要一致。

为你的团队选择一个单数字的评估指标来进行优化。如果你关心的是几个指标，那么想办法将它们组合成一个公式（例如多个误差指标的平均值）或者定义满足指标和优化指标。

机器学习是一个高度迭代的过程：你可能在找到你最满意的那个算法前会尝试很多的idea。

定义好开发集/测试集和单数字指标，能帮助你快速评估算法，同时迭代得更快。

在尝试一个全新的应用时，先快速建立开发集/测试集和评估指标，也就是在一周之内。如果是成熟的应用，花费较长时间也是可以的。

如果你有很大的数据，那么早期的那种7:3划分训练集和测试集的方法就不适用了。开发集/测试集可以比30%更少。

你的开发集应该足够大，大到能够检测你算法准确率发生的重要变化，但是没有必要非常大。你的测试集应该足够大，大到能给你系统的最终性能提供一个置信估计。

如果你的开发集和评估指标不再指引你的团队到正确的方向，那么赶紧修改它们：(i)如果你过拟合了开发集，那么获取更多的开发数据。(ii)如果你所关心的分布和开发/测试集的分布不同，那么获取新的开发/测试集。(iii)如果你的评估指标不能衡量对你来说最重要的部分，那么改变这个评估指标。

猜你喜欢

转载自blog.csdn.net/lisa_ren_123/article/details/81089162

《Machine Learning Yearning》第12章

《Machine Learning Yearning》第6章

《Machine Learning Yearning》第7章

《Machine Learning Yearning》第5章

《Machine Learning Yearning》第8章

《Machine Learning Yearning》第17章

《Machine Learning Yearning》第16章

《Machine Learning Yearning》第15章

《Machine Learning Yearning》第14章

《Machine Learning Yearning》第13章

《Machine Learning Yearning》第11章

《Machine Learning Yearning》第10章

《Machine Learning Yearning》第9章

《Machine Learning Yearning》第18章

Machine Learning Yearning介绍

Machine Learning Yearning

Machine Learning Yearning - Ng 笔记

[Translate]Machine Learning Yearning -01

Machine Learning Yearning 要点笔记

Machine Learning Yearning(Andrew Ng)

Machine Learning Yearning23~27

Machine Learning Yearning15~19

Machine Learning Yearning1~14

Machine Learning Yearning20~22

Machine Learning Yearning28~30

吴恩达新书《Machine Learning Yearning》

machine-learning-yearning——读书笔记

Machine_Learning_Yearning 翻译与理解

machine learning yearning 吴恩达——笔记

一文读完 Machine Learning Yearning

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)