机器学习的所有资源链接和经验教训(十一)ML项目建议
其他
2018-07-21 08:05:11
阅读次数: 0
ML项目建议
- 首先创建您的机器学习管道,然后开始担心如何调整并在以后更好地使您的模型。
- 例如,如果您要创建图像分类模型,请确保您能够将数据加载到程序中,创建测试/训练矩阵,创建一个非常简单的模型(使用其中一个DL库),创建训练循环,并确保网络正在学习一些东西,你可以达到一些基线准确性。只有在完成这些步骤后,才能开始担心正规化,数据增强等问题。
- 太多次,当您的问题可能只是加载数据或创建培训批次时,您可以克服模型和超参数的复杂性。一定要把机器学习管道的那些简单部分放下来。
- 确保您拥有最小但有效的端到端管道的另一个好处是,您可以在开始更改模型和调整超参数时跟踪性能指标。
- 如果您正在尝试创建某种最终产品,那么80%的ML项目将诚实地只是做前端和后端工作。即使在ML的20%工作中,很多也可能是数据集创建或预处理。
- 始终将您的数据划分为训练和验证(并在需要时进行测试)。在培训期间的某些点检查验证集的性能将帮助您确定网络是否正在学习以及何时开始过度拟合。
- 在创建培训批次时,始终将数据洗牌。
转载自blog.csdn.net/vickv/article/details/81094998