机器学习-2(机器学习程序的步骤)

版权声明:成都软件测试交流群,339614248,欢迎你的加入 https://blog.csdn.net/louishu_hu/article/details/83112610

1 收集数据 

    这一块你要的知识是如何获得数据 如果不是自己的生产环境产生的真实数据,你还需要获得爬虫的技能,来从外部获取数据到自己的分析库。

2 准备输入数据

    这一块可以理解为数据转换,把数据格式转换为符合自己的。不近要匹配你的编程语言的习惯,而且要做到简化。还有一点就是还要匹配某些算法对数据格式的要求。这里就不细讲,到了相关知识点我相信大家都一目了然了

3 分析输入数据

   简单理解就是人工分析,单步调试的意义。人工去把数据拿出来观察,是否有空值,特殊的字符,特殊的样式,个别的异常值等等。这是为了排除垃圾数据,比如开发环境里面的脏数据。我们就叫做数据清洗吧。

4 训练算法

    此时我们将格式化的数据输入到算法,从中抽取我们想要的东西。我们就叫做数据抽取,然后记得要把抽取后的数据存储起来,方便我们后续使用。

5 测试算法

    这一步是为了评估算法,测试下我们的算法的工作效果。如何评估算法的成功率,这里就是我们测试人员需要关心的了

对于监督学习的话,我们就必须清楚目标变量的值。而对于无监督学习,我们可以根据具体情况用其他评测手段来验证算法的成功率。

6 使用算法

    这里我们就要把我们的算法集成到我们的系统中去,让它执行实际任务,用来检验在真实环境下是否能保持同样的成功率

猜你喜欢

转载自blog.csdn.net/louishu_hu/article/details/83112610