吴恩达机器学习(十六)机器学习流水线、上限分析

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhq9695/article/details/83045257

目录

0. 前言

1. 流水线

2. 上限分析(Ceiling analysis)


学习完吴恩达老师机器学习课程的照片OCR,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

0. 前言

在设计机器学习项目的时候,通常会制定一条流水线(数据预处理、特征提取、...之类),根据流水线完成项目。

在完成项目的时候,通常对其精确率进行优化,可采取上限分析(Ceiling analysis),分析最有可能提高精确率的地方。

1. 流水线

如下图所示(图源:吴恩达机器学习),为OCR(光学字符识别)的流水线:

图像 \rightarrow 文本识别 \rightarrow 字符分割 \rightarrow 字符识别

2. 上限分析(Ceiling analysis)

上限分析作用是在于发现流水线中哪个步骤优化以后,会给整个模型带来最大的优化

如下图所示(图源:吴恩达机器学习):

在上述例子中,整体的精确率为 72\% ,如果人为进行文本识别(将文本识别的精确率提高至 100\% ),则整体精确率为 89\% ,提高了 17\% ,如果继续人为进行字符分割(将字符分割的精确率提高至 100\% ),则整体精确率为 90\% ,提高了 1\% ,如果继续人为进行字符识别(将字符识别的精确率提高至 100\% ),则整体精确率为 100\% ,提高了 10\% 。由此可见,优化文本识别,会给整个模型带来最大的优化


如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

猜你喜欢

转载自blog.csdn.net/zhq9695/article/details/83045257
今日推荐