版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhq9695/article/details/83045257
目录
学习完吴恩达老师机器学习课程的照片OCR,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。
如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~
0. 前言
在设计机器学习项目的时候,通常会制定一条流水线(数据预处理、特征提取、...之类),根据流水线完成项目。
在完成项目的时候,通常对其精确率进行优化,可采取上限分析(Ceiling analysis),分析最有可能提高精确率的地方。
1. 流水线
如下图所示(图源:吴恩达机器学习),为OCR(光学字符识别)的流水线:
图像 文本识别 字符分割 字符识别
2. 上限分析(Ceiling analysis)
上限分析作用是在于发现流水线中哪个步骤优化以后,会给整个模型带来最大的优化。
如下图所示(图源:吴恩达机器学习):
在上述例子中,整体的精确率为 ,如果人为进行文本识别(将文本识别的精确率提高至 ),则整体精确率为 ,提高了 ,如果继续人为进行字符分割(将字符分割的精确率提高至 ),则整体精确率为 ,提高了 ,如果继续人为进行字符识别(将字符识别的精确率提高至 ),则整体精确率为 ,提高了 。由此可见,优化文本识别,会给整个模型带来最大的优化。
如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~