OCR光学字符识别

没搞过计算机视觉,只好拿来主义了:
根据网上的推荐:
1. google vision,识别效果还不错,收费,而且对于复杂文本也不是很理想,所以继续寻找开源代码;
2. tesseract,最负盛名的开源识别软件,据说google vision内部也是基于此。

就我们公司的需求来说(提取图片中嵌入的文本),tesseract能识别30%左右的good case,剩下20%凑合,剩下多数是没有文本的;所以技术上来说需求就转化成了good case判定和一般case的除噪,具体就不说了,真是一篇好水的blog

猜你喜欢

转载自blog.csdn.net/chijiaodaxie/article/details/77072614