OCR的学习笔记

其他 2020-09-14 16:10:50 阅读次数: 0

1 致谢

感谢Python中提供的difflib的函数库～

2 前言

我们希望可以打造一个属于自己的OCR模型～

3 预处理

3.1 获得图像的轮廓——cv2.findContours()

可以学习博文《findContours()函数（讲解）》

3 后处理

在经过OCR的识别过程之后，识别出来的文字可能会出现错误，所以还需要进行后处理；

3.1 相似度匹配——difflib

我们使用相似度来找出词表中相似度最高的名字，使用的函数库是difflib,

3.1.1 使用set_seq1()和set_seq2()进行性能的优化

在difflib的文档中，他们给出了这样的优化建议：

SequenceMatcher 计算并缓存有关第二个序列的详细信息，这样如果你想要将一个序列与多个序列进行比较，可使用 set_seq2() 一次性地设置该常用序列并重复地对每个其他序列各调用一次 set_seq1()。

我们也可以依照这种方法进行优化；

猜你喜欢

转载自blog.csdn.net/songyuc/article/details/107081814

OCR的学习笔记

『OCR深度实践』OCR学习笔记(2)：图像预处理

『OCR深度实践』OCR学习笔记(1)：绪论

OCR学习笔记（3）tesseract学习

学习笔记-图像识别(Photo OCR)

caffe_ocr开源项目学习笔记

Halcon学习笔记（三）——OCR识别

OCR学习

【OCR】OCR学习记录(4)

【OCR】OCR学习记录(3)

【OCR】OCR学习记录(2)

【OCR】OCR学习记录(1)

Halcon学习笔记之OCR系列-OCR投影以及汉字训练识别

吴恩达机器学习笔记10-照片OCR

Andrew Ng 机器学习笔记 16 ：照片OCR

吴恩达机器学习笔记——照片OCR

Halcon学习笔记之OCR系列-喷码字体识别

Halcon学习笔记之OCR系列-车牌识别

OpenCV学习笔记11-Tesseract-OCR的安装和使用

机器学习笔记使用PPOCRLabel标注自己的OCR数据集

opencv学习笔记五--文件扫描+OCR文字识别

OCR学习记录

基于深度学习的OCR

OCR学习（2）CTPN学习

ICPR-2018-OCR笔记

官网实例详解4.12（image_ocr.py）-keras学习笔记四

吴恩达机器学习笔记 —— 19 应用举例：照片OCR（光学字符识别）

Python学习笔记--Python 爬虫入门 -17-11 tesseract-OCR

Halcon学习笔记之OCR系列-环形字符，斜体字

文档识别深度学习OCR

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

周排行

决策树的部分理解

STM32软件IIC的实现

RocketMQ原理解析-HA

vue-动态路由（路由的传参和接参）

利用python对Excel中的特定数据提取并写入新表

【Ubuntu】 Ubuntu16.04搭建NFS服务

Elasticsearch基础操作与对应的curl命令行，python对接实现

JVM数据存储结构 & Java的值传递和址传递

yum命令使用指南

java基础（一）：java语法基础

每日归档

更多

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)