文本检测和识别代码结构梳理 - 代码天地

文本检测和识别代码结构梳理

其他 2019-02-22 21:04:45 阅读次数: 0

前言：

最近学习了一些OCR相关的基础知识，包含目标检测和自然语言处理。

正好，在数字中国有相关的比赛：

https://www.datafountain.cn/competitions/334/details/rule

所以想动手实践一下，实际中发现，对于数据标签的处理和整个检测和识别的流程并不熟悉，自己从头去搞还是有很大难度。

幸好，有大佬们之前开源的一些baseline可以参考，有检测的也有识别的，对于真真理解OCR识别是有帮助的。

1）最初baseline AdvancedEAST + CRNN
https://github.com/Tianxiaomo/Cultural_Inheritance-Recognizing_Chinese_Calligraphy_in_Multiple_Scenarios

2）一个新的baseline：EAST + ocr_densenet

https://github.com/DataFountainCode/huawei_code_share

还有最原始的开源的EAST 源码，advanced EAST源码

https://github.com/argman/EAST

https://github.com/huoyijie/AdvancedEAST

CRNN 源码

https://github.com/bgshih/crnn

以及densenet 等，都是很好的学习资源

https://github.com/yinchangchang/ocr_densenet

下面，先对EAST 的整个代码进行梳理：
训练样本格式：

img_1.jpg

img_1.txt

img_2.jpg

img_2.txt

即训练集包含图像以及图像对应的标注信息（4个位置坐标和文字）

猜你喜欢

转载自www.cnblogs.com/Allen-rg/p/10420553.html

文本检测和识别代码结构梳理

恶意代码检测--已看梳理

如何使用 Python 检测和识别车牌(附 Python 代码)

轻松使用 Python 检测和识别车牌(附代码)

真香！用Python检测和识别车牌(附代码)

检测和识别车牌的python的简单示例代码

基于深度的目标检测与文本检测和识别

【目标检测】基于yolov5的火灾烟雾检测和识别(附代码和数据集)

经典网络结构梳理：YOLO目标检测算法。

经典网络结构梳理：SSD目标检测算法。

经典网络结构梳理：RCNN，FastRcnn，FasterRcnn目标检测

各类识别、深度学习-开源代码文献梳理

各类识别、深度学习开源代码及文献网站梳理

各类识别、深度学习开源代码及文献梳理

文本检测评估代码

机器学习笔记基于OpenCV的文本检测和识别模块

人脸检测识别文献代码

戴眼镜检测和识别2：Pytorch实现戴眼镜检测和识别(含戴眼镜数据集和训练代码)

疲劳驾驶检测和识别2：Pytorch实现疲劳驾驶检测和识别(含疲劳驾驶数据集和训练代码)

吸烟(抽烟)检测和识别2：Pytorch实现吸烟(抽烟)检测和识别(含吸烟(抽烟)数据集和训练代码)

python-opencv人脸检测和识别实现（有代码和资源）

自然场景文本检测与识别

Python代码用多种方式实现识别文本风格和作者数量(SVM,LogicRegression)

【目标检测】基于yolov5的交通标志检测和识别(附代码和数据集)

【目标检测】基于yolov7的安全帽佩戴检测和识别(附代码和数据集，Ubuntu系统)

【目标检测】基于yolov7的海上船舶检测和识别(附代码和数据集，Windows系统)

【目标检测】基于yolov7的安全帽佩戴检测和识别(附代码和数据集，Windows系统)

【目标检测】基于yolov7的海上船舶检测和识别(附代码和数据集，Ubuntu系统)

自然场景文本检测工程中使用所以代码和理论

检测和识别，包括人脸检测，常用到的方法的梳理，很好，有点多，转发地址了，请看，下面知乎原文

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

Python模块之shelve

勇于承担责任

Hikyuu 1.1.0 发布，量化交易研究框架

字节跳动Java3面“凉凉”~不负韶华，努力复习备战“金三银四”

Linux下静态链接库与动态链接库的区别

spring boot架构改造

怎么理解AOP

文件不同步 --本地和eclipse

在linux配置nginx负载均衡

Linux Shell基础命令

每日归档

更多

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)