运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别 - 代码天地

运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别

编程语言 2018-09-18 18:01:33 阅读次数: 0

运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别

最近在学习计算机视觉相关的内容，在github上发现了非常好的项目chinese-ocr
该项目主要实现以下三个功能：
1. 文字方向检测 0、90、180、270度检测（这个功能不太实用，现实中角度不太会这么巧合）
2. 文字检测后期将切换到keras版本文本检测实现keras端到端的文本检测及识别（项目里面有两个模型keras和pytorch，建议直接用pytorch，它的效果好很多。）
3. 不定长OCR识别
项目地址：
chinese-OCR
https://github.com/jiangxiluning/chinese-ocr
其中遇到的坑有以下几个：
1、在chinese-ocr目录下运行时，会出现python的各种包找不到的情况，需要在代码中import部分将目录添加进去：类似下图
这里写图片描述
2、运行完setup.sh之后应该进入anaconda创建的chinese-ocr环境中再运行demo.py，否则很多库都找不到。
3、在运行tensorflow时可能会出现资源相关都问题，需要在代码中设置资源配置，例如按需增加资源等。
还遇到很多坑，暂时想不起来了，待更新。
总体来说，这个项目都效果还不错。下面是效果图：这是pytorch模型的结果
这里写图片描述

非常厉害的模型，收获很多！

猜你喜欢

转载自blog.csdn.net/p312011150/article/details/82660072

运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别

文字识别CRNN（基于pytorch、python3）实现不定长中文字符识别

PyTorch实现不定长度的文字识别（CRNN实现+几乎每行注释+训练数据集合）开箱即用

在服务器上搭建基于yolo3 与crnn 实现中文自然场景文字检测及识别，GPU版本

【OCR技术系列之八】端到端不定长文本识别CRNN代码实现

tensorflow LSTM+CTC实现端到端的不定长数字串识别

一文读懂CRNN+CTC文字识别

『一图流』基于CRNN的OCR张量流概览【OCR技术系列之八】端到端不定长文本识别CRNN代码实现

CTPN/CRNN的OCR自然场景文字识别理解（二）

基于attention机制实现 CRNN OCR文字识别

【OCR技术系列之七】端到端不定长文字识别CRNN算法详解

NLP 之自然场景文字识别 2 CRNN tensorflow（转）

CNN+GRU+CTC实现不定长字符串识别（二）

CNN+GRU+CTC实现不定长字符串识别（一）

CRNN+CTC (基于CTPN 的end-to-end OCR)

lstm+ctc 实现ocr识别

OCR- CTPN CTPN/CRNN的OCR自然场景文字识别理解（一）

实现基于darknet框架实现CTPN版本自然场景文字检测与CNN+CTCOCR文字识别的ChineseOCR搭建

php实现ocr文字识别

PaddleHub OCR实现文字识别

Python实现OCR文字识别

文字识别（六）--不定长文字识别CRNN算法详解

OCR-CRNN （CNN+CTC）文字识别，实践上手（三）

EAST实现自然场景下文本检测tensorflow

caffe学习记录（八） CRNN+BLSTM+CTC OCR识别，后续加上SSD做检测

crnn+ctc识别模型中,lmdb脚本只转换部分数据集

文本识别CRNN模型介绍以及pytorch代码实现

C实现不定长数组

视频文字检测，自然场景文字识别

如何精准实现OCR文字识别？

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)