caffe学习记录(八) CRNN+BLSTM+CTC OCR识别,后续加上SSD做检测

https://github.com/senlinuc/caffe_ocr源代码在此,是基于senlnuc的模型进行学习的。

好长时间没更新学习博客了,之前一直在忙着做基网络模型的评测,以及tesseract 和其他Ocr的研究等。

更新一下最近学习的OCR检测,要求是速度要快,准确度要相对较高!

整个操作流程:

先用卷积进行特征提取,这里我用的是Densenet的模型,然后用双Lstm进行不定长处理,然后接上warp-ctc进行去重定向。

作者中文字符识别的准确率如下表:

我是基于linux进行的英文自然场景英文识别,目前还在识别的训练阶段,接下来会加上自然场景的检测,暂定用mobileNet-ssd。训好后会放出评测

猜你喜欢

转载自www.cnblogs.com/ChrisInsistPy/p/9779591.html