百度飞浆PaddleOCR(1)官方链接

官方开源项目地址:
https://github.com/PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR
https://gitee.com/paddlepaddle/PaddleOCRhttps://gitee.com/paddlepaddle/PaddleOCR

中文说明手册:
https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/quickstart.mdhttps://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/quickstart.md
您也可以快速体验超轻量级OCR:
https://www.paddlepaddle.org.cn/hub/scene/ocrhttps://www.paddlepaddle.org.cn/hub/scene/ocr

飞桨官网网址:
www.paddlepaddle.org.cnhttp://www.paddlepaddle.org.cn/

飞桨论坛:
http://discuss.paddlepaddle.org.cnhttp://discuss.paddlepaddle.org.cn/

若干博客与应用案例

Windows10下使用PaddleOCR+c++_ShareProgress的博客-CSDN博客文章目录Windows10下使用PaddleOCR+c++2.1 配置c++环境2.1.1 cmake2.1.2 OpenCV2.1.3 vs20172.1.4 PaddleOCR 项目文件2.1.5 paddle推理预测库2.1.6 模型文件2.2 生成编译例程——ocr_system2.2.1 cmake生成工程2.2.2 使用vs2017编译2.2.3 编译报错2.3 运行demo程序2.3.1 修改配置文件2.3.2 运行程序:2.3.3 解决Windows下控制台输出中文乱码Windows10下https://blog.csdn.net/ShareProgress/article/details/118358040使用qt+PaddleOCR做一个OCR软件demo_ShareProgress的博客-CSDN博客文章目录使用qt+PaddleOCR做一个OCR软件demo效果展示1 建立环境1.1 vs项目环境1.2 qtcreator项目环境1.2.1 源代码整理1.2.2 依赖项整理如下1.2.3 模型文件如下1.2.4 在.pro文件中设置依赖库的模式1.2.5 pro文件中添加.h和.lib2 在工程代码中添加截图功能2.1 新建截图类并连接信号2.2 QImage转cv::Mat3 在工程代码中集成PaddleOCR3.1 初始化PaddleOCR3.2 修改文字识别类的run函数,增加一个返回结果的值的https://blog.csdn.net/ShareProgress/article/details/118385614使用qt+PaddleOCR做一个OCR软件demo(源码+发布版本)_QtpaddleOCR-深度学习文档类资源-CSDN下载使用qt+PaddleOCR做一个OCR软件demoQtpaddleOCR更多下载资源、学习资料请访问CSDN下载频道.https://download.csdn.net/download/ShareProgress/19960301qtocr百度飞浆paddleocr测试软件.zip_-电子政务文档类资源-CSDN下载用QT写的利用高拍仪识别身份证的一个软件,还有不成熟的地方,大家多多指教更多下载资源、学习资料请访问CSDN下载频道.https://download.csdn.net/download/weixin_43107998/19821452QT+OCR实现文本识别_qt文字识别,qt文字识别-C++代码类资源-CSDN下载资源包含tesseract-3.04.00,leptonica-1.71安装包及安装编译说明,QT集qt文字识别更多下载资源、学习资料请访问CSDN下载频道.https://download.csdn.net/download/weixin_39239922/10979331halcon学习网http://www.ihalcon.com/read-17988.html

PaddlePaddle飞桨OCR文本检测

PaddlePaddle飞桨OCR文本检测——入门安装GPU版(一)_非 常 道的博客-CSDN博客_飞桨ocr首先放上github上的开源代码网址,里面的帮助文档说的非常详细:https://github.com/PaddlePaddle/PaddleOCR/环境安装python中环境使用pip安装:在cmd里输入以下代码:python -m pip install paddlepaddle-gpu==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple本人python版本3.7.3可以正常安装,后面的链接是百度自己的镜像源,下载速度飞快。从最上面的Githttps://blog.csdn.net/weixin_42845306/article/details/112688405PaddlePaddle飞桨OCR文本检测——检测模型训练(二)_非 常 道的博客-CSDN博客_paddleocr检测飞桨的OCR模型分为检测、识别和分类,先看检测。检测就是将(可能的)文本标定好坐标,简单说就是给图中的文本画框。数据集制作及图片标注首先制作训练集,找很多带文字的图片,放在一个文件夹里(这里叫img_50),注意图片的名字。虽说可以任意,但最好还是得有规律。然后是标定标签,方法有很多,这里用自带的PPOCRLabel,用法这里有详细介绍:https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/PPOCRLabel/README_ch.md大https://blog.csdn.net/weixin_42845306/article/details/112689152PaddlePaddle飞桨OCR文本检测——识别模型训练(三)_非 常 道的博客-CSDN博客_paddleocr文本检测模型上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152飞桨的OCR模型分为检测、识别和分类,今天讨论识别。ORC的识别,就是给定一张剪辑好的图片,这个图片只有一串纯文本,计算机将图片里的内容识别出来。要识别的图片:OCR的识别和目标识别差不多,都是把猫的图片识别成猫,狗的图片识别成狗数据集准备进入正题自定义图片标注的方法上一篇讲过,产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签rhttps://blog.csdn.net/weixin_42845306/article/details/112726615PaddlePaddle飞桨OCR文本检测——检测模型测试与评估(平均准确率、平均召回率、修改交并比IOU)(四)_非 常 道的博客-CSDN博客接上一篇:检测模型训练(二)PaddlePaddle环境的构建详见专栏内其他文章。本文使用MobileNetV3_large_x0_5_pretrained预训练检测模型,评估该检测模型在icdar2015上的检测效果。icdar2015检测数据集如上图所示。首先修改配置文件,文件路径如下图所示这是MobileNetV3_large_x0_5_pretrained模型的配置文件,如果用的是其他模型,请使用其他的.yml配置文件。打开.yml配置文件,在Architecture标签下可以看到https://blog.csdn.net/weixin_42845306/article/details/113465106PaddlePaddle飞桨OCR文本检测——识别图片文字结果并保存为txt(五)_非 常 道的博客-CSDN博客此部分只考虑rec识别部分,不考虑检测和方向分类。举个栗子,要识别的图片如下所示:这是paddle自带的图片,也是det检测后的框出来的图片,可以看到,rec识别部分的输入图片,是仅有一行文字,没有其它乱七八糟的东西,也没有多余的空白,非常精炼。在PaddleOCR-dygraph根目录下启动cmd,输入识别图片代码如下:python tools/infer_rec.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_common_train_v2.0.yml https://blog.csdn.net/weixin_42845306/article/details/113832699PaddlePaddle飞桨OCR文本检测——更改模型保存间隔(六)_非 常 道的博客-CSDN博客先看配置文件中关于保存的参数epoch_num: 总的训练轮数print_batch_step: 每隔多少个batch打印一回信息save_model_dir: 模型保存路径save_epoch_step: 模型保存时间间隔,以epoch计eval_batch_step: 在第0个batch后每隔500个batch评估一次后面还有batch_size_per_card: 每个batch运行的图片数,过多会爆显存模型训练总共epoch_num个epoch,每个epoch会把所有图片都跑一遍,https://blog.csdn.net/weixin_42845306/article/details/114380408

Clipper

在飞浆ocr源码里面可以发现使用了Clipper库:

PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。 - Gitee.comhttps://gitee.com/paddlepaddle/PaddleOCR/tree/release/2.3/deploy/cpp_infer/includeClipper库是目前计算机图形届广为使用的图形处理库,可以用于解决平面二维图形的多边形简化、布尔运算和偏置处理,在CAD、加工路径与3D打印方面都有着比较重要的应用。

Clipper - an open source freeware polygon clipping libraryhttp://www.angusj.com/delphi/clipper.phpClipper download | SourceForge.nethttps://sourceforge.net/projects/polyclipping/

Clipper / Code / [r569]https://sourceforge.net/p/polyclipping/code/HEAD/tree/

猜你喜欢

转载自blog.csdn.net/libaineu2004/article/details/122036595
今日推荐