OCR文字识别rec数据合成制作 - 代码天地

OCR文字识别rec数据合成制作

企业开发 2023-06-05 02:53:07 阅读次数: 0

在做文字识别的时候，往往由于自己的rec训练数据过少，需要自己生成一些数据来加入训练。这里我使用 TextRecognitionDataGenerator 来生成自己所需的数据。

1.使用方法：

下载代码仓库：

git clone https://github.com/Belval/TextRecognitionDataGenerator

# 安装一下依赖库
pip3 install -r requirements.txt
pip3 install -r requirements-hw.txt

cd TextRecognitionDataGenerator/trdg
python run.py -c 10

即可生成10个文本行样本，保存在 out 目录下。

2.遇到的错误：

在运行 python run.py -c 10 时，出现如下错误：

AttributeError: module 'PIL.Image' has no attribute 'Resampling'

原因是PIL.Image 没有 Resampling 这个属性。

3.解决方法：

先升级一下自己的 pillow 版本：

pip install --upgrade pillow -i https://pypi.tuna.tsinghua.edu.cn/simple

自己的版本由 7.1.0 升级到了8.4.0，然后再运行 python run.py -c 10 发现还是有相同的错误，原因是自己的8.4.0版本还是没有这个Resampling 属性。但是pillow不能再往上升级了，因为自己用的是python3.6版本，python3.6最大支持 pillow 8.4.0

进一步解决问题：

打开 trdg/data_generator.py 文件，找到133行左右，修改代码：

去掉 Image.Resampling.LANCZOS和Image.Resampling.NEAREST 中的 Resampling 即可。

resized_img = distorted_img.resize(
                (new_width, size - vertical_margin), Image.Resampling.LANCZOS
            )
resized_mask = distorted_mask.resize(
                (new_width, size - vertical_margin), Image.Resampling.NEAREST
            )


# 改成
resized_img = distorted_img.resize(
                (new_width, size - vertical_margin), Image.LANCZOS
            )
resized_mask = distorted_mask.resize(
                (new_width, size - vertical_margin), Image.NEAREST
            )

猜你喜欢

转载自blog.csdn.net/u012505617/article/details/129832948

OCR文字识别rec数据合成制作

Python制作简易OCR文字识别系统

OCR文字识别

Tesseract Ocr文字识别

OCR文字识别（1）

文字识别 OCR 4.0

图片识别文字， OCR

文字识别总结（OCR）

EasyDL OCR文字识别

OCR文字识别技术

OCR文字识别怎么识别？

OCR文字识别文档识别

MXNET数据集制作，生成rec文件

insightface人脸训练数据rec文件制作

图片文字OCR识别-tesseract-ocr

Paddleocr文本识别数据集的合成与制作----超级详细

OCR文字识别系统

php实现ocr文字识别

OCR文字识别行业应用

OCR视频文字识别简介

python识别图中的文字（ocr）

python + tesseract OCR 文字识别

OCR图片文字识别接口

R_文字识别(OCR)

PaddleHub OCR实现文字识别

Python实现OCR文字识别

如何利用手机的OCR文字识别功能制作扫描件？

开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

文字识别、文档识别、OCR录入

Unity | 总结：OCR文字识别、公式识别

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)