PaddleOCR 识别器数据增强 - 代码天地

PaddleOCR 识别器数据增强

企业开发 2022-06-06 10:24:08 阅读次数: 0

PaddleOCR 识别器自带了数据增强方法，如何开启呢？
参照：rec_chinese_common_train_v2.0.yml配置文件。
增加- RecAug: 字段，例如：

Train:
  dataset:
    name: SimpleDataSet
    data_dir: ./train_data/rec/
    label_file_list: ["./train_data/rec/rec_gt_train.txt"]
    transforms:
      - DecodeImage: # load image
          img_mode: BGR
          channel_first: False
      - RecAug: 
      - CTCLabelEncode: # Class handling label
      - RecResizeImg:
          image_shape: [3, 32, 320]
      - KeepKeys:
          keep_keys: ['image', 'label', 'length'] # dataloader will return list in this order
  loader:
    shuffle: True
    batch_size_per_card: 32
    drop_last: True
    num_workers: 0

在这里插入图片描述
增强方法在PaddleOCR-release-2.4/ppocr/data/imaug/rec_img_aug.py里面。
代码如下：

class RecAug(object):
    def __init__(self, use_tia=True, aug_prob=0.4, **kwargs):
        self.use_tia = use_tia
        self.aug_prob = aug_prob

    def __call__(self, data):
        img = data['image']
        img = warp(img, 10, self.use_tia, self.aug_prob)
        data['image'] = img
        return data

猜你喜欢

转载自blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/125155386

PaddleOCR 识别器数据增强

PaddleOCR识别问题

PaddleOCR，图像检测识别

通过PaddleOCR识别PDF

paddleOCR文字识别

PaddleOCR图片识别

Paddleocr数据集制作

paddleocr

paddleocr文本识别模型的训练

基于PaddleOCR的车牌检测识别

PaddleOCR训练自己的数据集

PaddleOCR简单文字识别使用(一)

PaddleOCR文字检测、标注与识别详细记录

YOLO+PaddleOCR实现车牌检测识别

使用 PaddleHub 结合 PaddleOCR 实现车牌识别

PaddleOCR方向分类器优化输入图像

PaddlePaddle / PaddleOCR Public训练自己的数据集

paddleocr学习笔记（八）训练自己的文字识别数据

Paddleocr文本识别数据集的合成与制作----超级详细

PaddleOCR docker实现文字检测身份证识别

PaddleOCR数字仪表识别——图像预处理(python)

【教程】PaddleOCR文字识别，整个安装环境过程

基于PaddleOCR的集装箱箱号检测识别

paddleocr自己训练模型识别字符

PaddleOCR+OpenCV实现中英文识别

YOLOv5+PaddleOCR手写签名识别

PaddleOCR—图片文字识别提取—快速使用教程

【AI测试】已落地-python文字图像识别PaddleOCR

PaddleOCR学习笔记3-通用识别服务

PaddleOCR学习笔记2-初步识别服务

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)