还在愁做OCR法方向没有开源数据集嘛，PaddleOCR的这个工具你敢不敢看一下？

其他 2023-04-08 08:33:26 阅读次数: 0

近期，PaddleOCR开源了Style-Text数据合成工具。
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/StyleText/README_ch.md

项目主页

https://github.com/PaddlePaddle/PaddleOCR

到底多强

结合GAN，输入一串文本和一个风格图片就可以生成对应的场景的图片！！！！！项目开源直接使用无需训练！！！！

效果⬇️

该工具可以批量合成大量与目标场景类似的图像，如下图所示。
在这里插入图片描述
Style-Text数据合成工具是基于百度自研的文本编辑算法《Editing Text in the Wild》
https://arxiv.org/abs/1908.03047

不同于常用的基于GAN的数据合成工具，Style-Text主要框架包括：1.文本前景风格迁移模块 2.背景抽取模块 3.融合模块。如上图所示。经过这样三步，就可以迅速实现图像文本风格迁移。下图是更多的数据合成工具效果图。

在这里插入图片描述

此外，采用上述合成数据和真实数据一起训练，可以显著提升特殊场景的性能指标，Repo中也给出了两个场景应用案例：
在这里插入图片描述

下面给出一些真实场景图像和合成图像的示例：

在这里插入图片描述

此外，该项目还提供了一批中英韩5万张通用场景数据用作文本风格图像，便于合成场景丰富的文本图像，下图给出了一些示例。

在这里插入图片描述

这个方向才刚刚开始，文本数据自动合成对于产业应用还是很有意义，尤其是长尾场景。

猜你喜欢

转载自blog.csdn.net/u012526003/article/details/111298463

还在愁做OCR法方向没有开源数据集嘛，PaddleOCR的这个工具你敢不敢看一下？

敢不敢

将供应链商业敏感隐私数据上链，你敢不敢？

敢不敢想——感想

嘿！这个精美的开源小程序，你要不要看一下？

Spring boot yml还敢不敢再坑一点? 配置多数据源的问题!

做爬虫的可以看一下

25,000,000行的代码就问你敢不敢动？！

25,000,000行的代码就问你敢不敢动？！

25,000,000 行的代码就问你敢不敢动？！

2500 万行的代码就问你敢不敢动？！

三胎放开了，你敢不敢生？反正我敢

哔哩哔哩发威，停你没商量，还敢不敢乱发东西了？

敢不敢按下Ctrl+V看看复制了什么？

2019年软件盘点，看一下哪些你还没有用过

求大神帮忙看一下，这个问题我百度也没有答案!（酷课堂iOS交流群问答整理201811期）

还在纠结你为什么你学不好Python？不如来看一下我的建议吧！！

Blockathon，挑战区块链开发，敢不敢来！

“金三银四“，敢不敢“试”？

我整理了一些Python测试的库，看一下有没有你需要的库

愚人节你敢不敢表白?80行Python表白程序已发送,请接收

你愿意坚持写 30 天代码吗？30 天百楼挑战赛，敢不敢参加

代码生成OCR训练集，老板：没有数据？你new一个

python测颜值（优良中差不及格）？敢不敢来一发

张一鸣批员工上班时聊游戏：老板好不好，看员工敢不敢怼他

适合新手做的自媒体有哪些？这些领域你可以看一下

还在愁没有游戏玩？ 2018年 GooglePlay 最佳游戏指南，你值得拥有

阿里大数据专家：Flink你明白吗？来看一下我说的吧

这款耳机性价比值得你看一下

看看一下

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)