【文字风格】SwapText: Image Based Texts Transfer in Scenes论文阅读 - 代码天地

【文字风格】SwapText: Image Based Texts Transfer in Scenes论文阅读

其他 2020-03-20 10:08:17 阅读次数: 0

来源:阿里巴巴
code:未开源

摘要： 在保留原始字体、颜色、大小和背景纹理的同时，在场景图像中交换文本是一项具有挑战性的任务，因为不同的因素之间存在复杂的相互作用。在这项工作中，我们提出了SwapText，一个三个阶段的框架来转移文本的场景图像。首先，提出了一种新的文本交换网络来代替前景图像中的文本标签。其次，学习背景补全网络来重建背景图像。最后，利用所生成的前景图像和背景图像，通过融合网络生成单词图像。利用提出的框架，我们可以操作输入图像的文本，即使有严重的几何失真。定性和定量的结果，提出了几个场景文本数据集，包括规则和不规则的文本数据集。我们进行了大量的实验来证明我们的方法的有效性，如基于图像的文本翻译，文本图像合成等。

作用：
在这里插入图片描述
前景+背景+融合三部分，但是是端到端训练的。

前言

文字识别中，现在有很多人工合成的数据集，前期是用随机的图片，再配以多样变化的字体合成而成。然而，合成图像与场景中的图像并不完全吻合，这一点在应用合成图像训练DNN模型时至关重要。（不知道有多大影响，能提升多少）

发布了244 篇原创文章 · 获赞 147 · 访问量 28万+

私信关注

猜你喜欢

转载自blog.csdn.net/u011622208/article/details/104982222

【文字风格】SwapText: Image Based Texts Transfer in Scenes论文阅读

【害虫识别论文阅读六】Image Classification of Pests with Residual Neural Network Based on Transfer Learning

图像风格转换(Image style transfer)

经典论文重读---风格迁移篇(一)：Image Style Transfer Using Convolutional Neural Networks

论文阅读《Camera pose voting for largescale image-based localization》

论文阅读：CogLTX: Applying BERT to Long Texts

【论文阅读】(TEVC 2022)A Meta-Knowledge Transfer-Based Differential Evolution for Multitask Optimization

论文翻译：Speech Enhancement Based on the General Transfer Function GSC and Postfiltering

reference based image enhancement 论文调研

【论文阅读】CVPR 2019 Oral | Progressive Pose Attention Transfer for Person Image Generation

论文笔记：Visual Attribute Transfer through Deep Image Analogy

《FFDNet: Toward a Fast and Flexible Solution for CNN based Image Denoising》论文阅读

《Real Image Denoising Based on Multi-Scale Residual Dense Block and Cascaded U-Net》论文阅读

【农业害虫论文阅读三】Insect pest image detection and recognition based on bio-inspired methods

论文阅读 (79)：TransMIL: Transformer based Correlated Multiple Instance Learning for Whole Slide Image

【图像修复】论文阅读笔记 ----- 《Image inpainting based on deep learning: A review》

图像分割论文Efficient Graph-Based Image Segmentation赏析

《Efficient Graph-Based Image Segmentation》论文解读

《Automatic Image-Based WasteClassification》论文笔记

The Devil Is in the Details: Window-based Attention for Image Compression【论文翻译】

论文翻译：Text-based Image Editing for Food Images with CLIP

文献阅读 Meta transfer learning-based super-resolution infrared imaging

论文理解Fast Patch-based Style Transfer of Arbitrary Style

Transfer learning for deep neural network-based partial differential equations solving论文笔记

CNN实现图像风格迁移 ---Image Style Transfer Using Convolutional Neural Networks

A Content Transformation Block for Image Style Transfer (CVPR2019, 风格迁移)

ICLR 2022：文本驱动的图像风格迁移：Language-Driven Image Style Transfer

计算机视觉算法中的图像风格转换（Image Style Transfer）

《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its...》论文阅读之CRNN

论文阅读笔记（五）：Scene-Awareness Based Single Image Dehazing Technique via Automatic Estimation of Sky Area

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)