基于神经网络的图像风格迁移（二） - 代码天地

基于神经网络的图像风格迁移（二）

其他 2020-03-10 12:57:31 阅读次数: 0

之前的那篇博文基于神经网络的图像风格迁移（一）讲述的是Gates论文“Image Style Transfer Using Convolutional Neural Networks”。这篇论文虽然有着极其开创的作用，但是也有一些局限之处，最大的缺点就是必须要实时训练，这样耗时比较长，笔者在GTX 1080Ti双卡上大概需要3min。这样是无法移植到手机或者是网络，这些对实时要求比较高的设备中去的。
好在Johnson的工作成功解决了这个问题，下面我们将介绍论文“Perceptual Losses for Real-Time Style Transfer and Super-Resolution”。
这篇论文的主要工作就是用大量的内容图片仅训练一张风格图片，从而得到某个特定风格的模型，在测试时，将内容图片经过模型就能实时得到一张经过该风格渲染之后的合成图片，值得一提的是，代码还实现了视频的风格迁移。

整篇论文的精华就在于上面这张图，即Johnson设计出的网络结构，先看右边部分，是经典VGG16网络，是风格输入，是内容输出，他们都只通过一次有着固定权重VGG16，在每个block都得到一个feature map，也经过VGG16，得到的特征和风格特征计算style loss，和内容特征计算content loss。同样是两个loss的线性和得到total loss，利用这个total loss去训练左边的Image Transfer Net。

Image Transfer Net的网络结构是3层卷积，5层残差，3层反卷积。所有的卷积层之后都没有池化层，再利用后面的反卷积得到与原图同样大小的图片。

所以整个网络的期望就是，一张输入图片x，经过训练好的模型之后，会得到，而这个已经使得total loss最小了，这样这个就相当于是经过指定风格渲染之后的合成图片。

但是在模型训练好之前，需要利用已经训练好的VGG16网络，计算出total loss训练左边的自定义网络。训练好的自定义网络就是我们需要的模型了。这里content loss，style loss和total loss的计算方式与Gates论文中的计算方式无异。

这里与Gates有一个差异需要注意，就是Gates计算出的total loss是对噪声图片求偏导，而Johnson计算出的loss是对自定义网络的权重w求偏导。

发布了36 篇原创文章 · 获赞 6 · 访问量 7001

私信关注

猜你喜欢

转载自blog.csdn.net/zhuikefeng/article/details/80078149

基于神经网络的图像风格迁移（二）

基于神经网络的图像风格迁移（一）

基于卷积神经网络实现图片风格的迁移 1

基于卷积神经网络图片风格迁移实践

神经网络风格迁移Pytorch

PyTorch深度学习实战 | 搭建卷积神经网络进行图像分类与图像风格迁移

风格迁移——艺术风格化的神经网络算法

keras——基于神经网络的风格迁移生成艺术字

风格迁移：使用卷积神经网络将一种图像的风格应用到另一种图像上

[DeeplearningAI笔记]卷积神经网络4.6-4.10神经网络风格迁移

基于inception-V3卷积神经网络迁移学习的图像分类

基于Python+tensorflow深度学习VGG-19图像风格迁移+自动去噪（MNIST数据集）机器学习+人工智能+神经网络——含全部Python工程源码

Coursera吴恩达《卷积神经网络》课程笔记（4）-- 人脸识别与神经风格迁移

04.卷积神经网络 —— week4. 人脸识别和神经风格迁移

基于卷积神经网络特征图的二值图像分割

基于深度卷积神经网络的图像网络分类

BP神经网络的详细原理，基于BP神经网络的图像跟踪，基于BP神经网络的细胞跟踪，基于BP神经网络的视频跟踪

用风格迁移搞事情！超越艺术字：卷积神经网络打造最美汉字

极简keras：实现神经网络风格迁移(neural style)

C# OpenCvSharp DNN 深度神经网络下的风格迁移模型

基于深度学习的图像分类任务实现（二）卷积神经网络分类器&基于Residual Bolck的卷积神经网络分类器

基于神经网络的图像分类,图神经网络百度百科

基于卷积神经网络的单图像去雨

基于BP神经网络图像几何畸变的校正

基于神经网络图像取证的研究

基于卷积神经网络的小数据集图像分类

基于tensorflow的卷积神经网络图像识别

基于深层神经网络的图像语义分割[一]

基于深度神经网络的图像噪声分类与去噪

基于卷积神经网络的CIFAR10图像分类

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)