Colorization论文阅读——Let there be Color!

编程语言 2018-12-25 21:53:47 阅读次数: 0

论文

Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification

发表于SIGGRAPH 2016

方法

首先，图片的颜色空间为LAB颜色空间，其中L代表亮度，AB分别代表洋红(Cyan)到绿色(Green)的过渡和黄色(Yellow)到蓝色(Blue)的过渡。在灰度图中，L完全保留，而AB完全丢失，因此需要通过L预测出AB，再叠加到原来的L上，就能够得到彩色图片。

如下图，这篇论文采用了全局和局部的两种维度提取特征。局部特征基本上是一个U-Net，全局特征一方面要得到整张图片的分类，另一方面要把全局的特征和局部特征做融合(Fusion)。

网络结构

其中具体每一层的参数如下图所示。

网络具体参数

里面最核心最具创新性的应该就是全局特征和局部特征的Fusion。Fusion的过程非常简单粗暴，就是把全局特征的向量一个一个排起来，concatenate到局部特征的每个像素上。即

另外，和其他Colorization方法不完全相同的是，它使用了图片的分类。因此，它的Loss Function由颜色和分类两部分组成，即

第一项描述了颜色上的误差， $y^{color,*}$ 为ground truth， $|\cdot|_{FRO}$ 表示F范数，综合起来就是各个像素上的均方误差（MSE）。第二项描述了分类上的误差，就是分类的交叉熵误差（Cross Entropy Error）。

疑问

Github上可以找到相关代码colorNet-pytorch，训练后发现有些结果比较好，比如天空是蓝的，草地是绿的。但对于一些可能有歧义性的物体，比如飞机的颜色可能是各种颜色的，那么感觉这种方法只能做一个各种可能颜色的平均，因此看起来是灰色的，和原来的灰度图差距不大。

猜你喜欢

转载自blog.csdn.net/yucong96/article/details/85247072

Colorization论文阅读——Let there be Color!

【论文阅读】Color Transfer between Images

论文阅读之《Color Constancy Using CNNs》

Color it

Color

Deep Colorization（论文阅读记录）

论文阅读之《Quasi-Unsupervised Color Constancy 》

论文拜读：大规模3D纹理重建Let There Be Color

An overview of color constancy algorithms论文笔记

OpenCV图像处理算法——2（《Local Color Correction 》论文阅读及C++复现）

[论文阅读] HairGAN: Spatial-Aware Palette GAN for Hair Color Transfer

《RIDNet: Recursive Information Distillation Network for Color Image Denoising》阅读笔记

论文阅读笔记（九）【TIFS2020】：True-Color and Grayscale Video Person Re-Identiﬁcation

Canvas Color

random color

Color android

Favorite Color

Color Histograms

declare -A color

Color the ball

color and background

color space

Color balance

Deep color

color设置

Linux --color

css color

Color it题解

color转换

颜色 color

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)