论文阅读笔记-Automatic Portrait Segmentation for Image Stylization - 代码天地

论文阅读笔记-Automatic Portrait Segmentation for Image Stylization

其他 2018-06-04 22:12:30 阅读次数: 1

转自 https://blog.csdn.net/mtc_Ningning/article/details/79241392

图像风格化的自动肖像分割

本文工作：

l 通过引入新的人像位置和形状作为域特殊知识来扩展FCN-8S的功能；

l 建立了人像图片分割数据集和benchmark来做模型训练和测试；

l 用我们的方法来增强了几种交互式人像编辑的方法实现全自动化。

FCN来分割人像的不足：

原VOC数据集人像分辨率不足&&原任务要分20类，不能做到对人像的精准。本文将FCN在我们的数据集上进行模型权重微调，然后把类别改为两类，得到的结果展示标记为PortraitFCN,但是结果也不是很理想，这是因为CNN为了追求语义信息而忽略了部分空间信息，本文提出了PortraitFCN+ 模型，在FCN里融入了从人像提取的空间信息。

本文方法：

总体来说：在FCN的基础上，用人脸检测（参考文献【SLC09】）来生成人像位置和形状通道，与颜色通道一起送入网络来训练。

l 位置通道：标识像素与人脸的相对位置，由于每张图片位置都不一样，我们采用归一化的x和y通道（像素的坐标），坐标以第一次检测到人脸特征点为准，并预估了匹配到的特征与人体标准姿势之间的一个单应变换T，我们将归一化的x通道定义为T（ximg），其中ximg是以人脸中心位置为0点的x坐标，同理y也是如此。这样，我们就得到了每个像素相对于人脸的位置（尺寸也有相应于人脸大小的缩放），形成了x和y通道。

l 形状通道：参考人像的标准形状（脸和部分上身），我们定义了一个形状通道。首先用我们的数据集计算一个对齐的平均人像mask。计算方法为：对每一对人像+mask，用上一步得到的单应变换T对mask做变换，变换到人体标准姿势，然后求均值。

其中W取值为0或1，当变换后在人像内的取值为1，否则为0。

然后就可以对平均mask类似地变换以与输入人像的面部特征点对齐。

数据和模型训练

l 数据处理

收集1800张手机前置摄像头拍摄的照片，图像大小600*800，1500来训练，300来测试。采用了各种方式（旋转缩放等）来进行数据的增强。

l 模型训练和测试

Caffe GPU 0.2一张，CPU 4秒一张。

猜你喜欢

转载自blog.csdn.net/song_esther/article/details/80551448

论文阅读笔记-Automatic Portrait Segmentation for Image Stylization

Image Segmentation 笔记合集

PolyFormer: Referring Image Segmentation as Sequential Polygon Generation 论文阅读笔记

论文阅读:《Deep Automatic Portrait Matting》 ECCV 2016

人像分割论文SINet: Extreme Lightweight Portrait Segmentation Networks及其PyTorch实现

Image Segmentation

『论文阅读』U-Net Convolutional Networks for Biomedical Image Segmentation

《U-Net: Convolutional Networks for Biomedical Image Segmentation》论文阅读

论文阅读——Rethinking Atrous Convolution for Semantic Image Segmentation

论文阅读：Rethinking Atrous Convolution for Semantic Image Segmentation

[论文阅读] SegDiff: Image Segmentation with Diffusion Probabilistic Models

论文阅读：U-Net: Convolutional Networks for Biomedical Image Segmentation

PointRend: Image Segmentation as Rendering论文翻译

RIS 系列 Semantics-Aware Dynamic Localization and Refinement for Referring Image Segmentation 论文阅读笔记

unsupervised image segmentation by backpropagation-论文笔记

OneFormer: One Transformer to Rule Universal Image Segmentation论文笔记

PortraitNet: Real-time portrait segmentation network for mobile device

【论文阅读笔记】Automatic Liver and Lesion Segmentation in CT Using Cascaded Fully Convolutional Neural Net

论文阅读笔记十：DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs (DeepLabv2)

文章阅读：Multi-scale guided attention for medical image segmentation

Rethinking Atrous Convolution for Semantic Image Segmentation论文解

图像分割论文Efficient Graph-Based Image Segmentation赏析

【论文学习记录】Rethinking Atrous Convolution for Semantic Image Segmentation

《Efficient Graph-Based Image Segmentation》论文解读

PointRend: Image Segmentation as Rendering（论文解读二十四）

FCT: The Fully Convolutional Transformer for Medical Image Segmentation 论文解读

PointRend: Image Segmentation as Rendering

图像分割 Image Segmentation

[论文阅读] Cross-level Contrastive Learning and Consistency Constraint for Medical Image Segmentation

论文阅读：U-Net++: Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)