Paper reading：BodyNet: Volumetric Inference of 3D Human Body Shapes - 代码天地

Paper reading：BodyNet: Volumetric Inference of 3D Human Body Shapes

其他 2018-10-31 15:33:32 阅读次数: 0

标题：BodyNet: Volumetric Inference of 3D Human Body Shapes

作者:Gul Varol, Duygu Ceylan Bryan Russell Jimei Yang
Ersin Yumer,z Ivan Laptev,Cordelia Schmid,
Inria, France ，Adobe Research, USA

今天介绍的文章是“BodyNet: Volumetric Inference of
3D Human Body Shapes”——BodyNet：3D人体形状的体积推断。

人体形状估计是视频编辑，动画和时尚产业的一个重要任务。然而，由于诸如人体，衣服和视点的变化等因素，从自然图像预测3D人体形状是非常具有挑战性的。解决该问题的现有方法通常是在已知特定的姿态和形状的先验条件下，拟合对应的参数化人体模型。在文章中，作者提出了一种可替代的表示方法——BodyNet，一个用单张图像可以直接推断体素表达人体形状的神经网络。BodyNet是一个端到端的网络，这主要得益于三个方面：1）3D的体素损失，2）多视角重投影损失，3）2D位姿，2D身体部位分割和3D位姿的中间监督。在作者的实验中证明了，上述的三个方面都能够使得性能提高。

在这里插入图片描述

如图1所示，作者提出的BodyNet能够从单张图片中预测出一个三维体素的人体。可以看到每组图片左侧是输入图片，右侧是预测的人体体素结构和预测的体素部件。

在这里插入图片描述

图二显示的是BodyNet具体的网络结构。输入的RGB图像首先被传送到2D位姿估计和2D人体部件分割的子网络。这个网络的预测结果结合原始图像的RGB特征相结合，一起输入到一个3D位姿预测的网络。所有的子网络结合到最后一个网络来推测体素形状。在实验中，2D位姿网络、2D分割网络和3D位姿网络都是经过预训练的，然后为了得到最后体素的形状，通过使用多视角重投影的损失将几个网络联合起来进行微调。最后，作者将SMPL模型与体积预测相匹配，以便进行评估。

下面几个图表是最终的实验结果，可以看到效果还是非常不错的！

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/Felaim/article/details/82973534

Paper reading：BodyNet: Volumetric Inference of 3D Human Body Shapes

【paper reading】MVSNet: Depth Inference for Unstructured Multi-view Stereo

Paper reading：PointGrid： A Deep Network for 3D Shape Understanding

Paper reading：CubeNet: Equivariance to 3D Rotation and Translation

Paper reading：Frustum PointNets for 3D Object Detection from RGB-D Data

Paper Reading -- CSA-MSO3DCNN: Multiscale Octave 3D CNN with Channel and Spatial Attention

Volumetric 3D Mapping in Real-Time on a CPU

Surface Area of 3D Shapes

leetcode （Surface Area of 3D Shapes）

leetcode （Projection Area of 3D Shapes）

leetcode Projection Area of 3D Shapes

Paper intensive reading (三)：Interactions Between Food and Gut Microbiota: Impact on Human Health

Paper intensive reading (二十二)： Tissue-based map of the human proteome

ONNX模型tensor shapes inference和Flops统计工具

【leetcode】892. Surface Area of 3D Shapes

【leetcode】883. Projection Area of 3D Shapes

887. Projection Area of 3D Shapes

892. Surface Area of 3D Shapes

[leetcode] 883. Projection Area of 3D Shapes

883. Projection Area of 3D Shapes

LeetCode：892. Surface Area of 3D Shapes - Python

LeetCode-Projection Area of 3D Shapes

LeetCode-Surface Area of 3D Shapes

sparse non-rigid registration of 3d shapes

LeetCode(easy)-892、Surface Area of 3D Shapes

LeetCode 883 Projection Area of 3D Shapes 解题报告

LeetCode 892 Surface Area of 3D Shapes 解题报告

883. Projection Area of 3D Shapes*

892.surface area of 3D shapes

Sliding Shapes for 3D Object Detection in Depth Images

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)