Segmentation-driven 6D Object Pose Estimation论文理解

其他 2020-03-01 20:05:46 阅读次数: 0

文章目录

本文创新点\贡献
方法

方法概述
分割流
回归流

训练

最终loss
推理

实验结果
总结

本文创新点\贡献

分割驱动，让每个可以看到的部分都对关键点位置的预测做出贡献

方法

在这里插入图片描述

方法概述

假设：
物体是刚体且CAD模型已知。

对输入的图片做卷积，然后产生分割和预测，将图片分成 $S \times S$ 个网格，每个网格都i预测属于的类别并回归关键点的位置，关键点在这里就是交点，然后根据2D-3D对应来做EPnP

分割流

在这里插入图片描述
对每个 $S \times S$ 的cell预测label， $D_{seg} = K +1$ ， $K$ 是类别数，因为前景和背景的不平衡，所以使用的 Focal Loss

回归流

在这里插入图片描述
预测内容：
在分割出来的mask中进行的预测，预测提前定义好的3D关键点的2D映射，这里用的是八个角点，所以 $N=8$ ， $D_{reg} = 3N$

预测方法：
没有直接预测位置，预测的是八个角点对于中心位置的偏移，所以设2D形心是 $c$ ，对于第 $i$ 个关键点，预测的偏移为 $h_i(c)$ ，所以绝对位置就是 $c+h_i(c)$ ，然后训练的时候残差就是：
$\varDelta_i(c) = c + h_i(c) - g_i$
所以loss就是：
$L_{pos} = \sum_{c\in M}\sum^N_{i=1}||\varDelta_i(c)||_1$
同时还用sigmoid计算对于每个预测的置信度，来表示和真实值的相似程度：
$L_{conf} = \sum_{c\in M}\sum^N_{i=1}||s_i(c) - \exp(-\tau||\varDelta_i(c)||_2)||_1$

所以这一块的总loss是：
$L_{reg} = \beta L_{pos} + \gamma L_{conf}$

训练

网络结构是Darknet-53，输出为3Dtensor，空间分辨率是 $S\times S$ ，在其中的每个cell上预测两个特征向量 $D_{seg},D_{reg}$ ，这个网格能控制投票的数量。
两个流的结构是相同的，不过输出的特征维度不同

最终loss

$L = L_{seg} + L_{reg}$

推理

在这里插入图片描述
多同类物体：
因为这里的分割是类级别的，而不是实例级别的，所以对多同类物体的情况表现不好，为了解决这个作者使用了聚类方法，使用相似像素距离阈值来做聚类

EPnP:
如果直接使用RANSAC的话速度比较慢，所以作者提取了 $n=10$ 个最高置信度的预测来做RANSAC，能减少计算量，之后再用EPnP来求出结果，过程如下图：
在这里插入图片描述
$a是网格上的类别预测，b是显示出所有预测的关键点，c是对关键点过滤，d是最终Pose可视化$

实验结果

在这里插入图片描述
$消融实验，NF不知道是啥，HC是只用置信度最高的一个预测点，b-n是RANSAC取n个最高点的效果$

在这里插入图片描述
$和其他的方法的对比$

训练和测试的时候把所图片resize到 $608 \times 608$ ，然后将2D映射的位置和置信度都正则化到范围[0,10]

就当是输出的比例，要结果的时候再映射回去

总结

就算是逐像素预测了，2020看这篇文章确实没啥东西，主要后面出来了不少厉害的方法，比起来这个就比较简单基础了

虽然说不是很新，但是这方法跟这之前的yolo-6D有啥区别呢？都是用cell，都是预测的偏移，都是用的PnP，就名字起的好，这个比yolo-6D多了个分割，就是预测的时候只计算分割mask部分，就这个改动，这也能中了？

发布了63 篇原创文章 · 获赞 2 · 访问量 8005

私信关注

猜你喜欢

转载自blog.csdn.net/McEason/article/details/104565525

Segmentation-driven 6D Object Pose Estimation论文理解

DeepIM: Deep Iterative Matching for 6D Pose Estimation论文理解

Learning latent geometric consistency for 6D object pose estimation in heavily cluttered scenes

Yolo-6D(Real-Time Seamless Single Shot 6D Object Pose Prediction)理解

6D姿态估计从0单排——看论文的小鸡篇——Learning Analysis-by-Synthesis for 6D Pose Estimation in RGB-D Images

论文笔记之6D姿态数据集：T-LESS An RGB-D Dataset for 6D Pose Estimation of Texture-less Objects

论文笔记之Point-Set Anchors for Object Detection, Instance Segmentation and Pose Estimation

3D Segmentation with Exponential LogarithmicLoss for Highly Unbalanced Object Sizes-MICCAI2018【论文理解】

6D姿态估计从0单排——看论文的小鸡篇——Model Based Training, Detection and Pose Estimation of Texture-Less 3D Objects in Heavily Cluttered Scenes

Multi-view Self-supervised Deep Learning for 6D Pose Estimation in the Amazon Picking Challenge（翻译）

[ICRA 2019]Multi-Task Template Matching for Object Detection, Segmentation and Pose Estimation Using Depth Images

Real Time pose estimation of a textured object (solvePnP)

RGB-D object recognition and pose estimation based on pre-trained convolutional neural network 阅读记录

姿态估计论文理解 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields ∗ paperuri:(ee7d699fb12eb95daec96f29da5452b9)

PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation 论文和代码理解

Pix2Pose代码实现 6D BOPChallenge 2019/2020--pix2pose

【论文阅读】Pose from Shape: Deep Pose Estimation for Arbitrary 3D Objects

[论文理解] FSA-Net: Learning Fine-Grained Structure Aggregation for Head Pose Estimation from a Single Image

[论文理解]Region-Based Convolutional Networks for Accurate Object Detection and Segmentation

R-CNN（Rich feature hierarchies for accurate object detection and semantic segmentation）论文理解

Fast Video Object Segmentation by Reference-Guided Mask Propagation论文理解

FEELVOS: Fast End-to-End Embedding Learning for Video Object Segmentation论文理解

Video Object Segmentation using Space-Time Memory Networks论文理解

YOLO-Pose: Enhancing YOLO for Multi Person Pose Estimation Using Object Keypoint Similarity Loss 笔记

img2pose: Face Alignment and Detection via 6DoF, Face Pose Estimation代码理解

Pose Estimation

3D pose estimation 综述

3D Bounding Box Estimation Using Deep Learning and Geometry论文理解

[论文理解]Selective Search for Object Recognition

Relation Networks for Object Detection 论文理解

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)