多模态(RGB-D)——MV3D - 代码天地

多模态(RGB-D)——MV3D

其他 2018-10-06 13:28:47 阅读次数: 0

版权声明： https://blog.csdn.net/u013841196/article/details/82940319

《Multi-View 3D Object Detection Network for Autonomous Driving》
2017，Xiaozhi Chen, Huimin Ma et al. MV3D

在这篇文章，作者提出了一个多视角（Multi-View）的3D物体识别网络（MV3D），采用多模态的数据作为输入和预测3D空间的目标。
1.网络结构：
在这里插入图片描述
使用RGB图像、雷达鸟瞰图、雷达前视图三种作为网络的输入：

实现精确的汽车的识别和3D框回归。

2.Region based Fusion Network
本文提出了一个基于区域的融合网络，有效的结合特征。
Three views：bird’s eye view(BV), front view (FV), and the image plane (RGB).
因为特征从不同的视角/模态通常有不同的分辨率，作者采用ROI pooling 为每一个模态获得相同长度的特征向量。
Deep Fusion：从不同的特征去结合信息，之前的工作通常使用early fusion或late fusion。作者采用了一种深度融合（deep fusion）的方法，分层的融合多视角的特征。
Eg：一个L layers的网络结构

1）Early fusion结合特征从多视角（模态）的输入阶段：
在这里插入图片描述
连接的方式可以是concatenation或summation 等等

2）Late fusion使用几个子网络去独立的学习特征后在预测阶段进行结合：
在这里插入图片描述

3）Deep fusion： 提升不同视角中间层更多的交互：

连接操作采用了element-wise mean。

3.Network Regularization：
作者采用了两种方法去正则化region-based fusion network：drop-path training and auxiliary losses。
在这里插入图片描述
4.不同融合方法比较：

注： w/o为是否使用auxiliary loss

小结：
引入了Deep fusion策略，增加中间层不同模态特征间的交互

注：博众家之所长，集群英之荟萃。

猜你喜欢

转载自blog.csdn.net/u013841196/article/details/82940319

多模态(RGB-D)——MV3D

多模态(RGB-D)——RCFusion

多模态(RGB-D)——MMSS

多模态(RGB-D)——人脸识别

多模态(RGB-D)——Ensemble Learning

多模态(RGB-D)——CIMDL

多模态(RGB-D)——FuseNet

多模态(RGB-D)——特征层融合

多模态(RGB-D)——Face Depth Estimation

多模态(RGB-D)——深度融合网络

基于RGB-D图像的多模态特征融合

Multi-View 3D Object Detection Network for Autonomous Driving(MV3D模型)

综述：3D目标检测于RGB-D（Object detection in RGB-D images）

MV3D中环境配置，解决安装python shapely时缺少 geos库的问题

点云学习笔记10——点云与图像目标检测MV3D算法

RGB-D SLAM学习

RGB-D Camera 汇总

RGB-D 数据集

RGB-D相机的标定

RGB-D相机介绍

一起做RGB-D SLAM (3)

RGB-D点云生成

RGB-D SLAM实战（Kinect）

RGB-D SLAM系统评估的基准

制作自己的rgb-d数据集

RGB-D相机视觉SLAM

SUN RGB-D数据集的理解

《Frustum PointNets for 3D Object Detection from RGB-D Data》论文及代码学习

Paper reading：Frustum PointNets for 3D Object Detection from RGB-D Data

Frustum PointNets for 3D Object Detection from RGB-D Data

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)