多模态(RGB-D)——特征层融合 - 代码天地

多模态(RGB-D)——特征层融合

其他 2018-10-06 13:30:17 阅读次数: 0

版权声明： https://blog.csdn.net/u013841196/article/details/82846668

《Multimodal Deep Learning for Robust RGB-D Object Recognition》
2015，Andreas Eitel et al. 特征层融合

1.提出了一种新的RGB-D结构为目标识别（最后一层融合concat）：
在这里插入图片描述
2. 数据准备
由网络结构图可知，Depth image的输入为3通道。
几种不同的深度图编码方式，如下图所示
几种最常见的方式：
（1）渲染depth数据到grayscale和重复grayscale到3个通道作为网络的输入
（2）使用表法向（x,y,z）来作为网络的输入
（3）HHA：encodes in the three channels the height above ground, horizontal disparity and the pixelwise angle between a surface normal and the gravity direction.
（4）本文提供的方法，效果优于HHA，首先归一化深度值到0-255，然后采用jet colormap 把1通道图像转成3通道图像（彩色化深度图），数值小（近）为红色，数值大（远）为蓝色，中间为渐变色。
在这里插入图片描述
3.数据处理：
CNNs网络结构需要固定的输入尺寸，此时不同尺度的图像就要resize到固定的大小，但是会带来形变。本文是在不改变形状信息的前提下，对边界进行背景填充。

4.网络训练：
1）Training the stream networks
首先训练两个单独的网络（RGB和D），网络的最后一层为fc7（Fig.1所示），使用在ImageNet数据集上训练的参数进行fine tune。
2）Training the fusion network:
使用两个网络（RGB和D）来初始化融合的网络，两个fc7层进行concat后并入融合网络。

5.实验结果：
对比融合网络和其他方法在RGB-D数据集上进行测试
在这里插入图片描述
小结：
多模态特征层融合的方法优于之前的方法
多模态的结果优于单模态的结果，提升较为明显

注：博众家之所长，集群英之荟萃。

猜你喜欢

转载自blog.csdn.net/u013841196/article/details/82846668

多模态(RGB-D)——特征层融合

基于RGB-D图像的多模态特征融合

多模态(RGB-D)——深度融合网络

多模态(RGB-D)——RCFusion

多模态(RGB-D)——MMSS

多模态(RGB-D)——人脸识别

多模态(RGB-D)——Ensemble Learning

多模态(RGB-D)——CIMDL

多模态(RGB-D)——FuseNet

多模态(RGB-D)——MV3D

多模态(RGB-D)——Face Depth Estimation

目标检测YOLO实战应用案例100讲-跨模态、多级别融合的RGB-D显著目标检测方法研究

多模态特征融合-图像、语音、文本

【多模态】多模态特征融合策略——门控多模态融合方法

RGB-D SLAM学习

RGB-D Camera 汇总

RGB-D 数据集

RGB-D相机的标定

RGB-D相机介绍

开课钜惠倒计时！国内首个多模态3D目标检测全栈教程（前融合/特征级融合/后融合）...

多模态3D目标检测发展路线方法汇总！(决策级/特征级/点/体素融合)

论文阅读-Attention Bottlenecks for Multimodal Fusion（多模态特征融合）

硕士学位论文：RGB-D特征检测与描述方法及其应用研究

大规模分层多视图RGB-D对象数据集

多模态融合

多模态融合技术

RGB-D点云生成

RGB-D SLAM实战（Kinect）

RGB-D SLAM系统评估的基准

制作自己的rgb-d数据集

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)