推荐一些视觉SLAM的深度学习方法（下） - 代码天地

推荐一些视觉SLAM的深度学习方法（下）

其他 2020-08-11 09:24:25 阅读次数: 0

这里重点在RNN/LSTM的应用。

11. DeepVO: Towards End-to-End VO with Deep Recurrent CNNs

基本上这个方法是依赖CNN提取的特征在RNN（LSTM）学习pose的连续估计。如图所示

更细致的RNN网络结构如图

其中的LSTM结构图如下

12. GANVO: Unsupervised Deep Monocular Visual Odometry and Depth Estimation with Generative Adversarial Networks

这个方法采用GAN学习depth和VO，基本框架如图

具体的模型架构如下图

扫描二维码关注公众号，回复： 11560219 查看本文章

13. Guided Feature Selection for Deep Visual Odometry

这个北大的工作，通过深度学习学习特征选择过程，通过RNN网络实现VO（rotation和translation分开估计），这里RNN是ConvLSTM，其框架如下

其中采用LSTM和guided model的组合方式如图（b）所示：

更具体的guided model架构如下（一个SENet类似的架构）

14. MagicVO: End-to-End Monocular Visual Odometry through Deep Bi-directional Recurrent Convolutional Neural Network

也是VO的工作，这里采用双向RCNN （CNN+LSTM）框架，如图所示：

具体模型架构如图：最后通过FCL得到pose估计。

其中Bi-LSTM的细节如下：

15. Sequential Learning of Visual Tracking and Mapping Using Unsupervised Deep Neural Networks

这是基于非监督学习的SLAM方法，采用CNN+LSTM的架构，双目图像序列训练，单目测试，其框架如图所示

其中模型架构细节如下：

LSTM的细节如下：输入的是depthnet的feature和posenet的feature两路组合。

16. Learning By Inertia: Self-supervised Monocular Visual Odometry For Road Vehicles

该VO方法采用多帧图像的自监督训练方法，还是CNN+RCNN的组合，其中包括depth，pose和segmentation的front end（似乎是简单的前景-背景模式），测试不需要输出segmentation，如图所示

其CNN模型和RNN的架构如下：depth和pose两部分

17. SGANVO: Unsupervised Deep Visual Odometry and Depth Estimation with Stacked GANs

这也是基于GAN的VO方法，同样采用depth和pose，框架如下图

时域的扩展框架如图所示

18. Sequential Adversarial Learning for Self-Supervised Deep Visual Odometry

基于对抗学习的方法做自监督VO，采用optic flow，时域基于LSTM建模，如图

更具体的架构如下：这里depthnet和poseMaskNet同时做生成器，感觉optic flow不是深度学习得到的。

19. SelfVIO: Self-Supervised Deep Monocular Visual-Inertial Odometry and Depth Estimation

还是基于GAN，但加入惯导和VO融合，即VIO，框架如下

深度学习架构具体如下图：CNN+LSTM组合，depth和pose同时做输入，还有IMU融合。

20. Recurrent Neural Network for (Un)supervised Learning of Monocular Video Visual Odometry and Depth

基于RNN的非监督/监督VO方法，其框架如图所示：convLSTM得到的depth和pose，基于optic flow的前向-后向warping损失计算做训练。

具体的depthnet和posenet架构如下：

具体参数如下表：

21. Learning Monocular Visual Odometry via Self-Supervised Long-Term Modeling

这是NEC美研的一个自监督深度学习的CNN+LSTM方法，其架构如图所示

两步的训练框架（短时和长时序列）如图：分别是左右两个，采用depth和pose，各接一层convLSTM，

而循环连续性的两层LSTM姿态关系如图

结束

发布于昨天 12:01

猜你喜欢

转载自blog.csdn.net/weixin_42137700/article/details/107893154

推荐一些视觉SLAM的深度学习方法（下）

推荐一些视觉SLAM的深度学习方法（上）

【深度学习】一些关于计算机视觉的思考和学习方法

关于SLAM学习方法的一些反思总结

推荐一些经过实践检验的学习方法

一些关于计算机视觉的思考和学习方法

摘自网络上的一些学习方法

统计学习方法-一些概念

【转载】一些著名学习方法

深度学习结合SLAM的研究思路/成果整理之（一）使用深度学习方法替换SLAM中的模块

用深度学习方法替换传统slam中的一个/几个模块

关于视觉SLAM的一些常识（纯小白学习笔记）

SLAM的一些学习笔记

机器学习/深度学习书单推荐及学习方法

一文综述用于推荐系统的所有深度学习方法

学web前端的朋友一定要知道的一些高效学习方法

《视觉SLAM十四讲》学习笔记-李代数求导与扰动模型的一些重要公式

IT人的学习方法论-4 一些重要的能力（转载）

Qt初学者的一些学习方法、参考资料

机器学习方法中的一些基本概念

IT人的学习方法论-4，讨论一些重要的能力

干货 | 聊聊这些年总结的一些学习方法

关于深度学习目标检测的一些改进方法

43、生鲜电商平台-你应该保留的一些学习态度与学习方法

一种深度学习方法---迁移学习

5. Android MultiMedia框架完全解析 - 再谈Playback框架及一些学习方法的讨论

深度学习方法的改进

深度学习的一些经验

深度学习TensorFlow的一些概念

深度学习的一些基础概念

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)