论文笔记-深度估计(7)-CNN-SLAM Real-time dense monocular SLAM with learned depth prediction - 代码天地

论文笔记-深度估计(7)-CNN-SLAM Real-time dense monocular SLAM with learned depth prediction

其他 2018-06-02 05:06:58 阅读次数: 0

CVPR2017_CNN-SLAM Real-time dense monocular SLAM with learned depth prediction

关键词：基于CNN的单张图深度估计，语义SLAM，半稠密的直接法SLAM

这里写图片描述

作者提出了一个利用CNN结合SLAM的应用，其SLAM过程如上图，具体解释如下：

作者首先筛选出关键帧，在关键帧上用训练好的CNN网络[1]来预测单帧图深度值得到深度图，并以此深度图作为SLAM架构先验深度。同时在关键帧上用训练好的另一个CNN网络来做语义分割。
随后像直接法SLAM的一样做BA（Bundle Adjustment），用高斯牛顿法，基于pose graph方法优化得到pose，和普通的半稠密 SLAM过程基本一样。
将深度图和语义分割图融合进全局已有的场景深度图（实际上是三维地图点集合了）和三维语义分割图中

作者的主要贡献是提出一个不确定性传播框架，将新产生的深度融合进已有的场景深度中，并refine CNN网络得到的深度（融合和普通深度融合比较相似，但refine过程和《Semi-densevisualodom- etry for a monocular camera》相似）。

此过程中，每个关键帧带一个深度图，一个(深度)不确定图（之所以称为图是因为不确定值与深度图的每个值一一对应），一个pose。不确定图是由当前关键帧的和最近邻的关键帧的深度差的平方距离：
这里写图片描述

随着不断新传入的帧中选出的得到的深度图，将新产生的深度图与已存在的地图（深度图）进行融合。如果两个深度数据的焦距不一样，易知两个深度数据的尺度之比即是焦距之比。所以乘上焦距的比值即可。第i个关键帧ki与第j个关键帧kj的深度图、不确定度图的融合方程：
这里写图片描述

最后过程除了对深度图进行融合，还对语义图进行融合（ Global Segmentation Model (GSM)方法），最后生成一个三维点的语义地图。

附注：
[1] CNN估计深度部分受论文《 Deeper depth prediction with fully convolutional residual networks》的启发

猜你喜欢

转载自blog.csdn.net/kevin_cc98/article/details/78985633

论文笔记-深度估计(7)-CNN-SLAM Real-time dense monocular SLAM with learned depth prediction

NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields 论文阅读

ElasticFusion: Real-Time Dense SLAM and Light Source Estimation

PL-SLAM Real-Time Monocular Visual SLAM with Points and Lines

Probabilistic Volumetric Fusion for Dense Monocular SLAM

泡泡一分钟：Towards real-time unsupervised monocular depth estimation on CPU

KinectFusion: Real-Time Dense Surface Mapping and Tracking论文阅读

GANerated Hands for Real-Time 3D Hand Tracking from Monocular RGB阅读笔记

Vision Transformers for Dense Prediction论文笔记

《论文笔记》Multi-UAV Collaborative Monocular SLAM

论文笔记-深度估计(5)Unsupervised Monocular Depth Estimation with Left-Right Consistency

ViZDoom深度预测(Depth Prediction)

3D【18】深度信息增强：Real-Time Depth Refinement for Specular Objects

Dense Prediction

real-time loop closure in 2D LIDAR SLAM 论文整理

cartographer：论文阅读(Real-Time Loop Closure in 2D LIDAR SLAM)

SLAM：Google cartography算法分析专题----《real-time loop closure in 2D LIDAR SLAM》论文翻译（四）

Google Cartographer 《Real-Time Loop Closure in 2D LIDAR SLAM》翻译 (中英对照）

Data Flow ORB-SLAM for Real-Time Performance on Embedded GPU Boards

Monocular slam 中的理论基础(2)

Monocular slam 的理论基础(1)

【ORB-SLAM论文笔记】ORB-SLAM: a Versatile and Accurate Monocular SLAM System（ORB-SLAM：精确多功能单目SLAM系统）

3月13 论文学习步骤：google的cartographer的论文《Real-Time Loop Closure in 2D LIDAR SLAM》

翻译：ORB-SLAM: a Versatile and Accurate Monocular SLAM System

ORB-SLAM A Versatile and Accurate Monocular SLAM System

[论文笔记SLAM]SVIn2: An Underwater SLAM System using Sonar, Visual, Inertial, and Depth Sensor

【论文】Unsupervised Monocular Depth Estimation with Left-Right Consistency

【论文】单目深度估计：Unsupervised Monocular Depth Estimation with Left-Right Consistency

【ORB-SLAM论文笔记】ORB-SLAM2: an Open-Source SLAM System for Monocular, Stereo and RGB-D Cameras

ORB_SLAM : semi dense code

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)