DeMon论文记录

@[TOC]DeMon论文记录

网络结构:
网络主要结构
bootstrap encoder and decoder 主要结构
bootstrap net:
输入一堆图片,输出初始化深度以及运动估计。
在其内部,第一个 编码器 计算光流以及其置信图。编码器包括一对 1D filter ,以允许使用大空间filter时 能够保持参数的数目以及运行时间的管理。逐渐利用步长为2减少空间分辨率,同时增加通道数。解码器利用一系列的步长为2反卷积层产生光流估计。第一个编码解码器输出光流场的两个组成部分并估计他们的置信度。
第二个编码解码器,将光流和其置信度,一对图像,和 第二个图像的估计流场。根据这些输入,其估计 深度 表面法线 和相机运动。同时新增的三个全连接层计算相机的运动,和深度估计的尺度因子。后者反映了深度以及运动预测的内在联系due to scale ambiguity。通过将光流估计馈送到第二编码器 - 解码器,我们让它利用运动视差
Iterative net
Iterative net 被训练以改善现有的深度、法线以及运动估计。编码解码器和bootstrap相同,但是有额外的输入。且将迭代层一起训练避免中间存储。
Refinement net.
Refinement net 用来提升分辨率。
loss function
1
!撒旦法](https://img-blog.csdnimg.cn/20190826104752518.png)

发布了5 篇原创文章 · 获赞 0 · 访问量 99

猜你喜欢

转载自blog.csdn.net/qq_40586386/article/details/100063258
今日推荐