推荐一些视觉SLAM的深度学习方法(上)

最近也看了一些VSLAM综述文章,这里收集一些论文推荐供参考。


1。Deep Direct Visual Odometry

这篇论文把DL模型的姿态估计做为传统方法DSO的初始化。如图

推荐一些视觉SLAM的深度学习方法(上)

DL 模型架构图如下

推荐一些视觉SLAM的深度学习方法(上)

基于非监督学习的训练框架如下(同时还有depth估计一起训练)

推荐一些视觉SLAM的深度学习方法(上)

2。Deep Virtual Stereo Odometry: Leveraging Deep Depth Prediction for Monocular Direct Sparse Odometry

这也是在DSO嵌入深度学习模型的方法,改成depth预测辅助初始化。如图所示

推荐一些视觉SLAM的深度学习方法(上)

其中的depthnet模型架构如图(视差估计)

推荐一些视觉SLAM的深度学习方法(上)

3。D3VO: Deep Depth, Deep Pose and Deep Uncertainty for Monocular Visual Odometry

这个工作是VO,但仍然有前后台(frontend做跟踪,backend做优化)。这里深度学习参与前后台,给出depth和pose的信息。其框架如下

推荐一些视觉SLAM的深度学习方法(上)

前台的factor graph结构图(关键帧)

推荐一些视觉SLAM的深度学习方法(上)

而深度学习模型:posenet和depthnet如下表

推荐一些视觉SLAM的深度学习方法(上)

推荐一些视觉SLAM的深度学习方法(上)

4。Pose Graph Optimization for Unsupervised Monocular Visual Odometry

同样具有前后台的VO,采用非监督学习的DL模型。如图框架所示

推荐一些视觉SLAM的深度学习方法(上)

这里PGO分别在局部的滑行窗和全局进行,但没有做SLAM的loop closure和keyframe。如下是DL模型的训练框架(depth和pose),需要双目。

推荐一些视觉SLAM的深度学习方法(上)

5。CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction

同样将深度学习的depth估计去初始化传统SLAM,这里基于LSD-SLAM(半致密法),同时还采用DL的语义分割对生成的全局图做语义融合。如图所示:

推荐一些视觉SLAM的深度学习方法(上)

6。Self Improving Visual Odometry

这是MagicLeap的工作,基于DL的特征点提取SuperPoint模型和特征点匹配SuperGlue模型,提出一个自监督的VO框架,如图

 

推荐一些视觉SLAM的深度学习方法(上)

 

7。BA-Net

这个方法是除了前端深度图估计之外,还想用DL解决SLAM的后端优化,即BA。如图是框架图

推荐一些视觉SLAM的深度学习方法(上)

其中的depthnet部分是如下结构

推荐一些视觉SLAM的深度学习方法(上)

而其中的BA-layer如图(非线性迭代L-M)

推荐一些视觉SLAM的深度学习方法(上)

8。Self-Supervised Learning of Depth and Ego-motion with Differentiable Bundle Adjustment

该方法类似,只是扩展了前端,即depthnet和posenet,如图

推荐一些视觉SLAM的深度学习方法(上)

这里BA layer如图:

推荐一些视觉SLAM的深度学习方法(上)

9。Geometry-Aware Learning of Maps for Camera Localization

这是Nvidia的工作,不同于前面方法,采用深度学习做image-based re-localization的思路,但采取VO和PGO增强。如图所示MapNet

推荐一些视觉SLAM的深度学习方法(上)

10. Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry Towards Monocular Deep SLAM

该论文特意通过深度学习,对关键帧提取进行训练,基本框架如图

推荐一些视觉SLAM的深度学习方法(上)

其中VO包括depthnet和posenet,加上keyframe extractor,如图所示

推荐一些视觉SLAM的深度学习方法(上)

推荐一些视觉SLAM的深度学习方法(上)

关于keyframe的管理更新和训练框架,见下图

推荐一些视觉SLAM的深度学习方法(上)


待续。。。