每天一篇论文 276/365 Monocular Depth Estimation in New Environments With Absolute Scale
新环境中基于绝对尺度的单目深度估计
本文主要提出单目深度估计方法,主要创新点用ORB-SLAM2替代视频连续位姿估计,此外,用双目左右图像估计深度,然后通过refine方法,用到单目视频估计中。
摘要
在这项工作中,我们提出了一种无监督的训练方法,将单一的图像深度估计CNN微调到一个新的环境中。该网络已通过双目图像数据预训练,只需要单目输入进行微调。与其他无监督方法不同,它产生具有绝对尺度的深度估计——这是大多数实际应用所必需的特性,但在文献中却大多被忽略。首先,我们展示了我们的方法如何使一个在一个数据集(城市景观)上训练的网络适应另一个数据集(KITTI)。接下来,通过将KITTI分割成子集,我们展示了预训练模型对域移动的敏感性。然后,我们证明,通过使用我们的方法对模型进行微调,可以在不使用立体或任何形式的地面真值深度和保持正确的绝对比例的情况下,提高目标子集的性能。
贡献
1.我们证明,可以使用一个很好理解的现成SLAM算法来代替通常使用的相机姿态估计网络。请注意,后者需要接受训练,因此,在训练时所见的情况之外,不能很好地估计。
2.我们展示了如何以预训练网络的形式利用先验信息,以无监督的方式微调网络,同时保持绝对规模。
方法
图中表示,左右偏差重建估计+学习位姿估计,到单目+SLAM视图重建方法
1)对源立体数据集进行预训练。
2)恢复单目目标的摄像机轨迹使用SLAM的数据集。
3)利用恢复的轨迹对单目目标数据集上的模型进行微调。
相机内参和位姿估计用来预测视角。