论文笔记_S2D.41_使用深度估计与深度卷积神经场,进行单目视觉里程计的尺度恢复

基本情况

  • 题目:Scale Recovery for Monocular Visual Odometry Using Depth Estimated with Deep Convolutional Neural Fields
  • 出处:Yin, X., Wang, X., Du, X., & Chen, Q. (2017). Scale recovery for monocular visual odometry using depth estimated with deep convolutional neural fields. In Proceedings of the IEEE International Conference on Computer Vision (pp. 5870-5878).
    •  Tongji University

摘要

尺度恢复(Scale recovery是单目视觉里程表的主要问题之一。通常,将道路平面摄像机高度指定为恢复比例的参考。这些方法的性能取决于相机的平面识别和高度测量。在这项工作中,我们提出了一种新颖的方法,通过结合使用深度卷积神经场从图像估计的深度来恢复尺度。我们的方法将整个环境结构视为参考,而不是指定的平面。深度估计的准确性有助于尺度的恢复。我们通过考虑两个连续的帧以及进入的网络摄像机的运动,来提高深度估计的性能。迭代获得深度细化和尺度恢复。这样,我们的方法可以消除尺度漂移并同时改善深度估计。我们的方法的有效性已在KITTI数据集上进行了单眼视觉测距和深度估算任务的验证。

论文笔记_S2D.41_使用深度估计与深度卷积神经场,进行单目视觉里程计的尺度恢复

论文笔记_S2D.41_使用深度估计与深度卷积神经场,进行单目视觉里程计的尺度恢复

图2. 我们的神经网络的结构。 神经网络的输入两个连续的帧变换矩阵输出是精确的深度图。 深度卷积部分由深度残差网络完全卷积网络组成。 卷积部分的输出通过以下条件随机场层进行细化。

论文笔记_S2D.41_使用深度估计与深度卷积神经场,进行单目视觉里程计的尺度恢复

结论

我们为单目视觉里程表提出了一种新的尺度恢复方法。 使用图像预测的深度获得尺度,并使用卷积神经场预测深度。 通过将连续的帧和自我运动整合到我们的网络中,可以改善深度预测的性能。 我们方法的优点是它可以从整个环境的结构信息而不是从固定参考平面中恢复比例并消除比例漂移。 在KITTI数据集上进行了实验,以验证我们方法的有效性。 实验结果表明,我们的算法可以提高视觉里程表和深度估计任务的准确性。