从零开始一起学习SLAM(1)为什么要学SLAM?


  此文发于公众号:计算机视觉life。
  从零开始一起学习SLAM | 为什么要学SLAM?

从零开始一起学习SLAM | 为什么要学SLAM?

  计算机视觉的研究目前主要分为两大方向:基于学习的方法和基于几何的方法。其中基于学习的方法最火的就是深度学习,而基于几何方法最火的就是视觉SLAM

从零开始一起学习SLAM(1)为什么要学SLAM?

  SLAM将成为计算机视觉的下一个风口

  在前几年计算机视觉的三大*会议(CVPR,ICCV,ECCV)上,几乎全是深度学习的研究,而这样的情况在这两年出现了新的变化:在2018年计算机视觉国际*会议 CVPR论文录用名单中,其中涉及SLAM/三维视觉 的工作超过 90 篇,占据了全体收录论文的近 1/10。

  而今年参加校招和社招的小伙伴也向我透露,今年深度学习方向的竞争非常激烈,想要拿到较好的offer,要么有牛叉闪闪的论文,要么是大牛实验室有过硬的项目经验,难度比前几年大大提升。而今年SLAM方向的需求量上升而相关从业者相对较少,相对还比较容易,类似几年前深度学习刚刚火起来之前的样子。可以预见,SLAM将成为继深度学习之后计算机视觉领域的下一个风口。主要有以下几个依据:

  1、深度学习在检测、识别领域具有无比强大的能力,但是在涉及多视角几何相关的SLAM领域,深度学习的作用非常有限。究其原因是因为在多视角几何为基础的SLAM领域,需要明确清晰的理论基础保证,而深度学习的「黑盒子」模型目前还不太奏效。

  2、SLAM技术门槛较高。深度学习爆发后,很多非计算机视觉领域的从业者纷纷转而学习深度学习,由于深度学习本身黑盒子的特点,很多从业者不需要了解图像处理、计算机视觉的基础知识便可以得到一个相对较好的结果,因此入门门槛并不是很高。

  而学习SLAM则需要具备三维空间刚体变换、相机成像模型、特征点提取与匹配、多视角几何、捆集调整等内容。这对于非该领域的从业者来说还是具有较高的门槛。

  3、消费级RGB-D相机快速发展催生了以三维视觉为基础的商业化应用。以微软Kinect系列、Intel realsense系列、苹果、英飞凌、TI等为代表的消费级RGB-D相机逐渐形成成熟的产业链,国内也涌现出大量的优秀企业并量产,如orbbec、pico、human+、爱观、图漾、艾芯智能、知微传感等。此外,2017年iPhone X前置结构光深度相机面世后,更是激发了手机产业链RGB-D相机的热潮,目前华为、小米、OPPO、VIVO等手机大厂都在积极推动RGB-D相机在手机上的应用。

从零开始一起学习SLAM(1)为什么要学SLAM?

  4、目前计算机视觉领域主要还是通过二维的图片来感知世界,而三维视觉才是人类感知理解世界的正确方式,因此以三维视觉为基础的SLAM技术是智能移动机器人、无人驾驶、AR等人工智能细分领域的核心技术

从零开始一起学习SLAM(1)为什么要学SLAM?

  目前对SLAM技术需求强烈的公司包括:互联网公司如百度、腾讯、阿里、京东等,计算机视觉算法公司如旷世、虹软、商汤等,自动驾驶创业公司如图森、momenta、景驰、驭势、滴滴及各大汽车厂商等,无人机/机器人公司如大疆、思岚、高仙等,AR移动终端应用相关公司如三星、华为、悉见等。

  总之,SLAM前景光明但学习道路曲折,这也是笔者打算和读者一起从零开始学习SLAM的初衷。