《中国人工智能学会通讯》——5.23 受脑启发的计算机视觉模型进展

5.23 受脑启发的计算机视觉模型进展

计算机视觉试图制造出像人一样具有视觉感知功能的智能机器。几十年来,研究者从理论和实验等多个角度对这个问题进行了不懈努力,并取得了很大进展。然而直到今天,机器视觉离人的水平还有明显的距离。既然人脑有如此出色的视觉感知能力,那么借鉴视觉神经系统的原理去发展计算机模型不失为一条好的途径。事实上,很多计算机视觉的模型正是基于这个思路而提出来的,比如当前最流行的深度学习模型(或称神经网络,本文中对二者不作区分),就是受脑的视觉系统启发发展起来的,主要利用了视觉系统的层次化结构、神经元的局部感受野、初级视觉皮层的简单细胞和复杂细胞的反应特点等,并得益于现在廉价但高性能的机器、大量的数据以及机器学习理论等。但现在的计算机视觉模型包括深度学习模型只是利用了脑结构和功能的某些方面,一个自然的想法是如果能借鉴更多的脑科学知识,也许会得到更好的计算机视觉模型。这是当前计算机视觉的一个方向。本文试图对2014 年以来此方面的工作作简单介绍。

脑科学的研究分为不同的层次,从微观的分子层次到宏观的认知心理学层次,研究对象的尺寸从纳米级到米级(见表 1)。除了分子层次外,其他层次的研究都有可能对计算机视觉有启发。本文根据脑科学的不同研究层次分别进行介绍,涉及的主要文献列在表 1 的最后一列。

《中国人工智能学会通讯》——5.23 受脑启发的计算机视觉模型进展