《中国人工智能学会通讯》——11.23 人的视觉成长过程
11.23 人的视觉成长过程
本文主要涉及视觉物体分割的研究(英文文献中一般 object/semantic segmentation、image parsing等词来表示)。
视觉物体分割要求所得到的分割具有语义性,由于同一语义目标对应底层图像特征的多样性,例如图 1 中公共汽车就同时包含了白色的车皮、半透明的玻璃、暗红色的车次信息,以及复杂的车身广告图案等颜色纹理差异很大的区域,视觉物体分割一直是计算机视觉领域的基本难题之一。
但是人类视觉却在这一任务上表现出极其优异的性能:人能轻易地判断出车皮、车窗玻璃、车次信息属于同一辆公共汽车,并得到公共汽车的准确边缘。人是如何做到准确分割视觉物体?
半个世纪以来,生理学、认知学和神经科学的学者对此进行了大量研究,研究表明,人主要依赖于三个层次的视觉感知能力来实现物体的分割,即针对视觉刺激的神经响应能力、底层视觉能力和中高层视觉能力。
图 2 显示了人的视觉成长过程[2] ,针对视觉刺激的神经响应能力,以及底层的视觉空间分辨能力和颜色区分能力在婴儿出生以前就已经初步具备,并在出生以后逐步成熟,其中视觉空间分辨能力的提高依赖于早期(婴儿出生2个月以内)的视觉刺激,而颜色区分能力则有更强的可塑性。
属于底层视觉能力的运动感知和视差感知能力的建立非常迅速。婴儿出生以后 1~3 天就已经具备显著的视觉点跟踪能力和运动一致性检测能力。
运动感知能力在建立和提升人的中高层视觉感知能力方面起到了至关重要,甚至是决定性的作用。视差感知能力是指寻找同一个三维视觉点在两只眼睛视网膜上对应位置的能力,由于其相比运动跟踪而言匹配的难度更大,婴儿直到出生 3 个月以后才开始发展出这一能力,而到 6 个月时才相对成熟。这一能力使得人能获取深度信息,并据此来区分物体以及帮助眼睛聚焦于感兴趣目标。
中高层视觉能力主要是指提取物体、分析其特性并进行识别的能力。婴儿在 2 个月的时候就已经具备利用运动信息来区分完整物体的能力,但是利用颜色、轮廓等来区分物体的能力要到婴儿 6 个月以后才开始具备,其经历着漫长的发展过程,并在视觉经验的积累中逐步提高。