目标检测
图片分类的思路可以帮助学习分类定位,而对象定位的思路又可以帮助学习对象检测,对象检测可以检测多个对象。
对象定位:
特征点检测:利用人为事先标注好的训练集
对象检测:基于滑动窗口的目标检测算法
把剪切后的小图像输入到卷积神经网络,对每个剪切后的小图像进行卷积操作,进行0、1分类。
下面是训练好的卷积神经网络:
用卷积层代替全连接层:
我们不用依靠每次利用截取的图片进行卷积操作,我们可以直接卷积一整张图片,以此得到所有预测值,缺点是边界框的位置不够准确。
YOLO可以较准确的输出边界框:利用比例大小确定边界框
交并比:判断边界框是否合理
非最大值抑制:过程中可能会出现多个检测边框,非最大值抑制可以对其进行清理,保证得到可靠边框。判断所有框交并比,将不符合的框框去掉。对剩下的选择pc最高的框框,然后把它输出成预测结果。
如果想让每个格子检测出多个对象:独立进行几次非最大值抑制,anchor box