目标检测算法Yolo

对于计算机视觉,大家最熟悉的是人脸识别。注意,人脸识别和人脸检测是不同的概念。人脸检测,是在图像中找出人脸并给出位置;人脸识别,不仅要从图像中找出人脸,并要识别出人脸对应的人的信息。

人脸检测是目标检测的一个例子。

计算机视觉最基本的任务之一是图像分类。在图像分类的基础上,还有更复杂和有趣的任务,如目标检测、物体定位、图像分割等。
目标检测是要在图像中识别出指定类的对象,并给出其位置。由于图像中目标的个数和位置都是不固定的,所以,目标检测
任务并不简单。
目标检测的一个应用场景是证件检测。在证件检测场景中,需要从图像中检测出是否出示了指定的证件(比如,二代身份证),从而对图像中的行为作出判断。

目标检测算法Yolo


目标检测算法,比较流行的分为两类,一类是基于Region Proposal的R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN),它们是two-stage的,需要先使用启发式方法(selective search)或者CNN网络(RPN)产生Region Proposal,然后再在Region Proposal上做分类与回归。而另一类是Yolo,SSD这类one-stage算法,其仅仅使用一个CNN网络直接预测不同目标的类别与位置。第一类方法是准确度高一些,但是速度慢,但是第二类算法是速度快,但是准确性要低一些。
Yolo算法,其全称是You Only Look Once: Unified, Real-Time Object Detection。顾名思义就是只看一次,把目标区域预测和目标类别预测合二为一,作者将目标检测任务看作目标区域预测和类别预测的回归问题。该方法采用单个神经网络直接预测物品边界和类别概率,实现end-to-end的物品检测。