目标检测笔记

目标检测:主要指在图片中对可变数量的目标进行查找和分类
目标检测笔记
a :图像分类 只需指出所属的类别
b:目标检测,还要定位目标出现的位置,表示为一个矩形框
目标分割,找到当前目标所占的区域
c :语义分割,除去背景区域,只要找到同一类物体所占区域即可,具体位置精确到像素级别
d:实例分割,不仅区分语义层面的目标,对同一类别的目标,也要划分出不同实例

检测:主要定位物体位置,位置信息表示为一个矩形框,可通过4位数据表示,往往采用上采样,反卷积
分割:对每个像素点进行不同类别的划分,结果需要同原来图片保持一致

传统目标检测方法 和 深度学习目标检测方法

1.特征很难设计,且会存在问题,不鲁棒,效率低,提取滑动窗口慢,耗时。

传统:目标检测笔记
目标检测笔记

目标检测笔记
深度学习:通过学习来获取特征,设计不同的网络结构来学习不同的特征,特征会更鲁棒
目标区域判定:深度网络,分类器学习由之前的特征完成,在特征和分类通过一个网络完成,相对传统网络更加端到端

传统目标检测方法基本流程

目标检测笔记
给出一个图片输入,采用滑动窗口进行候选框提取,对每一个窗口局部图像信息进行特征抽取(基于颜色 纹理 形状中层次、高层次语义特征等方法),分类器基于之前的特征来进行分类判定,分类器是由之前学习得到的。对于但类别目标检测,只需区分当前窗口的对象是否是背景还是目标,多分类则为区分是否是背景或哪一类,得出一系列可能为检测目标的候选框,候选框可能会出现重叠,采用nms算法,合并候选框,最后的扫算法输出结果

常见的目标检测算法

Viola-Jones(主要用于人脸检测)

  1. Haar特征抽取

目标检测笔记
value = 白色区域 - 黑色区域

  1. 训练人脸分类器
    目标检测笔记

  2. 滑动窗口

**HOG + SVM(行人检测、Opencv实现)目标检测笔记
目标检测笔记
DPM(物体检测)
目标检测笔记