【课程笔记】计算机视觉-图像分割
计算机视觉-图像分割
一、概述
1. 图像识别与图像分类什么关系?
分类是将一个图像分成几类,识别是指出位置。
2. 人脸识别
分为人脸验证(1:1)和人脸辨识(1:n)。
人脸识别又分为两个部分:face verification(人脸验证) 和 face identification(人脸辨识)。
- face verification是1对1,判断两个人脸是否是同一人, 验证现在待检测的你是不是你自己,如现在火车站的刷 人脸自助进站,就是身份证上的图片和你进站时摄像头 拍的图片进行对比,验证是否是同一人。
- face identification是1对n,从人脸库中找到给定的人脸 的对应身份信息。或者理解成检测你是不是某个黑名单 中的要管制的对象,例如公安系统的黑名单对比,或者 人脸识别考勤,就是确认你是不是数据库中的某个对象。
实际使用人脸识别支付的时候,先根据GPS等进行筛选一下,实际上
1:n
中n是在万级别的,而不是亿级别。
- 一般的算法步骤:
- – 人脸检测(Face Detection)
- – 人脸对齐(Face Alignment)
- – 特征提取(Feature Representation)
- – 特征匹配(Feature Match)
- 当前的人脸识别算法
粘贴老师的PPT。
3. 图像分割
- 解决“每一个像素属于哪个目标或场景”的问题。
- 分割的目标就是简化或变换,将图像转换为更有意 义和更易分析的内容的表达。
- 图像分割为图像中的每一个像素打上标签,具有相 同标签的像素属于同一物体,用来定位图像中目标 和边界(线、曲面)的位置。
二、正文
1. 图像分割的难点
- 图像分割是中层视觉中最基本的问题,也是计 算视觉和图像理解中的最基本问题之一。它还 是该领域国际学术界公认的将会长期存在的最 困难的问题之一。
- 图像分割之所以困难的一个重要原因是其并不 完全属于图象特征提取问题,它还涉及到各种 图像特征的知觉组织。
2. 图像分割算法
图片是给我们讲课的优秀的老师
3. 深度学习分割算法
4. FCN:第一个应用到分割的深度学习算法
- 为了防止丢弃空间信息,就拿掉了全连接层
- 网络如下:下面老师画的图指的是上采样的过程中重拾了下采样的网络。
5. UNet
- 在每一层增加了一次卷积操作。
- 在FCN中因为是直接的add,所以这个网络做了一个拼接。(引申出论文发起来很容易)
上采样的时候需要下采样的信息,所以网络结果改进的方式很多,比如从下采样中来,又可以从下采样中来。
unet中需要用到的数据挺少的,效果又很好。
这是因为,虽然几十张图片,但是要切割成好几千图片,然后再进行的训练。
6. SegNet
- 就是在下采样的时候将丢掉的位置信息记录了下来。
比如
0.8
就是在第二排第一个。
7. ENet
- 相当于
UNet
的快速版本。一个工程性的文章,让这个网络更快,让这个网络可以在轻量的设备上用。 - 这篇文章给其他的网络也有参考价值哟。
8. Mask R-CNN
- 号称在分割中效果更好的(之后也有人说)
9. PSPNet
- 在上采样的时候加入了新的模块。
- 速度很慢。
10. 水论文哟
- RefineNet
- G-FRNet
- 就是加了一个
门控单元
,也就是权重而已。
- 就是加了一个
11 DeepLab:占顶会的不要脸网络
以下内容来自老师,不知道叫什么