【课程笔记】计算机视觉-图像分割

计算机视觉-图像分割

一、概述

1. 图像识别与图像分类什么关系?

分类是将一个图像分成几类,识别是指出位置。

2. 人脸识别

分为人脸验证(1:1)和人脸辨识(1:n)。
人脸识别又分为两个部分:face verification(人脸验证) 和 face identification(人脸辨识)。

  • face verification是1对1,判断两个人脸是否是同一人, 验证现在待检测的你是不是你自己,如现在火车站的刷 人脸自助进站,就是身份证上的图片和你进站时摄像头 拍的图片进行对比,验证是否是同一人。
  • face identification是1对n,从人脸库中找到给定的人脸 的对应身份信息。或者理解成检测你是不是某个黑名单 中的要管制的对象,例如*系统的黑名单对比,或者 人脸识别考勤,就是确认你是不是数据库中的某个对象。

实际使用人脸识别支付的时候,先根据GPS等进行筛选一下,实际上1:n中n是在万级别的,而不是亿级别。

  1. 一般的算法步骤:
    • – 人脸检测(Face Detection)
    • – 人脸对齐(Face Alignment)
    • – 特征提取(Feature Representation)
    • – 特征匹配(Feature Match)
  2. 当前的人脸识别算法
    粘贴老师的PPT。
    【课程笔记】计算机视觉-图像分割

3. 图像分割

  • 解决“每一个像素属于哪个目标或场景”的问题。
  • 分割的目标就是简化或变换,将图像转换为更有意 义和更易分析的内容的表达。
  • 图像分割为图像中的每一个像素打上标签,具有相 同标签的像素属于同一物体,用来定位图像中目标 和边界(线、曲面)的位置。

二、正文

1. 图像分割的难点

  • 图像分割是中层视觉中最基本的问题,也是计 算视觉和图像理解中的最基本问题之一。它还 是该领域国际学术界公认的将会长期存在的最 困难的问题之一。
  • 图像分割之所以困难的一个重要原因是其并不 完全属于图象特征提取问题,它还涉及到各种 图像特征的知觉组织。
    【课程笔记】计算机视觉-图像分割

2. 图像分割算法

图片是给我们讲课的优秀的老师
【课程笔记】计算机视觉-图像分割

3. 深度学习分割算法

【课程笔记】计算机视觉-图像分割
【课程笔记】计算机视觉-图像分割
【课程笔记】计算机视觉-图像分割

4. FCN:第一个应用到分割的深度学习算法

  • 为了防止丢弃空间信息,就拿掉了全连接层
  • 网络如下:下面老师画的图指的是上采样的过程中重拾了下采样的网络。
    【课程笔记】计算机视觉-图像分割

5. UNet

  • 在每一层增加了一次卷积操作。
  • 在FCN中因为是直接的add,所以这个网络做了一个拼接。(引申出论文发起来很容易)
    【课程笔记】计算机视觉-图像分割

上采样的时候需要下采样的信息,所以网络结果改进的方式很多,比如从下采样中来,又可以从下采样中来。
【课程笔记】计算机视觉-图像分割
unet中需要用到的数据挺少的,效果又很好。
这是因为,虽然几十张图片,但是要切割成好几千图片,然后再进行的训练。

6. SegNet

  • 就是在下采样的时候将丢掉的位置信息记录了下来。

比如0.8就是在第二排第一个。
【课程笔记】计算机视觉-图像分割

7. ENet

  • 相当于UNet的快速版本。一个工程性的文章,让这个网络更快,让这个网络可以在轻量的设备上用。
  • 这篇文章给其他的网络也有参考价值哟。

8. Mask R-CNN

  • 号称在分割中效果更好的(之后也有人说)

9. PSPNet

  • 在上采样的时候加入了新的模块。
  • 速度很慢。

10. 水论文哟

  • RefineNet
  • G-FRNet
    • 就是加了一个门控单元,也就是权重而已。
      【课程笔记】计算机视觉-图像分割

11 DeepLab:占顶会的不要脸网络

以下内容来自老师,不知道叫什么
【课程笔记】计算机视觉-图像分割
【课程笔记】计算机视觉-图像分割
【课程笔记】计算机视觉-图像分割

其他

【课程笔记】计算机视觉-图像分割
【课程笔记】计算机视觉-图像分割