您的位置: 首页 > 文章 > 【课程笔记】计算机视觉-图像分割

【课程笔记】计算机视觉-图像分割

分类: 文章 • 2022-10-05 00:08:43

计算机视觉-图像分割

一、概述

1. 图像识别与图像分类什么关系？

分类是将一个图像分成几类，识别是指出位置。

2. 人脸识别

分为人脸验证（1:1）和人脸辨识（1:n）。
人脸识别又分为两个部分：face verification（人脸验证）和 face identification（人脸辨识）。

face verification是1对1，判断两个人脸是否是同一人，验证现在待检测的你是不是你自己，如现在火车站的刷人脸自助进站，就是身份证上的图片和你进站时摄像头拍的图片进行对比，验证是否是同一人。
face identification是1对n，从人脸库中找到给定的人脸的对应身份信息。或者理解成检测你是不是某个黑名单中的要管制的对象，例如公安系统的黑名单对比，或者人脸识别考勤，就是确认你是不是数据库中的某个对象。

实际使用人脸识别支付的时候，先根据GPS等进行筛选一下，实际上1:n中n是在万级别的，而不是亿级别。

一般的算法步骤：
- – 人脸检测（Face Detection）
- – 人脸对齐（Face Alignment）
- – 特征提取（Feature Representation）
- – 特征匹配（Feature Match）
当前的人脸识别算法
粘贴老师的PPT。

3. 图像分割

解决“每一个像素属于哪个目标或场景”的问题。
分割的目标就是简化或变换，将图像转换为更有意义和更易分析的内容的表达。
图像分割为图像中的每一个像素打上标签，具有相同标签的像素属于同一物体，用来定位图像中目标和边界（线、曲面）的位置。

二、正文

1. 图像分割的难点

图像分割是中层视觉中最基本的问题，也是计算视觉和图像理解中的最基本问题之一。它还是该领域国际学术界公认的将会长期存在的最困难的问题之一。
图像分割之所以困难的一个重要原因是其并不完全属于图象特征提取问题，它还涉及到各种图像特征的知觉组织。

2. 图像分割算法

图片是给我们讲课的优秀的老师
【课程笔记】计算机视觉-图像分割

3. 深度学习分割算法

【课程笔记】计算机视觉-图像分割

4. FCN：第一个应用到分割的深度学习算法

为了防止丢弃空间信息，就拿掉了全连接层
网络如下：下面老师画的图指的是上采样的过程中重拾了下采样的网络。

5. UNet

在每一层增加了一次卷积操作。
在FCN中因为是直接的add，所以这个网络做了一个拼接。(引申出论文发起来很容易)

上采样的时候需要下采样的信息，所以网络结果改进的方式很多，比如从下采样中来，又可以从下采样中来。

unet中需要用到的数据挺少的，效果又很好。
这是因为，虽然几十张图片，但是要切割成好几千图片，然后再进行的训练。

6. SegNet

就是在下采样的时候将丢掉的位置信息记录了下来。

比如0.8就是在第二排第一个。

7. ENet

相当于UNet的快速版本。一个工程性的文章，让这个网络更快，让这个网络可以在轻量的设备上用。
这篇文章给其他的网络也有参考价值哟。

8. Mask R-CNN

号称在分割中效果更好的（之后也有人说）

9. PSPNet

在上采样的时候加入了新的模块。
速度很慢。

10. 水论文哟

RefineNet
G-FRNet
- 就是加了一个门控单元，也就是权重而已。

11 DeepLab：占顶会的不要脸网络

以下内容来自老师，不知道叫什么
【课程笔记】计算机视觉-图像分割

其他

【课程笔记】计算机视觉-图像分割