语义分割系列教程1

大家好,我是小开,从今天开始给大家分享一个语义分割的系列教程。

整个教程会以编码为主,穿插理论与论文,让大家可以一步一步的完成整个项目的实现,并最终达到一个很好的落地效果。在这个教程中我们要做的就是人像分割,效果如图所示:

语义分割系列教程1

简单来说就是把人物从图像中抠出来,看到这里大家是不是已经想到了很多的应用,比如小破站的弹幕,证件照合成软件,会议软件的替换背景功能等等等等。

在分割当中人像分割属于比较简单的任务,但是想真正做好,达到落地的效果其实并不简单。

整个教程的内容主要分为以下几大部分:

  1. 模型设计相关
  2. 性能调优相关
  3. 模型实时性相关

在实验数据集上选择了百度开源的人像分割数据集,地址如下:

https://pan.baidu.com/s/1sjqcm4H?

https://pan.baidu.com/s/1qWv5wF6

深度学习框架我们选择了pytorch。


那么从神经网络的角度如何实现这一问题呢?

首先网络的输入是一张RGB三通道图像(当然也有四通道的做法,暂且不提),输出则是一张单通道的mask图,全图分为属于人的类别与不属于人的类别两类,通过训练神经网络,使模型可以将输入图像中的人物与其余部分分开,mask图最终再作用于原图,实现要应用的功能。如下图所示:

语义分割系列教程1

有兴趣看下去的同学可以点个关注,我会尽快更新的!