语义分割系列教程1
大家好,我是小开,从今天开始给大家分享一个语义分割的系列教程。
整个教程会以编码为主,穿插理论与论文,让大家可以一步一步的完成整个项目的实现,并最终达到一个很好的落地效果。在这个教程中我们要做的就是人像分割,效果如图所示:
简单来说就是把人物从图像中抠出来,看到这里大家是不是已经想到了很多的应用,比如小破站的弹幕,证件照合成软件,会议软件的替换背景功能等等等等。
在分割当中人像分割属于比较简单的任务,但是想真正做好,达到落地的效果其实并不简单。
整个教程的内容主要分为以下几大部分:
- 模型设计相关
- 性能调优相关
- 模型实时性相关
在实验数据集上选择了百度开源的人像分割数据集,地址如下:
https://pan.baidu.com/s/1sjqcm4H?
https://pan.baidu.com/s/1qWv5wF6
深度学习框架我们选择了pytorch。
那么从神经网络的角度如何实现这一问题呢?
首先网络的输入是一张RGB三通道图像(当然也有四通道的做法,暂且不提),输出则是一张单通道的mask图,全图分为属于人的类别与不属于人的类别两类,通过训练神经网络,使模型可以将输入图像中的人物与其余部分分开,mask图最终再作用于原图,实现要应用的功能。如下图所示:
有兴趣看下去的同学可以点个关注,我会尽快更新的!