基于卷积神经网络的图像语义分割

论文地址

基于卷积神经网络的图像语义分割

浙江大学硕士论文

图像分割：就是把感兴趣的内容从图像上分割出来，但是一般会对这个目标加上一定的语义信息，即语义标签，把加上语义的图像分割称为图像语义分割。

本文主要研究图像语义分割，并且以提升图像语义分割的准确性和他通用性为目标。

１．分析了卷积神经网络在图像语义分割的应用前景，实现基于卷积神经网络和反卷积神经网络相结合的图像语义分割模型。

２．对基于卷积神经网络和反卷积神经网络相结合的图像语义分割模型进行参数优化，通过在标准数据集上和其他算法进行对比实验，验证该模型语义分割的效果。

３．将上述图像语义分割算法应用到医学图像分析领域，参加Kaggle左心室动力预测比赛，提升评分结果。

４．将本文的图像语义分割算法应用到人体衣物分割，并不低于当前业界水平。

第二章：相关工作

2.1图像分割技术

阈值分割、边缘检测、区域提取、特定理论工具

2.2图像语义分割基础算法

2.3应用

人体衣物图像分割

医学图像分析研究

2.4图像分割流程

基于卷积神经网络的图像语义分割

将第三步替换为卷积神经网络用来提取特征。

R-CNN:首先用选择查找的方式代替传统滑动窗口，提取出2000个候选区域；其次，对于每个区域，使用去掉最后一层Softmax层的AlexNet来提取特征，高达4096维的特征；然后对于每个类别都使用一个线性的ＳＶＭ作为分类器，使用上一步提取出来的特征作为输出，得到每个区域属于某一类的得分；最后通过过滤舍弃部分的区域，通过増强算法得到识别物体的轮廓输出。

但是这个过程还是太复杂，可以直接利用深度卷积神经网络对图像在像素级别进行分类。

第三章：问题描述

3.1图像语义分割，即对图像中重要的具有语义的部分进行分割，分割需要保证分割类型的准确性和轮廓的平整性，一般展示效果通过改变识别类的色彩来表示图像分割结果的不同语义。

基于卷积神经网络的图像语义分割