DeepLab图像分割算分的发展过程

v1:

贡献: 首次把空洞卷积(dilated convolution) 引入图形分割领域

基本内容:

以DeepLabv3+架构为基础做图像分割(包含v1, v2, v3介绍)
作用:

贡献: 引入带空洞卷积的空间金字塔池化(ASPP)

基本内容:

贡献: 优化ASPP

基本内容:

贡献: 引入编码–解码结构
基本内容:

制作并读取TFRecord: 源码是从TFRecord中读取按jpg格式读取image, MRI数据集为png格式, 修改源码使deeplab读取tfrecord并按png格式解析image.
后来发现没有做map, label范围不对. 尝试在TFRecord解析出png后把数据转成ndarray进行 map, 发现这样效率特别低, 放弃.
重新制作TFRecord, 在制作TFRecord之前, 先做好map
数据不平衡, 需要ixi调整权重(batch/整体, class0的权重)
修改loss, 加入mean_iou(不包括背景)做优化
learning_rate的初值及衰减方式
源码是每个epoch做一次验证, 我们数据集很大, 这样不合适, 调整为每1/4个epoch做一次验证
数据类型错误, label从tfrecord读出来是uint8格式, 范围是0~255, 然后做padding的过程中有个-255, 再转换成float然后+255的操作, 导致数据出错
经过几天训练, 发现模型有些欠拟合, 因为不同区域间的分界线分割效果不是很好, 所以停止训练, 修改模型. 1. 只对input做224*224的随机裁剪, 不进行rescale和flip等操作 2. 减小 weight_decay, 即减小正则化项的权重. 3. 用卷积核找到label中不同class的边界, 增大边界像素的分类权重, 使得网络着重分类边界的学习
等等…

以DeepLabv3+架构为基础做图像分割(包含v1, v2, v3介绍)

以DeepLabv3+架构为基础做图像分割(包含v1, v2, v3介绍)

6.1 修改网络结构:

6.2 用集成学习提高模型效果(模型融合)

6.3 尝试用手工标注数据对网络进行微调