u-net segnet 学习笔记

先放参考链接:http://blog.****.net/u012931582/article/details/70314859

首先,u-net的网络结构:

u-net segnet 学习笔记

可以看到,输入图像尺寸是大于输出图像的。

u-net一个比较“创新”做法在于:在对图像边界进行padding时,用的不是传统的补零,而是对边缘部分镜像!:

u-net segnet 学习笔记



u-net的拓展:

数据增强:移动最小二乘实现图像数据增强(有时间自己可以写代码实现一下。。。)

论文名称: Image Deformation Using Moving Least Squares

u-net segnet 学习笔记

u-net segnet 学习笔记



还有个segnet,u-net segnet 学习笔记

结构很对称,前部分和普通的vgg19一致。创新之处在于,它的pooling都会记住pooling indices(粗暴点讲就是max pooling时候,会记住max值的坐标位置)。所以在后半部分upsample的时候,操作是:把pooling得到的max值放回之前本身的对应坐标位置,其他位置的值全置0.

u-net segnet 学习笔记

u-net segnet 学习笔记


    这篇写的比较水啊,有新理解会来补充的。。。。。