U/V-Net Brief
V-Net
Basic Info
针对的问题
三维图像分割。
网络结构
在结构上是三维化的U-net。除了3D卷积以为,在U-net的基础上加上了残差结构,并且把2x2 max-pooling替换成了2x2 conv.
训练细节
- 数据增广
原本的数据集是50个MRI。通过对原先的数据进行随机畸变,通过一个稠密的2x2x2的网格。 - 超参数
参数 | 初始值 | 策略 |
---|---|---|
momentum | 0.99 | 无 |
lr(学习率) | 0.0001 | 每25k次迭代,学习率降低一个数量级 |
3. 其他参数
参数 | 值 |
---|---|
CPU | Intel(R) Core(TM) i7-5820K |
GPU | NVidia GTX 1080 with 8 GB |
训练时间 | 48 hours or 30K iterations |
Framework | Caffe |
预测单个Volume速度为1fps
测试结果
以上是对30个MRI进行测试的结果
U-Net
Basic info
针对的问题
- 基于Patch方式的CNN
Patch-style CNN有2个缺点:1)非常慢,因为需要对每个Patch单独运行CNN,且Patch之间有大量的重叠冗余;2)需要权衡定位准确度和被使用的上下文(context)大小。大的patch需要更多的Max-pooling层,会降低精度;而小的patch则让网络只能看到一个小的context。
同时有好的定位准确度和充分利用context是有可能的。
根据FCN的理念,借助反卷积,实现了一个结构。并且实现地更加优雅。一个重要的修改是,在扩展(expansive)和收缩(contracting)路径对应的层直接前馈传递context(以tensor复制的形式)。 - 相同类的接触对象的分割
这是细胞图像分割中的一个挑战。对此,提出了利用weight loss解决的方法,在接触细胞之间的背景在损失函数中有一个极大的weight.
weight map计算方法
网络结构
训练细节
- 加padding采用镜像的方式(Overlap-tile strategy)
网络初始化
理想情况下,初始权重应该调整至网络中的feature map具有近似的单位方差。在本文中这个可以通过使用具有sqrt(2/N)的高斯分布去初始化权重。数据增广
在数据集比较小的时候,为了让网络学到不变性和鲁棒性,使用数据增广是有必要的。对于显微镜图片,首先要保证平移旋转不变性,也要让畸变和灰度值保持鲁棒性。特别地,对训练集随机弹性畸变是数据增广的一个主要方面.能量函数
根据最终的feature map计算出的soft-max,然后再结合weight map进行计算。其他参数
参数 | 值 |
---|---|
momentum | 0.99 |
Batch size | Single Image |
Framework | Caffe |