您的位置: 首页 > 文章 > 【论文笔记-Stereo】Pyramid Stereo Matching Network

【论文笔记-Stereo】Pyramid Stereo Matching Network

分类: 文章 • 2024-04-27 11:45:49

- - 论文思想
  - 笔记

论文思想

使用ResNet提取特征
用dilated convolution增大感受野
用Pyramid pooling module，提取各个scale的特征，使之包含global的context信息
用feature volume shift构建volume
用stacked hourglass 3D CNN（encoder-decoder）来处理cost volume，在训练过程中使用不同层级的hourglass的输出算加权loss
end-to-end stereo estimation
在KITTI上取得了当时最好的结果

笔记

结构

【论文笔记-Stereo】Pyramid Stereo Matching Network

【论文笔记-Stereo】Pyramid Stereo Matching Network

【论文笔记-Stereo】Pyramid Stereo Matching Network

【论文笔记-Stereo】Pyramid Stereo Matching Network

视差计算（回归方法）

DIsparity regression

d_{p r e d} = \sum_{i}^{d_{m a x}} d_{i} * σ (d_{i})

与MC_CNN，Content-CNN不同，此时的d是连续值。

损失函数

smooth_l1_loss, 在目标检测中常被使用，对outlier的鲁棒性更强。（outlier容易造成梯度爆炸，把MSE>1的部分改为l1,梯度由（x-t）变为+-1）