Multi-Person Pose Estimation with Enhanced Channel-wise and Spatial Information

CVPR19

多人位姿估计。baseline是CPN。

在CPN基础上添加了两个模块:Channel Shuffle Module (CSM)和Spatial, Channel-wise Attention Residual Bottleneck (SCARB)。

a. CSM是在不同level的feature maps上做channel shuffel,目的是混合pyramid feature maps的通道信息,因为一般来说,high level的feature map需要更大的感受野去推断困难的点,如遮挡点;而low level的feature map需要更大的分辨率去refine关节点坐标。所以这个不同level的特征在通道方向交流就很有意义。

b. SCARB利用了attention机制,目的是想在CSM融合后的feature map上,进一步的,在spatial和channel上突出对最后pose estimation贡献更大的信息,也就是给与更大的权重。

Multi-Person Pose Estimation with Enhanced Channel-wise and Spatial Information

 

SCARB的策略图:

Multi-Person Pose Estimation with Enhanced Channel-wise and Spatial Information