Three-Dimension Transmissible Attention Network for Person Re-Identification
论文:Three-Dimension Transmissible Attention Network for Person Re-Identification
论文链接:
Three-Dimension Transmissible Attention Network for Person Re-Identificationieeexplore.ieee.org
基于可传递3D关注的行人重识别算法。该算法提出了一个用于行人重识别的三维可传输注意力网络(3DTANet),该网络可以一层一层地传递注意力信息,并从三维角度关注行人图像学习信息。 该算法首先引入了一种新颖的可传输注意力(TA)机制,该机制可以在卷积层之间传递注意力信息。与传统的注意力机制不同,它不仅可以逐层传递积累的注意力信息,而且可以指导网络保留整体的注意力信息。其次提出了一种三维注意力(3DA)机制,该机制能够提取三维注意力图。虽然先前关于图像注意力机制的研究分别提取通道或空间注意力信息,但3DA机制同时关注通道和空间信息,从而使它们在注意力提取中发挥更好的互补作用。
-
3DTANet中包含3DA和TA机制的3DTA模块,总体示意图如图1所示。
图1
-
3DA模块介绍
传统的关注模块,从输入3D特征图中提取1D或2D关注信息图的过程,因为是将3D数据割裂为1D或2D数据,这样的过程会损害3D所含有的信息的完整性。Hu等人介绍了带有挤压和激励块的关注机制,该机制有效地利用了通道的关注信息。这个工作的实验结果验证了利用关注信息在完成分类任务的有效性和可行性。Chen等人通过探索高阶注意力机制来利用复杂的高阶统计信息,也获得了很好的识别结果。这个工作说明如果可以更恰当地利用初级关注信息,将低阶关注信息通过一些方法提取为高阶关注信息,那么基于关注机制的模型还有很大的性能提升空间。受以上两个模型的激励,本文致力于研究构造一种更有效对特征图的关注信息提取技术,将研究工作整理之后提出3DA模块,这个3DA模块在一个阶段而不是两个单独的步骤中,同时将通道关注信息和空间关注信息一起提取,避免3D特征图被关注机制割裂,即在一个阶段成功地利用了空间和通道关注信息。3DA模块不割裂3D特征图,因而能保留3D特征图的完整信息,从而保留更多的整体和局部关注信息,这是有益的一种改进机制,如图2所示。
图2
图3
-
TA模块介绍
TA机制的主要功能是将前一层关注信息图的传递给后一层的关注信息图。如图4所示,图中M1是从前一个卷积层的特征F1提取到的关注信息图,M2是从后一个卷积层的特征F3提取到的关注信息图,M1的关注信息融合在F3之后经过关注模块3DA2传递到关注信息图M2。
图4
-
实验结果
-
CUHK03-NP
-
Market-1501
-
DukeMTMC-reID
-
MSMT17