Position Attention Module

捕获特征图的任意两个位置之间的空间依赖，对于某个特定的特征，被所有位置上的特征加权和更新。权重为相应的两个位置之间的特征相似性。因此，任何两个现有相似特征的位置可以相互贡献提升，而不管它们之间的距离.。 位置注意力和通道注意力机制

特征图A（C*H*W）首先分别通过3个卷积层（BN和Relu）得到三个特征图{B,C,D},shape为（C*H*W），然后reshape为C*N，其中N=H*W，为像素的数量。
矩阵C和B的转置相乘，在通过softmax得到spatial attention map S（N*N）
矩阵D和S的转置相乘，reshape result到(CxHxW)再乘以尺度系数 α 再reshape为原来形状（C*H*W），最后与A相加得到最后的输出E

S矩阵的每一个元素为位置注意力和通道注意力机制，表示位置对位置的影响。E中的每一个元素为,为尺度因子，为D的元素，为A的元素