人体骨架特征点检测CPM:Convolutional Pose Machines

cpm算法就是通过级联stages,即通过stage2优化stage1得到的predict结果,stage3优化stage2,以此类推,一步一步refine predict得到最后的predict结果,原理如下图:

人体骨架特征点检测CPM:Convolutional Pose Machines

       stage1中,图像image(论文把图像归一化为368×368) 通过卷积和池化X,提出图像的特征(尺寸为46x46,有三个池化pool,所以缩小8倍),在经过两个1X1卷积,得到stage1的predict result(46X46X(P+1)),其中P为骨架特征点数,+1是背景,stage2中,图像image(论文把图像归一化为368×368)经过X’,得到46X46X32特征图,并把stage1中得到的predict result 

concat一起,再经过五个卷积层,得到stage2的predict result (46X46X(P+1)),重复stage2,重复的优化,得到最终的结果。

     gt heatmaps是特征点的高斯点,所有的stage都有监督训练,loss采用的是l2范数,如下所示:

人体骨架特征点检测CPM:Convolutional Pose Machines

人体骨架特征点检测CPM:Convolutional Pose Machines