pose machine论文基本思想和全文翻译

pose machine论文基本思想和全文翻译


基本思想

pose machine论文基本思想和全文翻译
网络分为多个层级多个stage,每个层级的输入是一个patch(图像的部分),即从图像中以点z(x,y)为中心得到的一个矩形框(可以设定不同的大小)。第一个stage的层级1将从patch得到的特征1xz作为输入,经过多分类器1g1得到各个part的置信1b1,接下来的stage同时将特征1xz和上一个stage在不同层级上得到的上下文信息Ψ作为输入,经过分类器1g2得到这个阶段各个part的置信,此时得到的结果比stage1的结果好。

这里的上下文信息Ψ分为两部分,一部分是上下文patch特征,一部分是上下文offset特征。前一部分是每个层级上所有part在位置z处score的级联,是对短距离的关系进行处理;后一部分先获取所有part在l层级t-1 stage上的置信的峰值,然后计算part p从z到峰值k的极坐标偏移向量,也对长距离的交互进行编码。

论文翻译链接