pose machine论文基本思想和全文翻译
pose machine论文基本思想和全文翻译
基本思想
网络分为多个层级多个stage,每个层级的输入是一个patch(图像的部分),即从图像中以点z(x,y)为中心得到的一个矩形框(可以设定不同的大小)。第一个stage的层级1将从patch得到的特征作为输入,经过多分类器得到各个part的置信,接下来的stage同时将特征和上一个stage在不同层级上得到的上下文信息作为输入,经过分类器得到这个阶段各个part的置信,此时得到的结果比stage1的结果好。
这里的上下文信息分为两部分,一部分是上下文patch特征,一部分是上下文offset特征。前一部分是每个层级上所有part在位置z处score的级联,是对短距离的关系进行处理;后一部分先获取所有part在l层级t-1 stage上的置信的峰值,然后计算part p从z到峰值k的极坐标偏移向量,也对长距离的交互进行编码。