Chained Predictions Using Convolutional Neural Networks
1、文章主要是运用类似于RNN结构进行建模,每一个阶段用到上一个隐含层和之前所有的输出层
图中大体可以展现作者的思路
与RNN不同的是,作者在训练图片的时候w都不是权值共享的,但是RNN网络的U,V,W都是权值共享的,如图
作者这样做也是为了适应人体姿态估计这一任务,在后面的vedio的实验中,作者却采用权值共享的策略
作者在文中还提出了deception的结构
也即deconvolution+inception的结构罢了
2、Recurrent Human Pose Estimation
这一篇文章运用recurrent的思想,增大感受野区域来获得更好的图像信息,优点在于端对端,不需要像feedback那个样子,需要把输出和输入结合在一起,作者也提到多个recurrent堆叠类似于hourglass,只能说提出了一种新的网络结构
文章包括feed-forward module和recurrent module两部分
作者还试验了hallucinated annotation和occlusion aware带来的影响,作者尝试利用肢体信息不仅仅是关键点信息进行训练
整体网络
还有一些处理heatmap的技巧觉得挺不错