（2）高效的在线姿态跟踪方法→以改进的RMPE进行姿态估计，并提出两种新技术：姿态流建立（PF-Builder）和姿态流非极大值抑制（PF-NMS）。其中，姿态流用于关联同一个人的交叉帧姿态，根据姿态proposals构建，通过有效的目标函数寻找姿态流，这样的优化设计有助于稳定姿态流并关联不连续的姿态流（由于缺少检测）；PF-NMS用于减少冗余姿态流和时态不想交姿态流的重链接，在NMS处理中以姿态流为单位，充分考虑时间信息，大大提高系统稳定性。

二、本文方法

1、整体框架

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

图2:整体框架：1)姿态估计器。2)姿态流流生成器。3)姿态流NMS。首先，我们估计多人姿态。其次，我们通过最大化整体置信度来构建姿态流，姿态流是指不同帧中指示同一个人实例的一组姿势，并通过姿态流NMS来净化它们，也就是减少冗余姿态流，重新连接不相交姿态流。最后，获得合理的多姿态轨迹。

2、框架中涉及的基本度量和工具

（1）帧内姿态距离（Intra-Frame Pose Distance）

定义帧内姿态的距离，以测量帧中两个姿态【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）和之间的相似度。

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪） ——姿态的第n个关键点；，N是一个人的关键点数；

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪） ——以为中心的人体框；

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪） ——的得分，置信度；

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪） ——该函数用于抑制低分数的关键点；

软匹配函数

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

关键点之间的空间相似性

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

最终相似度（结合公式（1）和（2））

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）这些参数可以靠数据驱动获得（这里不是太懂数据驱动）

（2）帧间姿态距离（Inter-frame Pose Distance）

用于测量一帧中的姿态【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）和下一帧中的姿态之间的距离。

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪） ——以为中心的人体框，框大小是10%人体边界框的大小；

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪） ——从中提取的深度匹配特征点；

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪） ——和的相似性；

和的帧间姿态距离

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

3、改进的多人姿态估计

（1）基础姿态估计结构

Faster R-CNN作为人体检测器，基于ResNet152，由于缺少人工proposal标记，通过将人的关键点边界沿高度和宽度方向扩展20%来生成人体检测框，用于对人体检测器微调；
RMPE作为多人姿态估计器；
PRMs作为单人姿态估计器的沙漏网络。
其他：使用在线困难样本挖掘（OHEM）来处理困难关键点，每一次迭代，不必在小批量中采样最大的B/N losses，二是选择k个困难实例的最大损失，选择后，SPPE仅从困难关键点更新权重，减少计算时间，提高估计性能。

（2）改进方法1：数据增强（Data Augmentation）

针对问题：视频场景中，人们总是进出视频采集区域，导致截取问题；

解决方法：提出改进的深度proposal生成器（iDGP），用于数据增强，改进人体截断问题；

具体方法：在训练过程中使用随机裁剪策略产生截断的人体proposal，也就是将人体实例区域随机分成四分之一或半个人，然后将这些随机裁剪proposal用作增强的训练数据；

结果：在应用于视频时，可以观察到RMPE的改进。

（3）改进方法2：运动传播（Motion-Guided Box Propagation）

针对问题：由于运动模糊和遮挡，人体检测过程中会出现漏检，这回增加人员的IDs，降低MOTA的性能；

解决方法：通过交叉帧匹配技术deepmatching，将框proposal传播到上一帧和下一帧，也就是人体框是3倍；

结果：一些漏检的proposal恢复，召回率也有所提高。

4、姿态流构建（Pose Flow Building）

（1）构建理论公式

姿态流是通过在帧之间关联表示同一个人的姿态来构建的。

候选关联集

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）是第j帧的第i个姿态；是在（j+1）帧处的姿态集，这里理解就是计算与下一帧的姿态集中各姿态的距离，如果小于，则可能是关联的姿态，也就是下一帧中【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）可能对应的姿态。其中根据交叉验证设置.

目标函数最大化——目的是优化姿态选择

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

这里我的理解是：【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）是从t帧到t+T帧的所有候选关联集（帧与帧之间所有可能的姿态的连接关系），是的置信度函数，F的作用是取这些候选关联集中置信度最大的，也就是得到最佳的【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）作为从t帧到t+T帧的的姿态流。

置信度函数【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）如下，是此人体proposal中所有关键点的人体框得分、平均得分和最大得分之和。

【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）

（2）分析

将置信度得分之和作为目标函数，有助于抵御许多不确定性。当一个人被高度遮挡或模糊时，它的分数很低，因为模型对它没有信心，但是仍然可以建立一个姿态流来补偿它，因为最后看的是姿态流的总体置信度得分，而不是一个单独的帧。此外，可以在线计算置信度得分之和。也就是说，【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）可由和确定。

公式6是一个标准的动态规划问题，可以在线求解。在(u-1)帧处，我们有【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）个可能的姿势，并记录个最佳姿势的轨迹（分数总和）以达到它们。在第u帧，我们根据先前的最佳姿态轨迹计算可能姿势的最佳路径。相应地，更新【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）轨迹。是最佳姿势轨迹的分数之和。

（3）停止准则和置信度统一

停止准则：用公式6逐帧处理视频，直到满足停止准则。本文的停止准则是当：【论文阅读】Pose Flow: Efficient Online Pose Tracking（姿势流:高效的在线姿势跟踪）时，姿态流在u处停止，是交叉验证确定的，这也就意味着下面的r帧内的得分之和非常小，本文设r=3，这样的停止准则通过观察更多的帧，来抵抗突然的遮挡和帧退化（如运动模糊）。