论文浏览(43) oops! Predicting Unintentional Action in Video
0. 前言
1. 要解决什么问题
- 之前的工作主要是预测原子动作。
2. 用了什么方法
- 提出了 Oops 数据集,该数据及可以实现三类功能
- 判断动作是否是故意的(intentionality)
- 判断出现 intenional 到 unintentional 的时间段。
- 预测未来(短期)的unintentional行为。
- 数据集情况如下
- 为了判断视频的 intentionality,文中给出了三种方法
- predicting video speed
- 即,判断视频中人的速度
- 给定大量unlabeled视频,手动设置sample rate(感觉就是对视频设置不同的FPS,论文中是给定了几个frames rate,即4/8/16/30),FPS高表示动作慢,FPS低表示动作快,构建模型判断视频的速度。
- predicting video context
- 思路:unintentional 行为就是可以预测的行为,所以如果预测的结果与当前差别大,那就是intentional视频。
- 具体怎么实现没细看。
- predicting event order
- 思路:unintentional action常常是无秩序或不可逆的(chaotic or irreversible)行为。
- 模型功能:通过CNN预测输入clip中帧的排列顺序。
- predicting video speed
3. 效果如何
- 三个基本任务的结果
- 对比模型结果以及人自己的结果
4. 还存在什么问题&有什么可以借鉴
-
判断视频速度这个可以有,可以尝试下。
-
有源码,需要研究下。