论文浏览(43) oops! Predicting Unintentional Action in Video


0. 前言

  • 相关资料:
  • 论文基本信息
    • 领域:行为识别数据集
    • 作者单位:哥伦比亚大学
    • 发表时间:CVPR2020

1. 要解决什么问题

  • 之前的工作主要是预测原子动作。

2. 用了什么方法

  • 提出了 Oops 数据集,该数据及可以实现三类功能
    • 判断动作是否是故意的(intentionality)
    • 判断出现 intenional 到 unintentional 的时间段。
    • 预测未来(短期)的unintentional行为。
  • 数据集情况如下
    • 论文浏览(43) oops! Predicting Unintentional Action in Video
  • 为了判断视频的 intentionality,文中给出了三种方法
    • predicting video speed
      • 即,判断视频中人的速度
      • 给定大量unlabeled视频,手动设置sample rate(感觉就是对视频设置不同的FPS,论文中是给定了几个frames rate,即4/8/16/30),FPS高表示动作慢,FPS低表示动作快,构建模型判断视频的速度。
      • 论文浏览(43) oops! Predicting Unintentional Action in Video
    • predicting video context
      • 思路:unintentional 行为就是可以预测的行为,所以如果预测的结果与当前差别大,那就是intentional视频。
      • 具体怎么实现没细看。
    • predicting event order
      • 思路:unintentional action常常是无秩序或不可逆的(chaotic or irreversible)行为。
      • 模型功能:通过CNN预测输入clip中帧的排列顺序。

3. 效果如何

  • 三个基本任务的结果
    • 论文浏览(43) oops! Predicting Unintentional Action in Video
    • 论文浏览(43) oops! Predicting Unintentional Action in Video
  • 对比模型结果以及人自己的结果
    • 论文浏览(43) oops! Predicting Unintentional Action in Video

4. 还存在什么问题&有什么可以借鉴

  • 判断视频速度这个可以有,可以尝试下。

  • 有源码,需要研究下。