Video Classification with Channel-Separated Convolutional Netwroks 论文阅读

论文地址:https://arxiv.org/abs/1904.02811

Github:https://github.com/facebookresearch/VMZ

论文思想:

这篇文章的主要出发点就是降低3D网络的参数量,并且希望找到对于3D网络来说哪些维度的信息是更重要的,以及如何平衡参数量和准确率。主要是借助了分组卷积,通道分离的思想。并且提出了一个通道interactions的概念:

Video Classification with Channel-Separated Convolutional Netwroks 论文阅读

在这个图中(a)的interactions为4*6=24; (b)4*1 = 4 ; (c) 4*0 = 0;

作者设计了多个bottleneck, gc代表组卷积,dw代表深度可分离卷积

Video Classification with Channel-Separated Convolutional Netwroks 论文阅读

在kinetics数据集上面最好的结果有82.6%

Video Classification with Channel-Separated Convolutional Netwroks 论文阅读