Video Classification with Channel-Separated Convolutional Netwroks 论文阅读
论文地址:https://arxiv.org/abs/1904.02811
Github:https://github.com/facebookresearch/VMZ
论文思想:
这篇文章的主要出发点就是降低3D网络的参数量,并且希望找到对于3D网络来说哪些维度的信息是更重要的,以及如何平衡参数量和准确率。主要是借助了分组卷积,通道分离的思想。并且提出了一个通道interactions的概念:
在这个图中(a)的interactions为4*6=24; (b)4*1 = 4 ; (c) 4*0 = 0;
作者设计了多个bottleneck, gc代表组卷积,dw代表深度可分离卷积
在kinetics数据集上面最好的结果有82.6%