CNN 模型所需的计算力(flops)和参数(parameters)数量是怎么计算的

看到有人对flops有疑惑,先捋清这个概念。

FLOPS:注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。

FLOPs:注意s小写,是floating point operations的缩写(s表复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。

网上打字很容易全小写,造成混淆,本问题针对模型,应指的是FLOPs

each MAC contains one multiplication and one addition.

————————————————————————————————————————

描述一个深度学习框架/模型,除了它的精度,通常用Forward Pass计算量和参数个数(#Parameters)来描述复杂度

前者描述了所需的计算力

后者描述了所需的内存

1、深度学习框架FLOPs的概念(即:浮点运算数量;也可以用MAC表示:each MAC contains one multiplication and one addition.)https://github.com/sovrasov/flops-counter.pytorch/issues/16

paper里比较流行的单位是GFLOPs:1 GFLOPs = CNN 模型所需的计算力(flops)和参数(parameters)数量是怎么计算的 FLOPs (即:10亿次浮点计算)

2、深度学习框架FLOPs的组成

1、卷积运算Conv

用以下动图中直观的解释:

image大小:5*5

卷积核大小:3*3

举例:一次3*3的卷积(求右图矩阵的一个元素的值)所需的运算量:(3*3)个乘法+(3*3-1)各加法 =17

得到3*3大小的特征图尺寸:17*9 = 153

CNN 模型所需的计算力(flops)和参数(parameters)数量是怎么计算的

1)bn

2)linear

3)上采样

4)poolings

5)relu

Conv占的比重最大,此外他和输入图像的大小也有关系

而#Parameters和图像大小没有关系

3、计算Forward Pass计算量和参数个数(#Parameters)的代码(基于pytorch)

https://github.com/Lyken17/pytorch-OpCounter

https://github.com/sovrasov/flops-counter.pytorch

CNN 模型所需的计算力(flops)和参数(parameters)数量是怎么计算的

4、常用框架的复杂度

CNN 模型所需的计算力(flops)和参数(parameters)数量是怎么计算的