CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的

看到有人对flops有疑惑，先捋清这个概念。

FLOPS：注意全大写，是floating point operations per second的缩写，意指每秒浮点运算次数，理解为计算速度。是一个衡量硬件性能的指标。

FLOPs：注意s小写，是floating point operations的缩写（s表复数），意指浮点运算数，理解为计算量。可以用来衡量算法/模型的复杂度。

网上打字很容易全小写，造成混淆，本问题针对模型，应指的是FLOPs。

each MAC contains one multiplication and one addition.

————————————————————————————————————————

描述一个深度学习框架/模型，除了它的精度，通常用Forward Pass计算量和参数个数（#Parameters）来描述复杂度

前者描述了所需的计算力

后者描述了所需的内存

1、深度学习框架FLOPs的概念（即：浮点运算数量；也可以用MAC表示:each MAC contains one multiplication and one addition.）https://github.com/sovrasov/flops-counter.pytorch/issues/16

paper里比较流行的单位是GFLOPs：1 GFLOPs = CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的 FLOPs （即：10亿次浮点计算）

2、深度学习框架FLOPs的组成

1、卷积运算Conv

用以下动图中直观的解释：

image大小：5*5

卷积核大小：3*3

举例：一次3*3的卷积（求右图矩阵的一个元素的值）所需的运算量：（3*3）个乘法+（3*3-1）各加法 =17

得到3*3大小的特征图尺寸：17*9 = 153

CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的

1）bn

2）linear

3）上采样

4）poolings

5）relu

Conv占的比重最大，此外他和输入图像的大小也有关系

而#Parameters和图像大小没有关系

3、计算Forward Pass计算量和参数个数（#Parameters）的代码（基于pytorch）

CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的

4、常用框架的复杂度

CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的