mobile net

mobile net 谷歌，2017.4.17 arxiv。

mobile net主要是采用depthwise separable convolutions（第一层除外，采用了正常卷积），depthwise separable convolution是将正常的卷积分成两步，第一步是每个channel都单独进行卷积，然后通过1*1卷积将其合并（即正常1*1卷积）。depthwise separable convolution是谷歌4.4提出的Xception中的。

与Xception 相比，mobile net论文主要是进行了大量的实验，与各种领域中的比较有代表性的模型进行了比较，包括对象检测、细粒度识别、人脸属性提取，以及大规模地理定位，人脸识别。

mobile net提出了两个超参数：width multiplier 和 resolution multiplier，平衡模型的计算效率和准确率。width multiplier（a）主要是对channel 数进行减少，这样就可以减少a^2 个参数。 resolution multiplier（b）主要是对输入图像大小进行减少，不会减少模型的参数，但会减少模型的计算次数，其减少的计算次数也是b^2。模型设计者可以根据这两个参数设计适当规模的模型。

实验：

实验结果显示，mobile net在模型参数很少，延迟时间很少的情况下，准确率变化幅度小。

参考网址：https://juejin.im/post/599e387851882512406327e6

相关推荐