mobile net

mobile net 谷歌,2017.4.17 arxiv。
mobile net主要是采用depthwise separable convolutions(第一层除外,采用了正常卷积),depthwise separable convolution是将正常的卷积分成两步,第一步是每个channel都单独进行卷积,然后通过1*1卷积将其合并(即正常1*1卷积)。depthwise separable convolution是谷歌4.4提出的Xception中的。
与Xception 相比,mobile net论文主要是进行了大量的实验,与各种领域中的比较有代表性的模型进行了比较,包括对象检测、细粒度识别、人脸属性提取,以及大规模地理定位,人脸识别。
mobile net提出了两个超参数:width multiplier 和 resolution multiplier,平衡模型的计算效率和准确率。width multiplier(a)主要是对channel 数进行减少,这样就可以减少a^2 个参数。 resolution multiplier(b)主要是对输入图像大小进行减少,不会减少模型的参数,但会减少模型的计算次数,其减少的计算次数也是b^2。模型设计者可以根据这两个参数设计适当规模的模型。
实验:
mobile net
mobile net
mobile netmobile net
mobile net
mobile net
实验结果显示,mobile net在模型参数很少,延迟时间很少的情况下,准确率变化幅度小。

参考网址:https://juejin.im/post/599e387851882512406327e6