03-GoogLeNet学习笔记

一、GoogLeNet采用了几个辅助损失？辅助损失函数的权重是多少？为什么要采用辅助损失函数？
二、Inception模块中有几个分支？分别是哪些操作？Inception模块输出时特征图采用什么方式融合？
三、读完该论文，对你的启发点有哪些？
四、代码实现：从网上找一张图片，执行GoogLeNet，观察top5输出的类别，并将输出结果截图进行打卡

一、GoogLeNet采用了几个辅助损失？辅助损失函数的权重是多少？为什么要采用辅助损失函数？

1.GoogLeNet采用了两个辅助损失，分别在Inception(4a)和Inception(4a)
2.辅助损失的权重=自身辅助weight * 0.3 ,模型总的权重 = weight + 0.3（两个辅助层权重）
3.采用辅助损失不仅可以增加loss回传（因为该模型网络较深，当从loss从后传到前面，梯度可能为0，会导致模型难以训练），而且可以充当正则约束项，迫使中间层特征也具有分类能力。

二、Inception模块中有几个分支？分别是哪些操作？Inception模块输出时特征图采用什么方式融合？

1 .共有四个分支，分别为1*1卷积、（1 * 1卷积 +3 * 3卷积）、（1 * 1卷积 + 3 * 3卷积）和（3 * 3最大池化+1 * 1卷积）
2.GoogLeNet结合了赫布理论（the Hebbian principle：一起激发的神经元连在一起），Inception将各个分支所生成的特征图按照从左往右加在一起，然后融合输出。其中，每个分支的特征图到紧挨在一起的，这也体现了赫布理论。
3.简单版本Inception模块（如左下图）有一个缺点：参数过多；为了解决这个问题提出优化Inception模块，主要是增加了1 *1卷积，可以大大减少参数运算。
举例说明：
简单版本3 * 3卷积过程计算量= 3 *3 * 256 *192=442,368
优化版本3 * 3卷积过程计算量= 1 *1 * 256 *64 + 3 * 3 * 64 *192 =126,976

4.Inception结构图
如右边Inception所示，融合输出特征图数量= 128+192+96+64
03-GoogLeNet学习笔记

三、读完该论文，对你的启发点有哪些？

1 .Inception module 采用多尺度卷积，可以提取不同尺度的特征
2.Inception module才用多个1 * 1卷积，大大减少计算量
3.训练技巧：（1）多尺度图像：尺寸均匀分布在8%~100%之间
（2）辅助损失层
4.测试技巧：一张图片通过一系列处理得到144张图片

四、代码实现：从网上找一张图片，执行GoogLeNet，观察top5输出的类别，并将输出结果截图进行打卡

结果如图所示：
03-GoogLeNet学习笔记

03-GoogLeNet学习笔记