第一周：卷积神经网络

1.0 重点
1.1 计算机视觉
1.2 边缘检测示例
1.3 更多边缘检测内容
1.4 Padding

Convolution的分类

1.5 卷积步长

Convolution in math textbook:
1.6 三维卷积

1.7 单层卷积网络

记号

1.8 ⚠️ 简单卷积网络示例
1.9 池化层

Max Pooling
Average Pooling
Pooling总结

1.10 卷积神经网络示例
1.11 为什么使用卷积？

本文是卷积神经网络的笔记。

1.0 重点

一般来说 $n_C$ 随着网络深度增加而增加, $n_H,n_W$ 随着网络深度增加而减小。
一般卷积到最后都会把 $(n_H,n_W,n_C)$ 的向量拉成 $(n_H*n_W*n_C,1)$ 的向量，然后使用SoftMax（多选一任务，如判断为0-9中哪个数字），或者使用Logistic（是否问题，如判断是否为猫）
参数共享：
- 它允许在整个输入值的多个位置使用特征检测器。
- 它允许梯度下降将许多参数设置为零，从而使得连接稀疏。（即在全联接神经网络中很多参数都会被设置为0）
稀疏连接：
- 下一层中的每个**只依赖于前一层的少量**（数据）。

1.1 计算机视觉

不同于之前的全链接神经网络，卷积神经网络可以减少参数数量。

1.2 边缘检测示例

filter / kernel: 类似于卷积核
实现：
- python:-forward
- tensorflow:tf.nn.conv2d
- Keras:Conv2D
例子：
- 垂直边缘检测Kernel: $\begin{bmatrix} 1&0&-1 \\ 1&0&-1 \\ 1&0&-1 \end{bmatrix}$
- 如果输入图片为:（对应一个垂直边界，数值越大越亮）
  $\begin{bmatrix} 10 & 10 & 10 & 0 & 0 & 0\\ 10 & 10 & 10 & 0 & 0 & 0\\ 10 & 10 & 10 & 0 & 0 & 0\\ 10 & 10 & 10 & 0 & 0 & 0\\ 10 & 10 & 10 & 0 & 0 & 0\\ 10 & 10 & 10 & 0 & 0 & 0 \end{bmatrix}$
- 则输出为:
  $\begin{bmatrix} 0 & 30 & 30 & 0 \\ 0 & 30 & 30 & 0 \\ 0 & 30 & 30 & 0 \\ 0 & 30 & 30 & 0 \end{bmatrix}$

1.3 更多边缘检测内容

水平边缘检测Kernel: $\begin{bmatrix} 1&1&1 \\ 0&0&0 \\ -1&-1&-1 \end{bmatrix}$
符合这个模式的被称为正向边缘。
其他竖直边缘检测的Filter:
- Sobel Filter
  $\begin{bmatrix} 1&0&-1 \\ 2&0&-2 \\ 1&0&-1 \end{bmatrix}$
- Scharr Filter
  $\begin{bmatrix} 3&0&-3 \\ 10&0&-10 \\ 3&0&-3 \end{bmatrix}$

1.4 Padding

卷积操作后的尺寸：
- 原图像: $n\times n$
- Kernel: $f\times f$
- 输出： $(n-f+1)*(n-f+1)$

为了解决边缘数据丢失和尺寸变小的问题，我们采用Padding:

Padding: p
输出： $(n+2\times p-f+1)*(n+2\times p-f+1)$

Convolution的分类

"Valid" Convolution: 无Padding，输出为 $(n-f+1)*(n-f+1)$
"Same" Convolution: 有Padding，输出的尺寸和输入的尺寸一致。 $(n+2p-f+1)*(n+2p-f+1)$
- 所以此时Padding $p = \frac{f-1}{2}$ ，所以Kernel基本上的尺寸 $f$ 为奇数。

1.5 卷积步长

Stride：s
输出为 $[\frac{n+2*p-f}{s}+1]$ 向下取整数。

Convolution in math textbook:

实际上我们用的是cross-correlation，尽管信息中我们出于习惯将其称为卷积。

在数学书中，Convolution需要取Kernel的镜像，如:
$\begin{bmatrix} 3&4&5 \\ 1&0&2 \\ -1&9&7 \end{bmatrix}$
数学上之所以引入这个定义是可以了让卷积操作具有结合律。但实际上信息上我们不需要。

1.6 三维卷积

输入： $n \times n \times n_c$ , $n_c$ 表示通道数/深度
$n_c'个$ 卷积核： $f \times f \times n_c$
输出： $(n-f+1) \times (n-f+1) \times n_c'$

1.7 单层卷积网络

对卷积核 $i$ 的输出之后加一个常数 $b_i$ ，之后再通过**函数得到一个输出，将 $n_c'$ 个输出叠加起来得到最后的结果。
【类比全联接神经网络】
练习：
- 10个 $3*3*3$ 的卷积核有多少个参数？
- $10*(3*3*3+1)=280$ 个参数。

记号

$f^{[l]}$ ：第l层的Filter大小
$p^{[l]}$ ：第l层的Paddingr大小
- 如果是Same Padding则 $p^{[l]}=\frac{f^{[l]}-1}{2}$
$s^{[l]}$ ：第l层的Stride大小
第 $l$ 层输入： $n_H^{[l-1]} \times n_W^{[l-1]} \times n_C^{[l-1]}$
第 $l$ 层输出： $n_H^{[l]} \times n_W^{[l]} \times n_C^{[l]}$
- 具体参数尺寸计算：
$n_H^{[l]}=\left \lfloor \frac{n_H^{[l-1]}+2\times p^{[l]}-f^{[l]}}{s^{[l]}}+1 \right \rfloor$

$n_W^{[l]}=\left \lfloor \frac{n_W^{[l-1]}+2\times p^{[l]}-f^{[l]}}{s^{[l]}}+1 \right \rfloor$
第l层的filters个数: $n_C^{[l]}$
- 每个Filters的大小为 $f^{[l]}\times f^{[l]}\times n_C^{[l-1]}$
单个样本的**输出: $a^{[l]}$ ，尺寸为 $n_H^{[l]} \times n_W^{[l]} \times n_C^{[l]}$
将m个样本的输出 $A^{[l]}$ ，尺寸为 $m\times n_H^{[l]} \times n_W^{[l]} \times n_C^{[l]}$
第 $l$ 层卷积核参数总个数： $f^{[l]}\times f^{[l]}\times n_c^{[l-1]} \times n_c^{[l]}$
第 $l$ 层Bias的尺寸： $(1,1,1,n_c^{[l]})$

1.8 ⚠️ 简单卷积网络示例

一般来说 $n_C$ 随着网络深度增加而增加, $n_H,n_W$ 随着网络深度增加而减小。

这个例子过于简单，我们直接看1.10中的LeNet-5即可。

1.9 池化层

Max Pooling

一个f=2(尺寸 $2*2$ )，步长为2的例子。
基本原理
如果通过卷积提取到这个特征，则保留这个数据。
它没有什么需要学习的
⚠️ 尺寸计算:
类似于之前的卷积的计算，如果
- 输入尺寸为 $n*n*n_c$
- Kernel $f*f*n_c$
- Padding $p$ （很少用！）
- Stride $s$
- 输出尺寸为 $\left \lfloor \frac{n+2*p-f}{s}+1 \right \rfloor \times \left \lfloor \frac{n+2*p-f}{s}+1 \right \rfloor*n_c$

Average Pooling

一般在最后一层使用，如将一个 $7*7*1000$ 的输出变成 $1*1*1000$ 。

Pooling总结

⚠️ 没有需要学习的参数！！
常用的Hyperparameters:
- filter size: f
- stride: s
- Padding: p （用得很少！！）
- 选一种Pooling: Max / Average Pooling
最常用的Pooling是
- f=2,s=2,maxpool 等价于 $n_H/2,n_W/2,n_C'$

1.10 卷积神经网络示例

LeNet-5
两个卷积层，+Flatten（变成400*1的向量）+两个全联接+SoftMax（多选一）

1.11 为什么使用卷积？

卷积的好处：参数个数比较少
例子：(比较全连接神经网络和卷积神经网络的参数个数)
为什么卷积网络参数个数比较少？
- 权重共享(Parameter Sharing)：一个训练好的kernel在一张图片的各个位置都有用。
- 稀疏连接(Sparsity of Connections)：每一个输出都只和一小部分的输入有关。

第一周：卷积神经网络

第一周：卷积神经网络

1.0 重点

1.1 计算机视觉

1.2 边缘检测示例

1.3 更多边缘检测内容

1.4 Padding

Convolution的分类

1.5 卷积步长

Convolution in math textbook:

1.6 三维卷积

1.7 单层卷积网络

记号

1.8 ⚠️ 简单卷积网络示例

1.9 池化层

Max Pooling

Average Pooling

Pooling总结

1.10 卷积神经网络示例

1.11 为什么使用卷积？

相关推荐