Part 1：人脸识别

4.1 什么是人脸识别？

人脸识别难度更大，要求准确率更高，因为1%的人脸验证错误在人脸识别中会被放大很多倍。

对于人脸识别系统，通常我们数据库里仅存储着每个人的一张照片，我们需要用这一张照片来实现该人的识别，这个问题就是one shot 问题。

人脸识别系统需要识别出是否是库中K个人之一，或者不在库中。

对于one shot learning 问题：只有单个样本，不足以训练一个稳健的卷积神经网络来进行不同人的识别过程。而且，在有新的样本成员加入的时候，往往还需要对网络进行重新训练。所以我们不能以传统的方法来实现识别系统。

吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--课程笔记

将输入的人脸图片与数据库中所拥有的图片成对输入Similarity函数，两两对比，则可解决one shot problem。如果有新的人加入团队，则只需将其图片添加至数据库即可。

Siamese 可以实现上文的Similarity 函数

利用同样的卷积神经网络训练两种不同的图片x1, x2分别得到一个多维向量f(x1)和f(x2), 然后比较这两个向量的距离

| | f (x 1) - f (x 2) | |_{2}^{2}

训练目标：训练神经网络满足相近图片距离小，相远图片距离远

吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--课程笔记

如何通过学习神经网络的参数，得到优质的人脸图片的编码？方法之一就是定义 Triplet 损失函数，并在其之上运用梯度下降。

选取三张图片

目标：同一个人的图片差距小，不同人的图片差距大

L (A, P, N) = m a x (| | f (A) - f (P) | | - | | f (A) - f (N) | | + α_{m a r g i n}, 0)

吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--课程笔记

如果随机选择图片，有很大概率直接满足上述条件，学习不到任何知识。

所以我们应该选择难度大的图片(d(A,P) 约等于 d(A,N))来训练神经网络，这样学习速度快，效果好，

吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--课程笔记

训练集需要多对数据，应用时可以解决One-Shot的问题

对于大型的人脸识别系统，常常具有上百万甚至上亿的训练数据集，我们并我容易得到。所以对于该领域，我们常常是下载别人在网上上传的预训练模型，而不是从头开始。

人脸识别的方法有很多，除了上节的“Triplet 损失”，还可以利用二分类的方法。

如4.3讨论的，可以成对比较两张图片的编码，是同一个人的输出1表示same, 不是同一个人的输出0表示different。

吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--课程笔记

两张图片的神经网络结构和参数完全一致。
训练时同一个人的照片输出1，不同人的照片输出0
最后的sigmoid层次：输入两个128维的向量，输出二分类:
$\hat{y} = σ (\sum_{k = 1}^{128} w_{i} | f (x^{(i)_{k}}) - f (x^{(j)_{k}}) | + b)$
$| f (x^{(i)_{k}}) - f (x^{(j)_{k}}) | = \frac{(f (x^{(i)_{k}}) - f (x^{(j)_{k}}))}{f (x^{(i)_{k}})^{2} + f (x^{(j)_{k}})^{2}}$