SphereFace: Deep Hypersphere Embedding for Face Recognition

发布于2017年。

1 动机

作者研究了开集协议下的深度人脸识别问题，在一定的度量空间下，期望理想的人脸特征满足最大类内距离小于最小类间距离。然而，用这个标准学习特征通常是困难的，因为人脸存在极大的类内差异和极高的类间相似性。
很少有基于CNN的方法能够在损失函数中有效的表达上该准则。其中，center loss值鼓励类内紧凑性，contrastive loss和triplet loss都不能限制每个单独的样本，耗时。
将欧几里得边缘加到学习特征不适合于学习有区分的脸部特征。通过Softmax loss学习的特征具有固有的角分布。在某种意义上，基于欧几里得边际的损失与Softmax损失是不相容的。
构建了一个CNN，在CASIA人脸数据集的子集上学习二维特征。黄点代表第一类人脸特征，紫点代表第二类人脸特征，（b，d，f）是对其进行归一化处理的分布，通过Softmax loss学习的特征具有固有的角分布，原始的softmax loss学习的特征不能通过角度进行分类，修改过的softmax loss学习特征呈角度分布，但不一定更具判别力，而A-softmax loss可以进一步增加学习特征角余量，决策区域变得更加分离，同时扩大了类别间的余量并压缩了类内的角度分布。

面部识别可以在封闭设置或开放设置下进行评估。
对于封闭设置协议，所有测试身份都在训练集中进行了预定义。在这种情况下，人脸验证等效于识别一对面部。因此，封闭集人脸识别可以视为分类问题来很好的解决。
对于开放式协议，测试身份通常与训练集不相交，这使人脸识别更具挑战性，但接近实践。由于不可能在训练集中将面孔分类为已知身份，因此我们需要将面孔映射到区分特征空间。开放式FR本质上是一个度量学习问题，其中的关键是学习有区别的大边界的特征。

SphereFace: Deep Hypersphere Embedding for Face Recognition

p1和p2分别为第一类和第二类的概率。将Softmax Loss函数进行修改，从而转化为角度问题。
在训练过程中，Modified Softmax Loss鼓励第i类特征比其他特征具有更小的角度thetai。
尽管我们可以通过修改后的softmax损失学习具有角边界的特征，但是这些特征仍然不一定具有判别力。由于我们使用角度作为距离量度，因此很自然地将角度余量合并到学习的特征中以增强判别能力。