SphereFace: Deep Hypersphere Embedding for Face Recognition

发布于2017年。

1 动机

  • 作者研究了开集协议下的深度人脸识别问题,在一定的度量空间下,期望理想的人脸特征满足最大类内距离小于最小类间距离。然而,用这个标准学习特征通常是困难的,因为人脸存在极大的类内差异和极高的类间相似性。

  • 很少有基于CNN的方法能够在损失函数中有效的表达上该准则。其中,center loss值鼓励类内紧凑性,contrastive loss和triplet loss都不能限制每个单独的样本,耗时。

  • 将欧几里得边缘加到学习特征不适合于学习有区分的脸部特征。通过Softmax loss学习的特征具有固有的角分布。在某种意义上,基于欧几里得边际的损失与Softmax损失是不相容的。
    SphereFace: Deep Hypersphere Embedding for Face Recognition

  • 构建了一个CNN,在CASIA人脸数据集的子集上学习二维特征。黄点代表第一类人脸特征,紫点代表第二类人脸特征,(b,d,f)是对其进行归一化处理的分布,通过Softmax loss学习的特征具有固有的角分布,原始的softmax loss学习的特征不能通过角度进行分类,修改过的softmax loss学习特征呈角度分布,但不一定更具判别力,而A-softmax loss可以进一步增加学习特征角余量,决策区域变得更加分离,同时扩大了类别间的余量并压缩了类内的角度分布。

2 工作

  • 提出A-Softmax loss来学习具有清晰几何解释的判别性人脸特征。所学到的特征有区别的分布在超球面上。
  • 得出m的下界,使得A-Softmax损失可以近似学习最小类间距离大于最大类内距离的学习任务。
  • 第一个展示FR中角余量有效性。在公开可用的CASIA数据集上进行了训练,然后在LFW,YTF测试集上取得极具竞争力的结果。

3 测试协议

SphereFace: Deep Hypersphere Embedding for Face Recognition

  • 面部识别可以在封闭设置或开放设置下进行评估。
  • 对于封闭设置协议,所有测试身份都在训练集中进行了预定义。在这种情况下,人脸验证等效于识别一对面部。因此,封闭集人脸识别可以视为分类问题来很好的解决。
  • 对于开放式协议,测试身份通常与训练集不相交,这使人脸识别更具挑战性,但接近实践。由于不可能在训练集中将面孔分类为已知身份,因此我们需要将面孔映射到区分特征空间。开放式FR本质上是一个度量学习问题,其中的关键是学习有区别的大边界的特征。

4 Modified Softmax Loss

SphereFace: Deep Hypersphere Embedding for Face Recognition

  • p1和p2分别为第一类和第二类的概率。将Softmax Loss函数进行修改,从而转化为角度问题。
  • 在训练过程中,Modified Softmax Loss鼓励第i类特征比其他特征具有更小的角度thetai。
  • 尽管我们可以通过修改后的softmax损失学习具有角边界的特征,但是这些特征仍然不一定具有判别力。由于我们使用角度作为距离量度,因此很自然地将角度余量合并到学习的特征中以增强判别能力。

5 A-Softmax Loss

SphereFace: Deep Hypersphere Embedding for Face Recognition

  • 决策边界会极大的影响特征分布,因此操作决策边界以产生角度余量。
  • 预测仅取决于特征和权重之间的角度,因此,特征可以分类为具有最小角度的标识,m是为了学习不同身份之间的角余量。
  • m越大,角度余量越大。相应学习任务变得更加困难。一般m=4。

SphereFace: Deep Hypersphere Embedding for Face Recognition

SphereFace: Deep Hypersphere Embedding for Face Recognition

6 训练

网络结构:

SphereFace: Deep Hypersphere Embedding for Face Recognition

流程:

SphereFace: Deep Hypersphere Embedding for Face Recognition

  • 在四个GPU上以128 Batch size进行训练,学习率从0.1开始,在16K,24K次循环时除以10。一共进行28K次循环训练。
  • 使用CASIA-WebFace进行训练,数据集相对较小。

在LFW和YTF测试集上测试。

SphereFace: Deep Hypersphere Embedding for Face Recognition

更大的角间隔带来更强的辨别力。使用64层CNN提取特征。

SphereFace: Deep Hypersphere Embedding for Face Recognition

SphereFace: Deep Hypersphere Embedding for Face Recognition

MegaFace challenge:

SphereFace: Deep Hypersphere Embedding for Face Recognition