人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"
人脸姿态的变化是人脸识别的难点,一般的姿态不变的人脸识别方法是人脸正面化,或者从非正脸的图片中学习特征。论文提出Disentangled 表示学习-生成对抗网络。有三个特征,1)生成器的编码-解码结构使得DR-GAN学习generative和discriminative的表示,2)通过提供到解码器的姿态编码和鉴别器的姿态估计,学到的特征表示与其他的人脸变形disentangled。3)DR-GAN可以输入一张或多张图像,生成一个unfied的表示。
DR-GAN的结构如下图所示:
生成对抗网络由G和D生成样本,GAN的主要目标是图像合成,论文建立了一个带有编码-解码结构的G,如图2d所示,编码器的输入是任意姿态的人脸,解码器的输出是人造的特征姿态的人脸。G是人脸旋转器,D不仅用来分辨真实和人造图像,还用来预测ID及姿态。D的任务是让生成的人脸和真实的人脸不具有相同的ID,这样使得G生成更真实的旋转人脸,并且学习到的人脸表示更generative。
论文提出的G输入是人脸图像,姿态编码c及一个随机噪声z,生成足以迷惑D的标准姿态人脸。
实验结果
对抗损失与L2损失合成人脸效果对比: