人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"

人脸姿态的变化是人脸识别的难点，一般的姿态不变的人脸识别方法是人脸正面化，或者从非正脸的图片中学习特征。论文提出Disentangled 表示学习-生成对抗网络。有三个特征，1）生成器的编码-解码结构使得DR-GAN学习generative和discriminative的表示，2）通过提供到解码器的姿态编码和鉴别器的姿态估计，学到的特征表示与其他的人脸变形disentangled。3）DR-GAN可以输入一张或多张图像，生成一个unfied的表示。

DR-GAN的结构如下图所示：
人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"

生成对抗网络由G和D生成样本，GAN的主要目标是图像合成，论文建立了一个带有编码-解码结构的G，如图2d所示，编码器的输入是任意姿态的人脸，解码器的输出是人造的特征姿态的人脸。G是人脸旋转器，D不仅用来分辨真实和人造图像，还用来预测ID及姿态。D的任务是让生成的人脸和真实的人脸不具有相同的ID，这样使得G生成更真实的旋转人脸，并且学习到的人脸表示更generative。
人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"

论文提出的G输入是人脸图像，姿态编码c及一个随机噪声z，生成足以迷惑D的标准姿态人脸。Genc学习输入图像的特征表示，这个表示与c和z串联，输入到Gdec进行人脸旋转。Genc输入多幅图像，生成每个图像的特征表示及系数，所有表示综合成一个表示，Gdec使用这个表示合成人脸。Multi-Image GAN的生成器如下图所示：
人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"

实验结果
对抗损失与L2损失合成人脸效果对比：
人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"

人脸识别"Disentangled Representation Learning GAN for Pose-Invariant Face Recognition"

相关推荐