基于分数阶傅里叶变换统计信息的人 脸识别(孙慧静)
基于分数阶傅里叶变换统计信息的人脸识别(孙慧静)
文章地址:paper
分数阶傅里叶变换作为新兴的图像处理工具,可以看作信号在时频平面进行任意角度的逆时针旋转。它引入了变换阶次,可以分析信号的时频域信息,通过阶次变换决定时频域信息的占比。
由于分数阶傅里叶变换不是保实的,对其幅度相位信息单独分析。对幅度信息进行了统计分析,首次对幅度信息含有判别信息进行了论证。另外,利用幅度信息对图谱结构具有鲁棒性的特性,解决了局部保持投影的相似矩阵对近邻数目敏感的问题。
本文首次提出差异脸,利用类间差异大与类内差异小,更好地识别人脸。把差异脸与相位信息统计特性相结合,利用相位信息的稀疏性,合理地设置阈值解决了人脸识别对外界因素敏感的问题。在实验过程中,每人仅提取一个训练样本,其余均用作测试,不仅得到了理想的识别效果,还解决了小样本问题。
1.目前关于人脸识别的方法综述
1.1基于空域的人脸识别方法
1) 主成分分析(Principal Component Analysis,PCA)。是一种线性变换,该方法通过构建协方差矩阵对图像进行处理和特征提取,最终实现样本的最优化重建。实现步骤: A. 计算图像的总散度矩阵,提取图像的主成分形成特征子空间。B. 在特征子空间分析图像,不仅提取了图像的主要判别信息,而且降低了图像的维数,提高了识别的速度。优点:因为是线性变换,描述数据时方便快捷。缺点:其核心没有以分类为目的,不是很适用于模式识别类问题;其产生的特征向量只是考虑图像之间的所有差异,忽略了类别信息。因此无法辨别这些差异来自类间还是类内。
2)线性判别分析(Linear Discriminant Analysis,LDA)。是基于PCA的改进算法,改进的点在于:考虑了人脸的类别信息,分别考虑了类内离散度和类间离散度,使得类间与类内比值最大,即最大化类间离散度、最小化类内离散度。缺点:不能很好的解决小样本问题。解决措施:将PCA和LDA相结合提出Fisher脸,即 Fisher Linear Discriminant Analysis (FLDA)。首先用PCA对图像进行降维,使得类内矩阵转化为可逆矩阵,同时也解决奇异问题。
3)局部保持投影(Locality Preserving Projection, LPP)。在流形空间提取人脸特征
4)稀疏表示 (Sparse Representation, SR)。将人脸训练图像线性表示测试图像,其中表示系数会构成一个字典,然后可以用稀疏重构法求解字典。稀疏表示中最重要的就是字典的求取,为了得到更为稀疏的字典表示,需要大量的训练样本。优点:能够用少量元素表示复杂信号;缺点:需要大量的训练样本,不适用于小样本问题,但过多的训练样本又会带来字典冗余问题
1.2基于变换域的人脸识别方法
1)基于Gabor的人脸特征提取方法。Gbaor具有良好的空间频率,空间局部特性及方向选择性等优点,能够提取图像局部区域多尺度、多方向的显著特征。目前,基于 Gabor 变换的人脸识别算法主要有两种,一种是弹性图匹配法,另一种为基于 Gabor 特征的子空间分析法。前者基于人工标记关键特征点,后者是通过下采样对原始Gabor特征进行降维,然后进行子空间分析。二者缺点:理论上两幅图都需要点对点对应,实际操作却很难实现。因此就出现了较多基于Gabor的改进方法,比较典型的就是将Gabor与局部二值模式相结合
利用小波函数用于人脸识别的优点在于:既可以得到图像信息又能够得到频率信息。缺点: 得到的特征维度较高,冗余信息较多,运算复杂度较大,原因是小波变换在处理图像时,主要利用图像多尺度、多方向信息。若是进行降维,则有可能去掉一些有用的判别信息,从而导致识别率下降。
2)基于分数阶傅里叶变换的人脸识别。分数阶傅里叶变换是傅里叶变换的广义形式。傅里叶变换是全局变换,不能同时兼顾频域信息和时域信息。FRFT是一种时频变换,能够同时获得时频信息。
2.可行性分析
将分数阶傅里叶变换用于人脸特征提取,由于分数阶傅里叶变换是不保实的,需要对幅度和相位分别进行分析。幅度信息:先判别幅度信息是否含有判别信息,其次,幅度反应能量聚集性,很少含有图像的纹理信息,对图像的拓扑结构性有较好的鲁棒性。相位信息:含有较多的纹理信息,不同阶次包含的低频和高频信息不尽相同。
3.基于分数阶傅里叶变换幅度信息的人脸识别
本文提出基于分数阶域幅度特征的人脸识别,将多阶次的幅度特征信息进行融合(Multiple orders’ amplitude information fusion, MOAF)。优点:首次将分数阶域幅度信息特征用于人脸识别,且对幅度信息做详细解释,并从三维人脸图像的统计特性上看出幅度信息不仅反映能量的聚集性还具有判别信息。其次,幅度信息特征主要反映能量分布,对图像拓扑结构具有较好的鲁棒性,且对外界因素具有鲁棒性。
3.1幅度信息及阶次选择
对分数域的幅度信息进行逆变换,得到如图3.1,可以看出随着阶次逐渐变大,图像的能量越来越聚集
由于分数阶傅里叶变换的周期为4,且存在对称性,本文选择对阶次0~2进行研究,间隔取0.1,利用迹比值来选取要融合的阶次,迹比值越大表示包含的信息越多,计算公式如下:
本文选取三个阶次的幅度信息进行融合,阶次选太少会导致信息量不足,阶次过多会导致信息量冗余,融合模型如下:
为了验证幅度信息包含有判别信息,将其与直接使用图像灰度信息进行对比,实验证明幅度信息具有含有判别信息。利用 LPCCA 对多阶次的 2D-DFrFT 幅度信息融合。LPCCA 在信息融合过程中对两个阶次的特征进行融合,剩余的阶次特征在降维后直接串联在 LPCCA形成的特征向量之后。实验结果表明融合多阶次的幅度信息能够具有很好的识别效果。
4.基于分数阶 Fourier 域广义相位谱带特征融合的人脸识别
分数域的相位谱包含丰富的边缘和纹理信息,结合不同阶次下的相位谱包含不同的信息,通过计算迹比值,对不同阶次的相位谱进行融合,得到新的广义相位谱(Multiple orders’ generalized phase spectrum band fusion, MGPSB)。优点:不仅能够提取低阶次中相位谱的平滑信息,还能提取高阶次中相位谱的边缘信息。对分数域的相位谱做逆变换可以发现,随着阶次的逐渐变大,图像的轮廓逐渐清晰。
4.1阶次划分
由于分数阶傅里叶变换有周期性,且周期为4。且由于对称性,[0,2]与[2,4]之间对称,而[0,1]和[1,2]对称,因此只需对阶次[0,1]进行研究即可。0.1~0.3:低阶次,0.4~0.6:中阶次,0.7`~0.9:高阶次。划分理由:同一范围内不同阶次差异较小,不同范围内不同阶次差异较大。融合框架如下:
5.基于分数阶 Fourier 域差异脸的人脸识别
人脸识别目前存在的问题:人脸图像容易受到光照、表情、遮挡等因素的影响,导致同一个人不同照片表现差异较大,当外界因素干扰严重时,会导致同一人不同照片之间的差异大于不同人之间的差异,从而大大影响了识别率。除此之外,小样本问题也是急需解决的问题。
基于以上原因,本文提出基于分数域差异脸的人脸识别方法。对所有人脸进行 2D-DFrFT,提取其相位信息,对变换后的每一类的测试人脸图像减去训练图像,得到差异图。通过对差异图的统计信息进行分析,发现其统计信息具有一定的稀疏性。对得到的数据进行阈值分析,以更好的利用差异脸的稀疏性。
在测试过程中,不直接对人脸图像处理,而是用测试人脸减去每一类训练人脸图像,从而得到差异脸,如果测试图片与训练图像属于同一个人,那么差异只会来自于外界因素,差异不会很大,如果不属于同一个人,那么差异不只来自于外界因素,还会受到类间因素的影响,相对来说差异就会比较大。
差异脸受外界因素的影响,如何减弱甚至消除外界因素对识别率的影响,是本章关注的问题。图像经过二维离散分数阶傅里叶变换之后,其相位信息反应的是图像的边缘信息,其中比较小的值是噪声(光照、表情变化等)扰动。如果能够去除噪声扰动,就会削弱外界因素的影响在本文中,我们对图像先进行 2D-DFrFT,提取其广义相位谱,然后再求出差异脸。算法框架图如下:
本文利用 2D-DFrFT 相位统计信息的稀疏性,通过阈值设置减小噪声扰动,削弱了外界因素(例如光照、表情、遮挡、像素污染等因素)的影响,提高了算法对外界算法的鲁棒性。