【矩阵论】5.2-广义特征值问题

前言:什么是广义特征值问题?

【广义特征值问题】设A=(aij)Rn×nA=(a_{ij})\in \mathbb{R}^{n\times n}nn实对称矩阵,B=(bij)Rn×nB=(b_{ij})\in \mathbb{R}^{n\times n}nn实对称正定矩阵,使下式 Ax=λBx \mathbf{Ax=\lambda Bx} 有非零解向量xRnx\in \mathbb{R}^{n},则称λ\lambda是矩阵AA相对于矩阵BB的特征值,且xx是属于λ\lambda的特征向量。该问题常见于振动理论。

我们可以发现

  • BIB\not=I时,该问题是广义特征值问题
  • B=IB=I时,该问题是普通特征值问题

思路:如何求解广义特征值问题?

在想办法求解广义特征值问题前,我们需要先知道我们会做什么问题?首先,我们会做形如Ax=λxAx=\lambda x的普通特征值问题,如使用特征方程det(λIA)=0\det(\lambda I-A)=0求解特征值,使用(AλI)x=0(A-\lambda I)x=0通过求其零空间得到特征向量xx,对于实对称矩阵AA,我们还能得到任意特征值λi0\lambda_i\ge 0的特性,以及通过瑞利商理论得到当xHx=Ix^Hx=I时有λ=xHAx\lambda=x^HAx

因此,面对一个和普通特征值相关的新问题,我们可以尝试将不会做的问题转化为会做的问题。因此我们常将广义特征值问题转化为普通特征值问题,然后再利用普通特征值已成熟的求解方法,从而得到广义特征值问题的解向量。

本文就广义特征值问题做以梳理,完整定理证明请参考西工大的《矩阵论》[1]。

【矩阵论】5.2-广义特征值问题

一、广义特征值问题的等价形式

第1种等价形式

我们将等式两端分别左乘B1B^{-1}得到如下式子,可见虽然B1,AB^{-1},A都是对称矩阵,但B1AB^{-1}A一般不再是对称矩阵

B1Ax=λx B^{-1}Ax=\lambda x

第2种等价形式

我们将矩阵BB进行Cholesky\text{Cholesky}分解(平方根分解)得到下式 (其中GG是下三角矩阵)
B=GGT B=GG^T
因此有
Ax=λGGTxG1Ax=λGTxG1A[(GT)1GT]x=λGTx[G1A(G1)T](GTx)=λ(GTx) \begin{aligned} &Ax=\lambda GG^Tx\\ \Rightarrow & G^{-1}Ax =\lambda G^Tx \\ \Rightarrow & G^{-1}A[(G^T)^{-1}G^T]x =\lambda G^Tx \\ \Rightarrow & [G^{-1}A(G^{-1})^T](G^Tx) =\lambda (G^Tx) \\ \end{aligned}
我们令
{S=G1A(G1)Ty=GTx \begin{cases} S=G^{-1}A(G^{-1})^T \\ y=G^Tx \end{cases}
其中SS实对称矩阵,我们将AA广义特征值问题转化为如下矩阵SS普通特征值问题
Sy=λy Sy=\lambda y

二、特征向量的正交性(共轭性)

由于第2个等价形式的矩阵SS实对称矩阵,因此其特征值均是实数,且存在完备的标准正交特征向量系满足
yiTyj={0,  ij1,  i=j y_i^Ty_j = \begin{cases} 0,\; i\not= j \\ 1,\; i= j \end{cases}
由于
yiTyj=(GTxi)TGTxi=xiTGGTxi=xiTBxi y_i^Ty_j =(G^Tx_i)^TG^Tx_i=x_i^TGG^Tx_i=x_i^TBx_i
因此,有x=(x1,...,xn)Tx=(x_1,...,x_n)^T满足下式,其中xx称为按BB标准正交化向量系,下式称为BB正交条件
xiTBxi={0,  ij1,  i=j x_i^TBx_i = \begin{cases} 0,\; i\not= j \\ 1,\; i= j \end{cases}
所以,按BB标准正交化向量系xx具有如下重要性质

  • xi0  (i=1,2,...,n)x_i\not= 0 \; (i=1,2,...,n)
  • x1,x2,...,xnx_1,x_2,...,x_n线性无关

参考文献

程云鹏, 凯院, 仲. 矩阵论[M]. 西北工业大学出版社, 2006.