Eigenvectors from Eigenvalues 论文问题理解


1.背景提要

论文摘要:本文提出了一种由特征值简洁确定特征向量的新方法。具体来说,我们把特征向量元素的范数平方与特征值和子矩阵特征值联系起来。

论文所介绍由矩阵特征值找出特征向量的背景是三名物理学家在研究“中微子”过程中,意外地发现矩阵特征向量的另外一种奇妙的解法。
这种解法只需要知道n阶厄米方阵A (Hermitian matrix)的特征值以及它的n个子矩阵特征值就可以解出矩阵A的所有特征向量元素的 范数绝对值
在此之前,我们想要找到矩阵特征向量的一般方法是 计算特征多项式(物理学中的久期方程)–>求解特征值–>求解齐次线性方程组–>得到特征向量

2.论文要点和blog中问题浅显的理解

1)论文开头说明

Eigenvectors from Eigenvalues 论文问题理解
即将n阶方阵AA设为Hermite矩阵,其不同的特征值写为λi(A)\lambda_{i}(A),相应标准化后特征向量写为viv_{i}。每个特征向量的元素表示vi,jv_{i, j}。矩阵MjM_{j}是矩阵AA去掉第jj行和第jj列后的子矩阵,它的特征值是λk(Mj)\lambda_{k}\left(M_{j}\right)

2)论文得出来的重要引理

Eigenvectors from Eigenvalues 论文问题理解
引理1是一个类似于Cauchy-Binet 公式的结论。让矩阵AA的一个特征值为0,则不失一般性,将矩阵AA所有的特征值设为0,而矩阵BB为任一(n×n1n \times n-1)的矩阵。引理的证明不难,将AA进行特征值分解,然后利用元素代换。具体可看论文详解。
Eigenvectors from Eigenvalues 论文问题理解
第二个引理才是文章的重点,它揭示了文章开头所说矩阵特征向量元素的范数平方和矩阵本身以及其子矩阵的关系。证明在论文中有详细介绍,由此结论,论文还给出vn,12k=1n1λk(A)=k=1n1λk(M1) \left|v_{n, 1}\right|^{2} \prod_{k=1}^{n-1} \lambda_{k}(A)=\prod_{k=1}^{n-1} \lambda_{k}\left(M_{1}\right) 这样的推导,其中vn,1v_{n, 1}就是矩阵AAnn个特征向量的第1个组成元素。
最后的推论还指出Eigenvectors from Eigenvalues 论文问题理解
即如果特征向量中的一个元素消失了,vi,j=0v_{i, j}=0,那么矩阵AA的特征向量方程将变成其子矩阵MjM_{j}(同样为厄米矩阵)的一个特征向量方程。

3)blog中的表达方式(更易懂)

在陶哲轩的blog中,他把这个问题进行了更加易懂的描述:令厄米矩阵AA表示为A=(aXXM) A=\left(\begin{array}{cc}{a} & {X^{*}} \\ {X} & {M}\end{array}\right) 那么这个时候,论文中的结论可以表示为vi,12=k=1n1(λi(A)λk(M))k=1;kin(λi(A)λk(A)) \left|v_{i, 1}\right|^{2}=\frac{\prod_{k=1}^{n-1}\left(\lambda_{i}(A)-\lambda_{k}(M)\right)}{\prod_{k=1 ; k \neq i}^{n}\left(\lambda_{i}(A)-\lambda_{k}(A)\right)} 其中分块矩阵MM就是矩阵AA的个子矩阵(减去第ii行和第ii列)。

3.方法的局限性

1.首先我认为论文的题目取得并不恰当。论文名是 Eigenvectors from Eigenvalues 然而论文的内容却是用矩阵和它的子矩阵的特征值得到其特征向量元素的范数平方。在研究中微子等问题中说不定会出乎意料地快捷,但是较难应用到更广的范围,因为判断元素方向的时间复杂度会很大,在规模较小的矩阵下,应用一般矩阵特征向量的求解方法可能更加得当。
2.矩阵的限制是厄米矩阵,而厄米矩阵的良好特性在于其本征值都是实数。物理学问题中解决的矩阵自然很多是厄米矩阵(解决实际的问题)。那么问题就来了,这个结论能否应用在整个空间的矩阵上呢?
3.此方法需要预先知道矩阵AA的特征值,以及它的nn个子矩阵的特征值,条件较多,局限较大。

4.论文链接及blog地址

论文链接 – 论文地址
陶哲轩blog关于此问题的讨论 –blog讨论