线性代数笔记

1 矩阵

1.1 矩阵的定义及运算

1.1.1 矩阵的定义

矩阵是一个数表,由 m x n 个数排成的 m 行 n 列的数表
[a11a12a1na21a22a2nam1am2amn]\begin{bmatrix} {a_{11}}&{a_{12}}&{\cdots}&{a_{1n}}\\ {a_{21}}&{a_{22}}&{\cdots}&{a_{2n}}\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {a_{m1}}&{a_{m2}}&{\cdots}&{a_{mn}}\\ \end{bmatrix}
称为一个m行n列的矩阵,aija_{ij}为矩阵第i行j列的元素。
m=n时矩阵为方阵;只有aiia_{ii}不全为0的方阵叫对角阵;aiia_{ii}=1的对角阵为单位矩阵,记做I;元素都是0的矩阵为0矩阵。

1.1.2 线性方程组

{2x1+x2x3=1x1+x3=2\begin{cases} 2x_1+x_2-x_3&=1\\ x_1+x_3&=-2\\ \end{cases}
对应的系数矩阵为:
A=[211101]A= \begin{bmatrix} 2&1&-1\\ 1&0&1\\ \end{bmatrix}
对应的曾广矩阵为:
B=[21111012]B= \begin{bmatrix} 2&1&-1&1\\ 1&0&1&-2\\ \end{bmatrix}

1.1.3 矩阵的运算

运算 说明
同型矩阵 行列对应相等
矩阵相等 对应元素相同的同型矩阵
矩阵加法 同行矩阵才有定义,对应不元素相加
矩阵数乘 所有元素乘以对应的实数:kA = (kaija_{ij}
矩阵乘法 Am×tBt×n=Cm×n=(cij)m×nA_{m \times t}B_{t \times n} = C_{m \times n} = (c_{ij})_{m \times n},其中cij=k=1taikbkjc_{ij} = \sum_{k=1}^t{a_{ik}b_{kj}}
矩阵等价 A通过初等变换得到B
矩阵相似 A=M1BMA=M^{-1}BM

1.2 矩阵的两个图

2x2矩阵
{2xy=0x+2y=3[2112][xy]=[03]x[21]+y[12]=[03]{x=1y=2\begin{cases}2x-y=0\\-x+2y=3\\\end{cases} \rightarrow \begin{bmatrix}2&-1\\-1&2\\\end{bmatrix} \begin{bmatrix}x\\y\\\end{bmatrix}= \begin{bmatrix}0\\3\\\end{bmatrix} \\ x \begin{bmatrix}2\\-1\\\end{bmatrix} + y \begin{bmatrix}-1\\2\\\end{bmatrix}= \begin{bmatrix}0\\3\\\end{bmatrix} \rightarrow \begin{cases}x=1\\y=2\\\end{cases}

1.2.1 行图(row picture)

通过交点可以判断方程是否有解
线性代数笔记

1.2.2 列图(column picture)

列向量的线性组合
线性代数笔记

1.2.3 行列运算

[col1col2col3][abc]=acol1+bcol2+ccol3[abc][row1row2row3]=arow21+brow2+crow3 \begin{bmatrix}col1&col2&col3\\\end{bmatrix}\begin{bmatrix}a\\b\\c\\\end{bmatrix}=a*col1+b*col2+c*col3\\ \begin{bmatrix}a&b&c\\\end{bmatrix}\begin{bmatrix}row1\\row2\\row3\\\end{bmatrix}=a*row21+b*row2+c*row3

1.3 消元法与LU分解

1.3.1 矩阵的初等变换

ID 初等行(列)变换
1 交换两行(列)的位置
2 用一非零数程昱某一行的所有元素
3 把矩阵的某一行(列)的适当倍数加到另一行(列)上去

经过初等变换后,将矩阵转化成阶梯形式,如果曾广矩阵有非零主元则方程无解;如果阶梯矩阵对应的系数部分主对角含零,则有无穷解;

初等矩阵:对单位矩阵做一次初等变换得到的矩阵;行变换等于左乘初等矩阵,列变换等价于右乘初等矩阵

1.3.2 LU分解

高斯消元法:对曾广矩阵实施行初等变换化为行(简化)阶梯形

通过消元法将矩阵A转换成矩阵B(阶梯,上三角),对应行变换左乘的初等矩阵记为:E1,...,EkE1_,...,E_k则有:
Ek..E1A=BA=E11..Ek1BL=E11...Ek1A=LUE_k..E_1A = B \rightarrow A = E_1^{-1}..E_k^{-1}B,记L=E_1^{-1}...E_k^{-1},则A= LU

补:matlab求矩阵A的LU分解:rref(A)

1.3.3 线性方程组的解

在行变换的基础上加上交换行,化简后的矩阵为:[IF00]\begin{bmatrix}I&F\\0&0\end{bmatrix}其中I为单位矩阵,F是自由变元的矩阵
特解:AXb=bAX_b = b,平移向量,将零空间移离原点
通解:A(Xb+Xnull)=bXnullA(X_b+X_{null}) = b,X_{null}为零空间

1.4 Gram-Schmidt 正交化

qiTqj={0ij1i=jq_i^Tq_j=\begin{cases}0&i\neq j\\1& i=j \\\end{cases}
Q=[q1,..,qn],QTQ=IQ=\begin{bmatrix}q_1,..,q_n\end{bmatrix}, 则Q^TQ = I
例:Q1=12[1111111111111111],Q2=[cos(θ)sin(θ)ain(θ)cos(θ)]Q_1=\frac{1}{2}\begin{bmatrix}1&1&1&1\\1&-1&1&-1\\1&1&-1&-1\\1&-1&-1&1\end{bmatrix},Q_2=\begin{bmatrix}cos(\theta)&-sin(\theta)\\ain(\theta)&cos(\theta)\end{bmatrix}

步骤 说明
单位化 $q_1=\frac{a_1}{
正交化 a=q1,b=q2aTbaTaa,...a=q_1,b=q_2-\frac{a^{T}b}{a^{T}a}a,...
整理 Q=[ab..]A=QRR=QTAQ = \begin{bmatrix}a&b&..\end{bmatrix}(A=QR,其中R=Q^TA为下三角矩阵
注1:Q可以不是方阵,如果是方阵则Q1=QTQ^{-1}=Q^{T}
注2:Fourier变换基于正交基[sin(t),cos(t),..][et,eit,..][sin(t),cos(t),..]或[e^t,e^{it},..]

1.5 分块矩阵

矩阵可以分块计算

1.6 Markov矩阵

定义:所有元素都不小于0,每列和为1。
性质:λ1=1λi<1(i1)\lambda_1 =1,|\lambda_i| < 1(i\neq1)
用途:可以用于表示人口的迁移。


2 矩阵的逆

2.1 逆矩阵定义

AB=BA=IBAA1如果AB = BA = I,则B为A的逆矩阵,记为A^{-1}

等价命题
A可逆
AX = 0只有零解
A与I等价
A可以表示成有限个初等矩阵的乘积

2.2 Gass-Jordan

solve more equations at once:
(AI)(IA1)(A|I) \xrightarrow{初等行变换} (I|A^{-1})

AAx=bx=b/A=A1bA可逆的充要条件为Ax = b有唯一解 x = b/A = A^{-1}b

2.3 伪逆(sudo inverse)

伪逆|条件1|条件2|形式|结论
----|----
left inverse|r=n|N(A)=0N(A)=0|(ATA)1AT(A^TA)^{-1}A^T|0或1个解
right inverse|r=m|N(AT)=0N(A^T)=0|AT(AAT)1A^T(AA^T)^{-1}|多解,n-m个自由变量
A(ATA)1ATA(A^TA)^{-1}A^T是在列空间中的投影
AT(AAT)1AA^T(AA^T)^{-1}A是在行空间中的投影

2.4 奇异值分解(SVD)

任何矩阵A都可以分解成:A=UΣVTA = U\Sigma V^T其中Σ\Sigma为对角矩阵
AAT=UΣΣTUT=UDUTAA^T = U \Sigma \Sigma^TU^T=UDU^T
ATA=VΣTΣVT=VWVTA^TA = V \Sigma^T \Sigma V^T=VWV^T
Dm×m=[σ1200.0.0.00σk2....0]Wn×n=[σ1200.0.0.00σk2....0]D_{m \times m}=\begin{bmatrix} \sigma_1^2&0&0&.\\0&.&0&. \\0&0&\sigma_k^2&.\\.&.&.&0\end{bmatrix},W_{n \times n}=\begin{bmatrix} \sigma_1^2&0&0&.\\0&.&0&. \\0&0&\sigma_k^2&.\\.&.&.&0\end{bmatrix}
对应的逆为:A+=VΣ+UTΣ+=[1σ100.0.0.00.1σk....0]A^+=V \Sigma^+U^T,\Sigma^+=\begin{bmatrix} \frac{1}{\sigma_1}&0&0&.\\0&.&0&. \\0&0&.\frac{1}{\sigma_k}&.\\.&.&.&0\end{bmatrix}


3 线性空间

3.1 线性相关和张成

定义|说明|例子
----|----
向量空间|< V,+,*>是定义了加法和数乘的代数系统|过原点直线,过原点平面
线性空间|满足叠加性:加性+齐性|f(ax+by)=af(x)+bf(y)f(ax+by)=a*f(x)+b*f(y)
线性无关|不能互相表示的向量构成的集合|笛卡尔坐标轴
张成(span)|一组向量的全部线性组合的集合|
基(base)|张成整个空间V的线性无关向量组称为V的基|(1,0,0,…),(0,1,0,…),…
维度(dimention)|基的长度(或基的个数)|

注:0向量是所有向量空间的子集
注:向量空间的交是向量空间,并不一定是

3.2 四个空间

名称 说明
列空间(column space) 矩阵列向量张成的空间
零空间(null space) Ax=0Ax=0的X的解构成的空间,记N(A)N(A)
行空间(转置的列空间) 矩阵行向量张成的空间
转置零空间(左零空间) ATy=yTA=0A^{T}y = y^{T}A = 0,记N(AT)N(A^T)

线性代数笔记
如图row space 与 N(A) 正交补,column space 与 N(AT)N(A^{T})正交补,row space与column space 构成双射,其他部分都是零空间。

定理:dim(V)= dim(N)+dim(值域)

3.3 线性映射

每个矩阵Am×nA_{m \times n}对应一个从RmR^mRnR^n的线性映射,我们一般想要对矩阵A进行化简(特征值构成的对角矩阵),得到不同的基下的表示(分解成独立的子空间),可以简化问题或者看到问题的本质。

注:线性映射到矩阵的映射也是线性映射

3.3.1 特征值和特征向量(解耦、对角化)

特征向量在矩阵A的变化下只会出现缩放,不会出现方向变化:
Ax=λxλ=0Ax=0xN(A)Ax=\lambda x,\lambda =0时,Ax=0,对应的x确定零空间N(A)
求解:Ax=λx(AλI)x=0Ax=\lambda x \rightarrow (A-\lambda I)x=0
x不为0时,有AλI=0xiAλiI|A-\lambda I|=0,得到特征方程,x_i为A-\lambda_iI的零空间。

注:{Ax=αxBx=βx(A+B)x=(α+β)x\begin{cases}Ax=\alpha x \\Bx=\beta x \end{cases} \nrightarrow (A+B)x=(\alpha + \beta)x,对应的特征向量不同

3.3.2 特殊的特征值

矩阵|特征值|例子
----|----
负对阵|λ\lambda 为虚数|[0110]λ1=iλ2=iv1=[i1]v2=[i1]旋转矩阵\begin{bmatrix}0&amp;-1\\1&amp;0 \end{bmatrix},\lambda_1 = i,\lambda_2 =-i,v_1 = \begin{bmatrix}i\\-1\end{bmatrix},v_2=\begin{bmatrix}i\\1\end{bmatrix}
正对称|λ\lambda 为实数,不同特征值的特征向量正交|
畸形|λn\lambda 和正交向量不够n个|[0100]λ=1v=[10]\begin{bmatrix}0&amp;1\\0&amp;0 \end{bmatrix},\lambda = 1,v=\begin{bmatrix}1\\0\end{bmatrix}

3.3.3 特征值性质

i=1nλi=i=1naii\sum_{i=1}^n \lambda_i=\sum_{i=1}^n a_{ii}
i=1nλi=detA\prod_{i=1}^n \lambda_i=detA

3.3.4 QR法

利用QR分解迭代求解特征值:
Ai=QiRiA_i = Q_iR_i
RiQi=Ai+1R_iQ_i=A_{i+1}
迭代数次得到对角线矩阵,其中值为特征值

3.3.5 矩阵的多项式

f(A)=a1Ak+...+a1A+a0If(A) = a_1A^k+...+a_1A+a_0I
f(λ)=a1λk+...+a1λ+a0f(\lambda) = a_1\lambda^k+...+a_1\lambda+a_0

性质:f(A)g(A) = g(A)f(A)

4 行列式

4.1 定义

detA=a11a12...a1na21a22...a2n...an1an2...ann det A = \left| \begin{matrix} a_{11}&amp;a_{12}&amp;...&amp;a_{1n}\\ a_{21}&amp;a_{22}&amp;...&amp;a_{2n}\\ .&amp;.&amp;&amp;.\\ a_{n1}&amp;a_{n2}&amp;...&amp;a_{nn}\\ \end{matrix} \right|
n=1detA=a11当n=1时,detA = a_{11}
n2detA=a11A11+a12A12+...a1nA1n,Aij=(1)i+jMij当n \geq 2时,detA = a_{11}A_{11}+a_{12}A_{12}+...a_{1n}A_{1n},A_{ij} = (-1)^{i+j}M_{ij}
AijMij其中A_{ij}称为余子式,M_{ij}为代数余子式。

4.2 对比矩阵和行列式

行列式 矩阵
数表
DnD_n Am×nA_{m \times n}
| | (),[]

4.3 行列式的性质

ID|性质|推论
----|----
1|detI=1()detI = 1(放缩)|detA=0detA=0为奇异
2|行列式按任意一行展开,其值相等:detA=ai1Ai1+...+ainAindetA = a_{i1}A_{i1}+...+a_{in}A_{in}|detA0detA=0detA某一行全为0\Rightarrow detA=0
3|detAdetA=0detA中某两行对应位置元素相等\Rightarrow detA=0|
4|a11..a1n...bi1+ci1..bin+cin...an1..ann=a11..a1n...bi1..bin...an1..ann+a11..a1n...ci1..cin...an1..ann\left|\begin{matrix}a_{11}&amp;..&amp;a_{1n}\\.&amp;.&amp;.\\b_{i1}+c_{i1}&amp;..&amp;b_{in}+c_{in}\\.&amp;.&amp;.\\a_{n1}&amp;..&amp;a_{nn}\\\end{matrix} \right|=\\\left|\begin{matrix}a_{11}&amp;..&amp;a_{1n}\\.&amp;.&amp;.\\b_{i1}&amp;..&amp;b_{in}\\.&amp;.&amp;.\\a_{n1}&amp;..&amp;a_{nn}\\\end{matrix} \right|+\left|\begin{matrix}a_{11}&amp;..&amp;a_{1n}\\.&amp;.&amp;.\\c_{i1}&amp;..&amp;c_{in}\\.&amp;.&amp;.\\a_{n1}&amp;..&amp;a_{nn}\\\end{matrix} \right|
5|AkdetA1=kdetA将A的某一行元素全乘以k得到detA_1=kdetA|kdetAdetAdetA=0将某一行的k倍加到其他行detA不,交换两行detA变号,某两行元素对应成比例则detA=0
6|det(AB)=detAdetBdet(AB)=detA*detB|det(AT)=detAdet(A^T)=detA|

4.4 伴随矩阵

A1=CTdetAA^{-1}=\frac{C^T}{detA}
CTC^T为伴随矩阵,cijc_{ij}为对应的余子式
验证:
[a11a12.a1na21a22.a2n...an1an2.ann][c11c12.c1nc21c22.c2n...cn1an2.cnn]=[detA0.00detA.0...00.detA]=detAI\begin{bmatrix}a_{11}&amp;a_{12}&amp;.&amp;a_{1n}\\a_{21}&amp;a_{22}&amp;.&amp;a_{2n}\\ .&amp;.&amp;&amp;.\\a_{n1}&amp;a_{n2}&amp;.&amp;a_{nn} \end{bmatrix} \begin{bmatrix}c_{11}&amp;c_{12}&amp;.&amp;c_{1n}\\c_{21}&amp;c_{22}&amp;.&amp;c_{2n}\\ .&amp;.&amp;&amp;.\\c_{n1}&amp;a_{n2}&amp;.&amp;c_{nn} \end{bmatrix} = \begin{bmatrix}detA&amp;0&amp;.&amp;0\\0&amp;detA&amp;.&amp;0\\ .&amp;.&amp;&amp;.\\0&amp;0&amp;.&amp;detA \end{bmatrix}=detA \cdot I

4.5 集合意义

行列式的值为向量组维成的超体的体积,特征向量方向的缩放比为对应的特征值。


5 应用

5.1 电路

线性代数笔记
令矩阵A的行为边,列为节点,出度为-1,入度为1,x为顶点(电压),y为边(电流)。

5.1.1 电压

Ax=[11000110101010010011][x1x2x3x4]=C[y1y2y3y4y5]Ax= \begin{bmatrix}-1&amp;1&amp;0&amp;0\\0&amp;-1&amp;1&amp;0\\-1&amp;0&amp;1&amp;0\\-1&amp;0&amp;0&amp;1\\0&amp;0&amp;-1&amp;1\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix} = C\begin{bmatrix}y_1\\y_2\\y_3\\y_4\\y_5\end{bmatrix}
左侧为压降矩阵,右侧为欧姆定理,C为电阻矩阵。

5.1.2 电流

ATy=[10110110000110100011][y1y2y3y4y5]=[0000]A^Ty= \begin{bmatrix}-1&amp;0&amp;-1&amp;-1&amp;0\\1&amp;-1&amp;0&amp;0&amp;0\\0&amp;1&amp;1&amp;0&amp;-1\\0&amp;0&amp;0&amp;1&amp;1\end{bmatrix}\begin{bmatrix}y_1\\y_2\\y_3\\y_4\\y_5\end{bmatrix} = \begin{bmatrix}0\\0\\0\\0\end{bmatrix}
基尔霍夫定律,节点电流和为0;加入电流源f=ATy=ATCAXATCAf=A^Ty=A^TCAX,A^TCA为对称矩阵

5.2 投影(projection)

Ax=bbAAx^=ppba求解Ax=b,b不属于A的列向量张成的空间,此时求解距离最小的最优解A \hat x =p,p是b在a方向的投影。

5.2.1 一维投影

线性代数笔记
p=xaxxepe\vec{p}=x\vec{a},其中x为比例系数,故求解x即可。因为\vec{e}与\vec{p}正交时e的模最小,故:
ep=aT(bp)=aT(bxa)=0\vec{e} \cdot \vec{p}=\vec{a}^{T}(\vec{b}-\vec{p})=\vec{a}^{T}(\vec{b}-x\vec{a})=0
x=aTbaTap=ax=aaTbaTa=aaTaTab=Pbx = \frac{a^Tb}{a^Ta},p = ax = a\frac{a^Tb}{a^Ta} = \frac{aa^T}{a^Ta}b = Pb

5.2.2 高维投影

因为e与A正交,故e N(AT)\in N(A^T)
定义:p=x1a1+..+xkak=Axp = x_1a_1 + .. + x_ka_k = A x
正交:aiTei=aiT(biAxi)=0a_i^Te_i=a_i^T(b_i-Ax_i) = 0
p=Ax=A(ATA)1ATb=Pbp = Ax = A(A^TA)^{-1}A^Tb = Pb

5.2.3 投影性质

投影矩阵(P)的性质
PT=PP^T=P
P2=PP^2=P
I=P+E,bp=e=EbI=P+E,(b-p=e=Eb)

5.3 最小二乘

数据拟合,求解到已知点距离和最小的目标曲线。
线性代数笔记

5.3.1 利用矩阵求解

设直线为C+Dx=y,带入三点坐标:
[111213][CD]=[122]\begin{bmatrix}1&amp;1\\1&amp;2\\1&amp;3\end{bmatrix}\begin{bmatrix}C\\D\end{bmatrix}=\begin{bmatrix}1\\2\\2\end{bmatrix}
ATAx^=ATbx^A^TA \hat x = A^Tb,\hat x 为最小二乘解,图解如下:
线性代数笔记

5.3.2 利用导数求解

minAxb2=e2=e12+e22+e32min {||Ax-b||}^2={||e||}^2=e_1^2+e_2^2+e_3^2
f(C,D)=(C+D1)2+(C+2D2)2+(C+3D2)2f(C,D)={(C+D-1)}^2+{(C+2D-2)}^2+{(C+3D-2)}^2
$ \frac{\partial f}{\partial C} = 0 \rightarrow 6C+4D=0$
$ \frac{\partial f}{\partial D} = 0 \rightarrow 3C+6D=0$

微分方程 5.4

Ax=λxAS=ΛSA=S1ΛSAx=\lambda x \rightarrow AS=\Lambda S \rightarrow A = S^{-1} \Lambda S
SΛS为特征向量构成的矩阵,\Lambda 为特征值构成的矩阵。上面公式可以简化矩阵求幂。

5.4.1 通解

方程 通解
Uk+1=AUkU_{k+1}=AU_k Uk=C1λkxx+..U_k=C_1 \lambda^k x_x +..
dudt=Au\frac{du}{dt}=Au u(t)=C1eλ1t+..u(t)=C_1e^{\lambda_1t}+..

5.4.2 稳定性

线代控制理论用矩阵表示系统,如上面第二种微分方程,指数中的虚部代表震荡,实部影响稳定性。

λ\lambda 稳定性
所有$\lambda_i\leq$1 李雅普诺夫稳定(不发散)
所有$\lambda_i=$1 渐进稳定(随着时间收敛到0)
存在$\lambda_i>$1 不稳定

5.5 基变换和图像压缩

图片(512x512 pixel)$\xrightarrow{JPEG}{}64block8x8pixel64block(8x8 pixel)\xrightarrow{基变换}{}c系数c\xrightarrow{压缩}{} \hat c(许多0)$
变换基|举例|性质
----|----
standard|[10000000]\begin{bmatrix}1\\0\\0\\0\\0\\0\\0\\0\end{bmatrix} [01000000]\begin{bmatrix}0\\1\\0\\0\\0\\0\\0\\0\end{bmatrix}[00000001]\begin{bmatrix}0\\0\\0\\0\\0\\0\\0\\1\end{bmatrix}|效果不好
better|低频(全同):[11111111]\begin{bmatrix}1\\1\\1\\1\\1\\1\\1\\1\end{bmatrix} 上下相反:[11111111]\begin{bmatrix}1\\1\\1\\1\\-1\\-1\\-1\\-1\end{bmatrix} …高频(棋盘):[00000001]\begin{bmatrix}0\\0\\0\\0\\0\\0\\0\\1\end{bmatrix}|不好求逆
Fourier|[11111111]\begin{bmatrix}1\\1\\1\\1\\1\\1\\1\\1\end{bmatrix} [1ωω2ω3ω4ω5ω6ω7]\begin{bmatrix}1\\\omega\\\omega^2\\\omega^3\\\omega^4\\\omega^5\\\omega^6\\\omega^7\end{bmatrix}[1ω7ω14ω21ω28ω35ω42ω49]\begin{bmatrix}1\\\omega^7\\\omega^{14}\\\omega^{21}\\\omega^{28}\\\omega^{35}\\\omega^{42}\\\omega^{49}\end{bmatrix}|效果好,好求逆
简化小波|[11111111]\begin{bmatrix}1\\1\\1\\1\\1\\1\\1\\1\end{bmatrix} [11111111]\begin{bmatrix}1\\1\\1\\1\\-1\\-1\\-1\\-1\end{bmatrix} [11110000]\begin{bmatrix}1\\1\\-1\\-1\\0\\0\\0\\0\end{bmatrix} [00001111]\begin{bmatrix}0\\0\\0\\0\\1\\1\\-1\\-1\end{bmatrix} [11000000]\begin{bmatrix}1\\-1\\0\\0\\0\\0\\0\\0\end{bmatrix} [00110000]\begin{bmatrix}0\\0\\1\\-1\\0\\0\\0\\0\end{bmatrix} [00001100]\begin{bmatrix}0\\0\\0\\0\\1\\-1\\0\\0\end{bmatrix} [00000011]\begin{bmatrix}0\\0\\0\\0\\0\\0\\1\\-1\end{bmatrix}|效果好,好求逆