MIT线性代数Linear Algebra公开课笔记 第八章 求解Ax=b:可解性和解的结构(lecture 8 Solving Ax = b :Row Reduced Form R)

本章是Gilbert Strang的MIT线性代数Linear Algebra公开课中【第八章 求解Ax=bAx=b:可解性和解的结构(lecture 8 Solving Ax=bAx = b :Row Reduced Form RR)】的笔记,参考他在 MIT Linear Algebra课程网站上公开分享的 lecture summary (PDF) & Lecture video transcript (PDF)等文档,整理笔记如下,笔记中的大部分内容是从 MIT Linear Algebra课程网站上的资料中直接粘贴过来的,本人只是将该课程视频中讲述的内容整理为文字形式,前面的章节可在本人的其他博客中找到(此处戳第一章第二章第三章第四章第五章第六章第七章),后面的章节会按照视频顺序不断更新~

lecture 8 Solving Ax = b : Row Reduced Form R

When does Ax=bAx = b have solutions xx , and how can we describe those solutions?

一. 可解性(Solvability conditions on b)

1. 可解性

——可解性: bb 满足什么条件,才能让 Ax=bAx=b 有解?(solvability:condition on the right-hand side bb

——有两种描述方法:

  1. bb 必须属于 AA 的列空间(when bb is in the column space of AA , C(A)C(A) ),即 bb 必须是 AA 各列的线性组合(用列空间描述);
  2. 如果 AA 各行的线性组合得到零行,那么 bb 中元素的同样组合也必须为零。

2. 判断可解性的方法

判断可解性的方法( Ax=bAx=b 有解的条件):

  1. 法一:直接看方程组:如果方程组左侧各行的线性组合得到 00 ,那么右侧常数的相同组合必然也等于 00 .
  2. 法二:对增广矩阵(Augmented matrix)进行消元:如果矩阵 AA 的某一行已被完全消除(即变为全零行),那么右侧向量 bb 的对应位置元素应该也变为0。

Example 1: 仍以上节课中的 AA 为例:
A=[1222246836810] A=\left[\begin{array}{llll} {1} & {2} & {2} & {2} \\ {2} & {4} & {6} & {8} \\ {3} & {6} & {8} & {10} \end{array}\right]

  • 法一:对应所需求解的方程组 Ax=bAx=bb0b\not= 0 )如下:
    x1+2x2+2x3+2x4=b12x1+4x2+6x3+8x4=b23x1+6x2+8x3+10x4=b3 x_{1} + 2x_{2} + 2x_{3} + 2x_{4} = b_1 \\ 2x_{1} + 4x_{2} + 6x_{3} + 8x_{4} = b_2 \\ 3x_{1} + 6x_{2} + 8x_{3} + 10x_{4} = b_3
    显然,矩阵 AA 的行三是行二与行一的和,因此,若要方程组有解,右侧需满足 b1+b2=b3b_1+b_2=b_3

  • 法二:此方程组对应的增广矩阵如下:
    [Ab]=[1222b12468b236810b3] \left[\begin{array}{llll} A & b \end{array}\right]= \left[\begin{array}{llll} {1} & {2} & {2} & {2} & b_1\\ {2} & {4} & {6} & {8} & b_2\\ {3} & {6} & {8} & {10}& b_3 \end{array}\right]
    对增广矩阵进行消元:

[1222b12468b236810b3][1222b10024b22b10024b33b1][1222b10024b22b10000b33b1(b22b1)] \left[\begin{array}{llll} {1} & {2} & {2} & {2} & b_1\\ {2} & {4} & {6} & {8} & b_2\\ {3} & {6} & {8} & {10}& b_3 \end{array}\right] \rightarrow \left[\begin{array}{llll} {1} & {2} & {2} & {2} & b_1\\ {0} & {0} & {2} & {4} & b_2-2b_1\\ {0} & {0} & {2} & {4} & b_3-3b_1 \end{array}\right] \rightarrow \left[\begin{array}{llll} {1} & {2} & {2} & {2} & b_1\\ {0} & {0} & {2} & {4} & b_2-2b_1\\ {0} & {0} & {0} & {0} & b_3-3b_1-(b_2-2b_1) \end{array}\right]  即
[1222b10024b22b10000b3b1b2] \left[\begin{array}{llll} {1} & {2} & {2} & {2} & b_1\\ {0} & {0} & {2} & {4} & b_2-2b_1\\ {0} & {0} & {0} & {0} & b_3-b_1-b_2 \end{array}\right]

​ 现在方程三为 0=b3b1b20=b_3-b_1-b_2 ,这就是有解条件。

  • 综上,两种方法的结果一致;在本例中,只要满足 b1+b2=b3b_1+b_2=b_3 ,方程组就有解。可见当 b=[156]b=\left[\begin{array}{llll}{1} \\ {5} \\{6} \end{array}\right] 时,方程组有解。

二. 通解(Complete solution)

Ax=bAx=b 的所有解(即通解或完全解)步骤:

  1. 判断方程组是否可解(若可解继续下一步);
  2. 求方程组 Ax=bAx=b 的一个特解(particular solution): xparticular\mathbf{x}_\text{particular} ,即 xp\mathbf{x}_p
  3. 求零空间中的所有向量:矩阵 AA 的零空间中的所有向量,等效于求 Ax=0Ax=0 的所有解: xnullspace\mathbf{x}_\text{nullspace} ,即 xn\mathbf{x}_n
  4. 将特解和零空间中的所有向量相加,构成方程组的通解,即: xcomplete=xp+xn\mathbf{x}_{\text{complete}}=\mathbf{x}_p+\mathbf{x}_n

1. 特解(A particular solution)

求方程组 Ax=bAx=b 的一个特解的简单方法:将所有的自由变量设为 00 (因为自由变量的值可以任取,取 00 简单),然后求解主变量,结果即为特解。

2. 零空间 (Combined with the nullspace)

上节课讲过如何求解零空间: AA 的零空间由其special solutions的所有的线性组合构成( Ax=0Ax=0 的所有解),(令自由变量中有一个是 11 ,其他自由变量取 00 ,然后带回求主变量);

3. 通解(Complete solution)

将特解 xp\mathbf{x}_p 与零空间中的向量 xn\mathbf{x}_n 相加,即得到方程组 Ax=bAx=b 的所有解(即通解或完全解):
xcomplete=xparticular+xnullspace=xp+xn \mathbf{x}_{\text{complete}}=\mathbf{x}_\text{particular} + \mathbf{x}_\text{nullspace}=\mathbf{x}_p+\mathbf{x}_n
其中, xp\mathbf{x}_{p} 是特解, xn\mathbf{x}_{n} 是整个零空间,特解加上零空间中的向量即为方程组 Ax=bAx=b 的所有解,这是因为: Axp=bA \mathbf{x}_{p}=\mathbf{b}Axn=0A \mathbf{x}_{n}=0 ,可得 A(xp+xn)=bA\left(\mathbf{x}_{p}+\mathbf{x}_{n}\right)=\mathbf{b} ;即对于方程组某解,将其与零空间内任意向量相加仍为方程组的解,因为零空间内的向量得到的右侧向量为 00 ,故此时右侧 bb 不会发生变化,这样就得到方程组的所有解了。

Example 2:

仍继续Example 1中的矩阵 AAb=[156]b=\left[\begin{array}{llll}{1} \\ {5} \\{6} \end{array}\right] ,那么 Ax=bAx=b 的所有解是什么?

  1. 看是否满足有解条件(保证方程组有解):

    法一:在Example 1中已经求过其有解条件: b1+b2=b3b_1+b_2=b_3 ,此时 b=[156]b=\left[\begin{array}{llll}{1} \\ {5} \\{6} \end{array}\right] ,可见该 bb 满足有解条件,方程组有解;

    法二:将 b=[156]b=\left[\begin{array}{llll}{1} \\ {5} \\{6} \end{array}\right] 代入,则增广矩阵消元的最终形式如下:
    [122210024300000] \left[\begin{array}{llll} {1} & {2} & {2} & {2} & 1\\ {0} & {0} & {2} & {4} & 3\\ {0} & {0} & {0} & {0} & 0 \end{array}\right]
    即最后一个方程成立,满足有解条件。

    注:此时只有两个方程,但是未知数有四个,故理论上应该是有一堆解,而不是一个解;

  2. 求一个特解 xparticular\mathbf{x}_\text{particular} :将所有自由变量设为 00 ,然后解出 Ax=bAx=b 中的主变量。

    本例中,令自由变量 x2=0x4=0x_2=0,x_4=0 ,此时方程组只剩下主列,方程组的具体形式如下:
    x1+2x3=12x3=3 x_{1} + 2x_{3} = 1 \\ 2x_{3} = 3
    回代求解: x3=32x1=2x_3=\frac{3}{2},x_1=-2 ,即一个特解为 xp=[203/20]\mathbf{x}_{p}=\left[\begin{array}{r}{-2} \\ {0} \\ {3 / 2} \\ {0}\end{array}\right] ,然后可以代回最初的原方程组进行检验。

  3. 零空间: Ax=0Ax=0 的special solutions,即基础解系;自由变量中有一个是 11 ,其他自由变量取 00 ,然后带回求主变量;

    上节课已经讲过,本例中的零空间中有两个特解(因为有两个自由变量): [2100]\left[\begin{array}{r}{-2} \\ {1} \\ {0} \\ {0}\end{array}\right][2021]\left[\begin{array}{r}{2} \\ {0} \\ {-2} \\ {1}\end{array}\right] ,则 xn=c1[2100]+c2[2021]\mathbf{x}_n=c_1 \left[\begin{array}{r}{-2} \\ {1} \\ {0} \\ {0}\end{array}\right]+c_2 \left[\begin{array}{r}{2} \\ {0} \\ {-2} \\ {1}\end{array}\right]AA 的零空间( Ax=0Ax=0 的所有special solutions的线性组合);

  4. 综上,完全解即通解为: xcomplete =xp+xn=[203/20]+c1[2100]+c2[2021]\mathbf{x}_{\text {complete }}=\mathbf{x}_p+\mathbf{x}_n=\left[\begin{array}{r}{-2} \\ {0} \\ {3 / 2} \\ {0}\end{array}\right]+c_1 \left[\begin{array}{r}{-2} \\ {1} \\ {0} \\ {0}\end{array}\right]+c_2 \left[\begin{array}{r}{2} \\ {0} \\ {-2} \\ {1}\end{array}\right]

    可见,此时 AA 的零空间是 R4\mathcal{R}^4 中的两维子空间,并且 Ax=0Ax=0 的解构成了一个通过 xpx_p 且与之平行的平面。

    注:特解不能乘以倍数,因为它要保证右侧等于 bb .

4. 几何图形

将所有的解都画出来(plot all solutions xx in R4\mathcal{R}^4 ):四维图像

—— Ax=bAx=b 的解是子空间吗?

——不是(因为它不包含零)

xn=c1[2100]+c2[2021]\mathbf{x}_n=c_1 \left[\begin{array}{r}{-2} \\ {1} \\ {0} \\ {0}\end{array}\right]+c_2 \left[\begin{array}{r}{2} \\ {0} \\ {-2} \\ {1}\end{array}\right] 是子空间,这是 R4\mathcal{R}^4 中的二维子空间(有两个参数),是个二维平面(维数表示可以任意选取的自由独立的数字的个数);该二维平面不穿过原点,而是过点 [203/20]\left[\begin{array}{r}{-2} \\ {0} \\ {3 / 2} \\ {0}\end{array}\right] ,即特解 xp\mathbf{x}_{p} ,构成通解 xcomplete \mathbf{x}_{\text {complete }}

MIT线性代数Linear Algebra公开课笔记 第八章 求解Ax=b:可解性和解的结构(lecture 8 Solving Ax = b :Row Reduced Form R)

三. 秩(Rank)

考虑一个秩为 rrm×nm×n 的矩阵 AArnrmr\leq n,r \leq m

秩 = 矩阵的主元的个数;

矩阵 AAmm 行,主元不可能超过 mm 个(最多 mm 个),故 rmr \leq m ;又因为矩阵 AAnn 列,每一列的主元不会超过 11 个,总主元数不超过 nn 个,故 rnr\leq n

满秩: rr 取最大时的情况,存在两种情况:分别对应于 mm 值和 nn 值,先讨论列满秩:

1. 列满秩(Full column rank): r=nr=n

——列满秩( r=nr=n )时,零空间是什么样的?

—— r=nr=n 意味着每一列都有主元,即主变量有 nn 个(一共就 nn 个变量),此时所有列都含有主元,没有自由变量,故零空间的维数为: nr=0n-r=0 维,即零空间内只有零向量: N(A)=zero vectorN(A)= \text{zero vector};综上,列满秩时不需要求零空间;

——列满秩( r=nr=n )对于方程组的解意味着什么?通解是什么样的?

——此时如果方程组有解,那么只有唯一解 xpx_p ,也就是 Ax=bAx=b 的全部解为: x=xpx=x_p ,因为此时没有自由变量可以进行赋值,故只有特解 xpx_p 这一个解,没有别的解,称其为唯一解;(只有 bb 刚好是左侧列向量的线性组合时,才有解;即对于 Rm\mathcal{R}^m 中的任意向量 bb ,只要它不是 AA 的各列的线性组合,方程组 Ax=bAx=b 就无解)。综上,列满秩时,只有 00 个或者 11 个解。(此时 r=n<mr=n<m )。另外,已知 rmr \leq m ,又 r=nr=n , 故矩阵的列数 \leq 行数,此时矩阵的行最简形式一般为: R=[I0]R=\left[\begin{array}{llll} {I} \\ {0} \end{array}\right] .

在实际应用中,这种各列线性无关的情况很常见。

Example 3:
A=[13216151] A=\left[\begin{array}{llll} {1} & {3} \\ {2} & {1} \\ {6} & {1} \\ {5} & {1} \end{array}\right]
矩阵 AA 的秩为 22,两个列向量的方向不同,其简化行阶梯形式 RR 如下:
R=[10010000] R=\left[\begin{array}{llll} {1} & {0} \\ {0} & {1} \\ {0} & {0} \\ {0} & {0} \end{array}\right]
该矩阵只有两个无关的行,即前两行线性无关(不共线),其他行均是这两行的线性组合。

——此时 Ax=bAx=b 是否总有解?

——不是总有解。只有 bb 选择的刚好是左侧列向量的线性组合时,才有解;矩阵 AA 是列满秩,其两列给出两个主元,其零空间中只有 00 ,因为列之间的线性组合无法产生零列(零零组合不算);这里有四个方程两个未知数。如果恰好 b=[4376]b=\left[\begin{array}{llll} {4}\\{3} \\{7} \\{6} \end{array}\right] ,即 bb 是左侧两列的和,那么特解为 xp=[11]\mathbf{x}_{p}=\left[\begin{array}{r}{1}\\{1} \end{array}\right] ,这是方程组的唯一解。

2. 行满秩(Full row rank): r=mr=m

行满秩时,消元后,每一行都有主元,共有 mm 个主元,没有零行,故有 r=mr = m 个主变量;由于一共就 nn 个变量,故有 nr=nmn-r=n-m 个自由变量。( r=m<nr=m < n

——右侧向量 bb 取什么时, Ax=bAx=b 有解?

——行满秩,消元时不会出现零行,因此对 bb 没有要求,即对于任意 bbAx=bAx=b 都有解,故必然有解。综上,行满秩时,方程组 Ax=bAx=b 总有解,另外由于有 nmn-m 个自由变量,因此方程组 Ax=0Ax=0nmn-m 个special solutions。此时 r=mnr=m \leq n ,行数 \leq 列数,则其行最简形式一般为 R=[IF]R=\left[\begin{array}{llll}I & F\end{array}\right]

Example 4: (将Example 2 中的例子转置一下)
A=[12653111] A=\left[\begin{array}{llll} {1} & {2} & {6} & {5} \\ {3} & {1} & {1} & {1} \end{array}\right]
此时矩阵的秩为 22 ,有两个主元,其行最简如下:
R=[1001]=[IF] R=\left[\begin{array}{llll} {1} & {0} & {-} & {-} \\ {0} & {1} & {-} & {-} \end{array}\right]=\left[\begin{array}{llll} I & F \end{array}\right]
注意: FF 处有值,该部分将构成零空间的special solution;即 RR 中的各主列构成单位阵, RR 中没有零行,因此秩是2;

3. 行列均满秩(Full row and column rank): r=m=nr=m=n

Example 5:
A=[1231] A=\left[\begin{array}{llll} {1} & {2} \\ {3} & {1} \end{array}\right]
行列均满秩的矩阵一定是方阵,即称为满秩,无需说明是列或者行满秩,因为行等于列,是一回事,此时秩已经达到最大了, r=m=nr=m=n ,即行列均满秩的矩阵 AA 为可逆方阵,其行最简形式 RR 是单位阵:
R=[1001]=I R=\left[\begin{array}{llll} {1} & {0} \\ {0} & {1} \end{array}\right]=I
该矩阵的零空间的维数是 00 ,即零空间中只有零向量,同时,方程组 Ax=bAx=b 一定有解,且是唯一解;因为 r=mr=m 时,总有解,而 r=nr=n 时,解唯一。

4. 总结(Summary)

MIT线性代数Linear Algebra公开课笔记 第八章 求解Ax=b:可解性和解的结构(lecture 8 Solving Ax = b :Row Reduced Form R)

注意:第三种情况中的行最简形式 RR 不一定就是:前面全是主列、后面全是自由列的形式,即行最简形式不一定就是 [IF]\left[\begin{array}{llll}I & F\end{array}\right] 形式,也有可能主列和自由列穿插着,即 IIFF 混在一起的。

矩阵的秩决定了方程组解的个数,秩 rr 包含了所有信息(除了具体的计算结果)。