1.9 线性变换的矩阵(第1章 线性代数中的线性方程组)

内容概述

本节首先指出了线性变换和矩阵变换的等价性,并介绍了用矩阵来描述线性变换的方法;接着,举了几个二维空间线性变换的几何特性;最后,从线性变换的角度讨论了解的存在性和唯一性问题,并和之前的概念进行了关联。

Rn\mathbb R^nRm\mathbb R^m的线性变换和矩阵变换的关系

下面的讨论指出,

  • Rn\mathbb R^nRm\mathbb R^m的每一个线性变换实际上都是一个矩阵变换xAx\boldsymbol x \rightarrow A\boldsymbol x
  • 变换T\boldsymbol T的重要性质都归结为A\boldsymbol A的性质。
  • 寻找矩阵AA的关键是了解T\boldsymbol T完全由它对n×nn \times n单位矩阵InI_n的各列的作用所决定。
    例:

In=[1001]I_n = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}的两列是e1=[10]\boldsymbol e_1 = \begin{bmatrix}1 \\ 0\end{bmatrix}e1=[01]\boldsymbol e_1 = \begin{bmatrix}0 \\ 1\end{bmatrix},设T\boldsymbol TR2\mathbb R^2R3\mathbb R^3的线性变换,满足:
T(e1)=[572],T(e2)=[380] \boldsymbol T(\boldsymbol e_1) = \begin{bmatrix}5 \\ 7 \\ -2\end{bmatrix}, \boldsymbol T(\boldsymbol e_2) = \begin{bmatrix}-3 \\ 8 \\ 0\end{bmatrix}
在此条件下求出R2\mathbb R^2中任意向量x\boldsymbol x的像的公式。

解:

对于R2\mathbb R^2中的任意向量x\boldsymbol x,有:
x=[x1x2]=x1[10]+x2[01]=x1e1+x2e2 \boldsymbol x = \begin{bmatrix}x_1 \\ x_2\end{bmatrix} = x_1\begin{bmatrix}1 \\ 0\end{bmatrix} + x_2\begin{bmatrix}0 \\1\end{bmatrix} = x_1\boldsymbol e_1 + x_2\boldsymbol e_2
因为T\boldsymbol T是线性变换,所以有:
T(x)=x1T(e1)+x2T(e2)=x1[572]+x2[380]=[5x13x27x1+8x22x1+0] \boldsymbol T(\boldsymbol x)=x_1\boldsymbol T(\boldsymbol e_1)+x_2\boldsymbol T(e_2)=x_1\begin{bmatrix}5 \\ 7 \\-2\end{bmatrix} + x_2\begin{bmatrix}-3 \\ 8 \\0\end{bmatrix} = \begin{bmatrix}5x_1-3x_2 \\ 7x_1+8x_2 \\-2x_1 + 0\end{bmatrix}
如果把上述T(e1)\boldsymbol T(\boldsymbol e_1)T(e2)\boldsymbol T(\boldsymbol e_2)作为矩阵的列,把上式写成向量相乘的形式,那么可以得到下面的公式:
T(x)=[T(e1)T(e2)][x1x2]=Ax \boldsymbol T(\boldsymbol x) = [\boldsymbol T(\boldsymbol e_1)\quad \boldsymbol T(\boldsymbol e_2)]\begin{bmatrix}x_1 \\ x_2\end{bmatrix} = A\boldsymbol x
上面举的例子是一个感性认识,下面是定理和证明:
定理:
T:RnRm\boldsymbol T:\mathbb R^n \rightarrow \mathbb R^m为线性变换,则存在唯一的矩阵AA,使得对Rn\mathbb R^n中一切x\boldsymbol x
T(x)=Ax\boldsymbol T(\boldsymbol x) = A\boldsymbol x
事实上,AAm×nm \times n矩阵,它的第jj列是向量T(ej)\boldsymbol T(\boldsymbol e_j),其中ej\boldsymbol e_jRn\mathbb R^n中单位矩阵In\boldsymbol I_n的第jj列:
A=[T(e1)T(en)]A = [\boldsymbol T(\boldsymbol e_1)\quad \cdots \quad \boldsymbol T(\boldsymbol e_n)]

证明:

x=Inx=[e1en]x=x1e1++xnen\boldsymbol x = \boldsymbol I_n\boldsymbol x = [\boldsymbol e_1 \quad \cdots \quad \boldsymbol e_n]\boldsymbol x = x_1\boldsymbol e_1 + \cdots +x_n\boldsymbol e_n,由于T\boldsymbol T是线性变换,知:
T(x)=T(x1e1++xnen)=x1T(e1)++xnT(en)=[T(e1)T(en)][x1...xn]=Ax \boldsymbol T(\boldsymbol x)=\boldsymbol T(x_1\boldsymbol e_1 + \cdots + x_n\boldsymbol e_n) = x_1\boldsymbol T(\boldsymbol e_1) + \cdots + x_n\boldsymbol T(\boldsymbol e_n) = [\boldsymbol T(\boldsymbol e_1) \quad \cdots \quad \boldsymbol T(\boldsymbol e_n)]\begin{bmatrix}x_1 \\ ...\\ x_n\end{bmatrix} = A\boldsymbol x
矩阵AA称为线性变换T\boldsymbol T的标准矩阵。
上述讨论表明了:由Rn\mathbb R^nRm\mathbb R^m的每个线性变换都可看作矩阵变换,反之亦然。并且:

  • 线性变换强调映射的性质
  • 矩阵变换描述该映射的具体实现

例:

T:R2R2\boldsymbol T: \mathbb R^2 \rightarrow \mathbb R^2为把R2\mathbb R^2中每一个点绕原点逆时针旋转正角度φ\varphi的变换。求出这个变换的标准矩阵。

解:

[10]\begin{bmatrix}1 \\ 0 \end{bmatrix}变换为[cosφsinφ]\begin{bmatrix}\cos \varphi \\ \sin \varphi \end{bmatrix}[01]\begin{bmatrix}0 \\ 1\end{bmatrix}变换为[sinφcosφ]\begin{bmatrix}-\sin \varphi \\ \cos \varphi \end{bmatrix},由上述定理可知:
A=[cosφsinφsinφcosφ]A = \begin{bmatrix}\cos \varphi & -\sin \varphi \\ \sin \varphi & \cos \varphi \end{bmatrix}
1.9 线性变换的矩阵(第1章 线性代数中的线性方程组)

R2R2\mathbb R^2 \rightarrow \mathbb R^2线性变换的几何变换举例

下图表示了几种R2R2\mathbb R^2 \rightarrow \mathbb R^2线性变换的几何图像表现。因为这些变换都是线性的,故它们完全由变换对I2\boldsymbol I_2的作用决定。
1.9 线性变换的矩阵(第1章 线性代数中的线性方程组)
1.9 线性变换的矩阵(第1章 线性代数中的线性方程组)

存在与唯一性问题

这里从线性变换的角度来思考存在性与唯一性的问题。
首先引入两个定义:
定义1:

映射T:RnRm\boldsymbol T: \mathbb R^n \rightarrow R^m称为到RmR^m上的映射,若RmR^m中每个b\boldsymbol bRn\mathbb R^n中至少一个x\boldsymbol x的像(也称为满射)。

定义2:

映射T:RnRm\boldsymbol T: \mathbb R^n \rightarrow R^m称为一对一映射(或1:1),若Rm\mathbb R^m中每个b\boldsymbol bRn\mathbb R^n中至多一个x\boldsymbol x的像(也称为单射)。

定义1描述的是存在性问题,也可以等价于下面的语句:

  • T\boldsymbol T的值域是整个余定义域Rm\mathbb R^m时,T\boldsymbol T是到Rm\mathbb R^m上的。
  • Rm\mathbb R^m中每个b\boldsymbol b,方程T(x)=b\boldsymbol T(x) = \boldsymbol b至少有一个解,也就是说,方程T(x)=b\boldsymbol T(x) = \boldsymbol b是相容的。

对应的,如果Rm\mathbb R^m中有某个b\boldsymbol b,使得方程T(x)=b\boldsymbol T(\boldsymbol x) = \boldsymbol b无解,那么映射T\boldsymbol T不是到Rm\mathbb R^m上的。
1.9 线性变换的矩阵(第1章 线性代数中的线性方程组)
定义2描述的是唯一性问题。对于Rm\mathbb R^m中每个b\boldsymbol b,对应于如下两种情况:

  • 方程T(x)=b\boldsymbol T(x) = \boldsymbol b有唯一的解
  • 方程T(x)=b\boldsymbol T(x) = \boldsymbol b无解
    1.9 线性变换的矩阵(第1章 线性代数中的线性方程组)

例:

T\boldsymbol T是线性变换,它的标准矩阵为:
[148102130005]\begin{bmatrix}1 & -4 & 8 & 1 \\ 0 & 2 & -1 & 3 \\0 & 0 & 0 & 5\end{bmatrix}
T\boldsymbol T是否把R4\mathbb R^4映上到R3\mathbb R^3T\boldsymbol T是否是一对一映射?

解:

  1. 由于上述矩阵是阶梯形矩阵,且每一行均有主元位置,因此,对于R3\mathbb R^3中的每个b\boldsymbol b,方程Ax=bA\boldsymbol x = \boldsymbol b是相容的。因此,T\boldsymbol TR4\mathbb R^4映射到R3\mathbb R^3上。
  2. 因为Ax=bA\boldsymbol x = \boldsymbol b含有自由变量(4列有四个变量,但只有3行,每一行一个主元,所以只有3个基本变量),所以每个b\boldsymbol b都有多个x\boldsymbol x的像,所以T\boldsymbol T不是一对一的。

下面的定理很重要,把线性无关的和线性变换的概念联系了起来。
定理:

T:RnRm\boldsymbol T: \mathbb R^n \rightarrow \mathbb R^m为线性变换,则T\boldsymbol T是一对一的当且仅当方程Ax=0A\boldsymbol x = \boldsymbol 0仅有平凡解。

证明:

  1. T\boldsymbol T是一对一的。又因T\boldsymbol T是线性的,故T(0)=0\boldsymbol T(\boldsymbol 0) = \boldsymbol 0,所以方程T(x)=0\boldsymbol T(\boldsymbol x) = \boldsymbol 0仅有一个解,这个解就是平凡解0\boldsymbol 0
  2. T\boldsymbol T不是一对一的。则Rm\mathbb R^m中某个b\boldsymbol bRn\mathbb R^n中至少两个相异向量的像(假设这两个向量分别是u\boldsymbol uv\boldsymbol v),因此有T(u)=b\boldsymbol T(\boldsymbol u) = \boldsymbol bT(v)=b\boldsymbol T(\boldsymbol v) = \boldsymbol b。又因为T\boldsymbol T是线性的,所以有:T(uv)=T(u)T(v)=bb=0\boldsymbol T(\boldsymbol u-\boldsymbol v)=\boldsymbol T(\boldsymbol u) - \boldsymbol T(\boldsymbol v) = \boldsymbol b -\boldsymbol b =\boldsymbol 0
    由于uv\boldsymbol u \neq \boldsymbol v,所以向量uv\boldsymbol u - \boldsymbol v不是零向量,又因为T(0)=0\boldsymbol T(\boldsymbol 0) = \boldsymbol 0,所以方程T(x)=0\boldsymbol T(x) = \boldsymbol 0有多于一个解

综上,定理中的两个条件同时成立或同时不成立,因此该定理得证。

根据上述定理,结合以前学到的内容,又可以归纳出下述定理:
定理:

T:RnRm\boldsymbol T: \mathbb R^n \rightarrow \mathbb R^m是线性变换,设AAT\boldsymbol T的标准矩阵,则:

  1. T\boldsymbol TRn\mathbb R^n映上到Rm\mathbb R^m,当且仅当AA的各列生成Rm\mathbb R^m
  2. T\boldsymbol T是一对一的,当且仅当AA的各列线性无关