Norms for Vectors and Matrices

矩阵和向量的范式(Norms for Vectors and Matrices)

1 内积和范式的定义(Definitions of norms and inner product)

向量范式的定义(vector norm)

定义 1.1.VV 是定义在场 F\mathbf{F}(F=R\mathbf{F} = \mathbf{R} 或者 C\mathbf{C},即实数域或者是复数域)上的向量空间。 如果对于任意的x,yVx, y \in VcFc\in \mathbf{F}都满足下面几个条件,则称函数 :VR\|\cdot\|:V\to \mathbf{R} 是一个范式 (有时被称为向量范式vector norm)。
(1)x0 Nonnegativity(非负)(1a)x=0 if and only if x=0Positivity(永正)(2)cx=cxHomogeneity(同质)(3)x+yx+yTriangle Inequality(三角不等) \begin{aligned} &\text{(1)} \quad \|x\| \ge 0\ \qquad &\text{Nonnegativity(非负)}\\ &\text{(1a)} \quad \|x\| = 0 \text{ if and only if }x=0 \qquad &\text{Positivity(永正)}\\ &\text{(2)} \quad \| cx \| = |c| \|x\| \qquad &\text{Homogeneity(同质)} \\ &\text{(3)} \quad \| x+y \| \le \|x\| + \|y\| \qquad &\text{Triangle Inequality(三角不等)} \\ \end{aligned}

Positivity(1a)和Homogeneity(2)保证了对于任意非零向量xx,可以正则化到单位向量 u=xxu=\frac{x}{\|x\|}

只满足(1),(2),(3)而不满足(1a)的范式称为半范式(seminorm),(1a)保证了只有零向量的范式才是0,非零向量的范式都大于0,而一个非零向量的半范式可以是0。

引理 1.2. \|\cdot\|是定义在实数域或者复数域向量空间 VV 上的半范式, 则对于任意 x,yVx, y\in V,有 $ | |x| − |y|| \le |x − y|$

Proof. 也就是证明±(xy)xy\pm (\|x\| − \|y\|) \le \|x − y\|
x=xy+yxy+yxyxyy=yx+xyx+x=xy+xxyyx \|x\| =\|x-y+y\| \le \|x-y\|+\|y\| \\ \Rightarrow \|x-y\| \ge \|x\| - \|y\| \\ \|y\| =\|y-x+x\| \le \|y-x\|+\|x\| = \|x-y\|+\|x\|\\ \Rightarrow \|x-y\| \ge \|y\| - \|x\| \\

内积定义(inner product)

定义 1.3.VV 是定义在场 F\mathbf{F}(F=R\mathbf{F} = \mathbf{R} or C\mathbf{C})上的向量空间。 如果对于任意 x,y,zVx, y, z \in VcFc\in \mathbf{F},函数 <,>:V×VF\left< \cdot ,\cdot \right>:V\times V\to \mathbf{F} 满足下列条件,则它是一个内积(inner product)
$$
\begin{aligned}
&\text{(1)} \left< x,x \right> \ge 0\ \qquad &\text{Nonnegativity(非负)}\
&\text{(1a)} \left< x,x \right> = 0 \text{ if and only if }x=0 \qquad &\text{Positivity(永正)}\
&\text{(2)} \left< x+y,z \right> = \left< x,z \right>+\left< y,z \right> \qquad &\text{Additivity(加法)} \
&\text{(3)} \left< cx,y \right> = c\left< x,y \right> \qquad &\text{Homogeneity(同质)} \
&\text{(4)} \left< x,y \right> = \overline{\left< y,x \right>} \qquad &\text{Hermitian Property(共轭对称性)} \

\end{aligned}
$$
只满足(1), (2), (3), (4)而不满足(1a)的称为semi-inner product。

柯西施瓦茨不等式

定理 1.4(Cauchy-Shwarz inequality). <,>\left< \cdot ,\cdot \right>是定义在向量空间VV 上的内积,则对于任意x,yVx,y\in V
<x,y>2<x,x><y,y> {\left |\left< x ,y \right> \right|}^2 \le \left< x ,x \right>\left< y ,y \right> \quad
当且仅当(if and only if) x 和 y 线性相关(linearly dependent),不等式取等号。

标量形式表示为(i=1nxiyi)2(i=1nxi2)(i=1nyi2)(\sum_{i=1}^{n}x_iy_i)^2 \le (\sum_{i=1}^{n}x_i^2 )(\sum_{i=1}^{n}y_i^2)

Proof.x,yVx,y\in V,若x=y=0x=y=0,则不等式显然成立,所以假设其中一个是非零向量,不失一般性,假设y0y\ne 0,令v=<y,y>x<x,y>yv=\left< y ,y \right>x - \left< x ,y \right>y,有:
0<v,v>=<<y,y>x<x,y>y,<y,y>x<x,y>y>=<y,y>2<x,x><y,y><x,y><x,y><x,y><y,x><y,y>+<y,y><x,y><x,y>=<y,y>2<x,x><y,y><x,y>2=<y,y>(<x,x><y,y><x,y>2) 0\le \left< v,v \right>=\left< \left< y ,y \right>x - \left< x ,y \right>y ,\left< y ,y \right>x - \left< x ,y \right>y \right> \\ =\left< y ,y \right>^2 \left< x,x \right> -\left< y,y \right>\overline{ \left< x,y \right>}\left< x,y \right>-\left< x,y \right>\left< y,x \right> \left< y,y \right> + \left< y,y \right>\overline{ \left< x,y \right>}\left< x,y \right> \\ =\left< y ,y \right>^2\left< x,x \right> - \left< y ,y \right> {\left |\left< x,y \right> \right|}^2 \\ =\left< y ,y \right>(\left< x,x \right>\left< y ,y \right>-{\left |\left< x,y \right> \right|}^2)
因为y0y\ne 0,即<y,y>>0\left< y ,y \right> > 0,则推出<x,x><y,y><x,y>20\left< x,x \right>\left< y ,y \right>-{\left |\left< x,y \right> \right|}^2 \ge 0,只有当v=0v=0的时候,等式成立,即v=<y,y>x<x,y>y=0v=\left< y ,y \right>x - \left< x ,y \right>y=0,也就是说xxyy线性依赖。

推论 1.5. 如果 <,>\left< \cdot ,\cdot \right> 是定义在实数或者复数域向量空间 VV 上的内积,则函数 :V[0,)\|\cdot\|:V\to [0,\infty)x=<x,x>1/2\|x\|= \left< x,x \right>^{1/2} 是向量空间 VV 上的一个范式。这样的范式(norm)被称为从内积获得(derived from an inner product)。


2 向量的范式

l1-morml_1\text{-morm}

Cn\mathbf{C}^n上的和范式(sum norm),也叫l1-范式(l1-norm),定义如下:
x1=x1++xn \|x\|_1=|x_1|+\cdots+|x_n|
通常也被称为曼哈顿范式(Manhattan norm)。

l2-morml_2\text{-morm}

一个向量x=[x1,...,xn]TCnx=[x_1,...,x_n]^T\in \mathbf{C}^n的欧几里得范式(Euclidean norm),也叫l2范式(l2-norm),定义如下:
x2=(x12++xn2)1/2 \|x\|_2=(|x_1|^2+\cdots+|x_n|^2)^{1/2}
经常使用xy2\|x-y\|_2来衡量两个点x,yCnx,y\in \mathbf{C}^n的欧几里得距离(Euclidean distance)。

l-morml_\infty\text{-morm}

Cn\mathbf{C}^n上的max norm(ll_\infty-norm)为:
x=max{x1,,xn} \|x\|_\infty= \max \{|x_1|,\cdots,|x_n| \}
一般的,Cn\mathbf{C}^n上的lpl_p-norm定义为:
xp=(x1p++xnp)1/p,p1 \|x\|_p=(|x_1|^p+\cdots+|x_n|^p)^{1/p},\quad p\ge 1

以二维向量v=(v1,v2)\mathbf{v}=(v_1, v_2)举例,范式的值恰好为1的图像如下,其中横轴代表v1v_1,纵轴代表v2v_2

l1范式,即v1=v1+v2=1\|v\|_1=|v_1|+|v_2|=1

Norms for Vectors and Matrices

l2范式,即v2=v12+v22=1\|v\|_2=\sqrt{|v_1|^2+|v_2|^2}=1

Norms for Vectors and Matrices

Infinity范式,即v=max{v1,v2}=1\|v\|_\infty= \max \{|v_1|,|v_2| \}=1

Norms for Vectors and Matrices

Cn\mathbf{C}^n上的k-norms,融合max norm和sum norm,即选k个最大的:
x[k]=xi1,,xik,in which xi1xik \|x\|_{[k]}= |x_{i_1}|,\cdots,|x_{i_k}| ,\text{in which }|x_{i_1}|\ge \cdots \ge |x_{i_k}|

Let SMm,nS\in M_{m,n} have full column rank, so mnm\ge n .Let \|\cdot\| be a given norm on CmC^m and define
xS=Sx \|x\|_S=\|Sx\|
for xCnx\in C^n.Then S\|\cdot \|_S is a norm on CnC^n.

Consider the complex vector space V=Mm,nV = M_{m,n} with the Frobenius inner product:
A,BF=trBA ⟨A,B⟩_F =tr B^* A

The norm derived from the Frobenius inner product is the l2-norm(Frobenius norm) on Mm,n:A2=(trAA)1/2M_{m,n}:\|A\|_2 = (tr A^* A)^{1/2}


6 Matrix norms

矩阵范式(matrix norm)定义如下:

A function | \| \cdot \| | : MnRM_n \to R is a matrix norm if, for all A,BMnA, B \in M_n, it satisfies the following five axioms:
(1)A0(1a)A=0 if and only if A=0(2)cA=cA for all cC(3)A+BA+B(4)ABAB \begin{aligned} &(1)\quad | \| A \| | \ge 0 \\ &(1a)\quad | \| A \| | = 0 \text{ if and only if } A = 0 \\ &(2) \quad| \| cA \| | = |c| | \| A \| | \text{ for all } c \in C \\ &(3)\quad | \| A+B \| | \le | \| A \| | + | \| B \| | \\ &(4)\quad | \| AB \| | \le | \| A \| | | \| B \| | \\ \end{aligned}

matrix norm有时被称为ring norm, 可以看出前四个属性的定义和norm的一样,矩阵范式多了(4)。如果只满足前四个而不满足(4),则称之为vector norm on matrices, 有时也称为generalized matrix norm。

由性质(4),A2AAA2\quad | \| A^2 \| | \le | \| A \| | | \| A \| | \le | \| A \| |^2,若A2=AA^2 = A,则有A1| \| A \| |\ge 1。所以可推出I1| \| I \| | \ge 1,若A是非奇异矩阵(non-singular),有I=A1AI=A^{-1}A,$\quad | | I| | \le | | A^{-1} | | \cdot | | A | | ,可以获得一个下界,| | A^{-1} | | \ge \frac{| | I| |}{| | A | |}$ ,

l1l_1-norm

对于矩阵AMnA\in M_n,它的l1l_1-norm定义为,
A1=i,j=1naij \| A \|_1= \sum_{i,j=1}^{n} |a_{ij}|

l2l_2-norm (Frobenius norm, Schur norm, or Hilbert–Schmidt norm)

A2=trAA1/2=(i,j=1naij2)1/2 \| A \|_2= | tr AA^{*} |^{1/2} =\left ( \sum_{i,j=1}^{n} |a_{ij}|^2 \right )^{1/2}


7 Vector norms on matrices