个人对傅里叶分析的理解与整理(持续整理中)
一、线性空间
要搞懂傅里叶变换到底从何而来,必须要从线性空间开始。
线性代数中一个非常重要的概念就是空间,所谓空间其实就是将遵循一定规则的元素放在一块所形成的集合,比如研究的对象是二维的向量即满足维度为二这个规则,那么所有的这些向量所构成的集合就是二维向量空间,再加上各种规则又能扩展出许多各异的空间。在“线性”代数中最基本的就是线性向量空间,线性向量空间就是研究的对象(集合中的元素)定义了加法和乘法,且加乘满足8条规则的集合,这8条规则是线性空间理论得以延伸到傅里叶变换的原因,因为这些规则高度抽象的描述了线性的结构,抽象带来的好处就是普适,使得这些概念得以扩展到满足这些规则的所以对象中去。这8条规则是:
对于集合V和域P,α和β是集合V中的元素、k和l都是域P中的元素(域是实数域、复数域等的抽象),有
① α+β=β+α,对任意α,β∈V
② α+(β+γ)=(α+β)+γ,对任意α,β,γ∈V
③ 存在一个元素0∈V,对一切α∈V有α+0=α,元素0称为V的零元
④ 对任一α∈V,都存在β∈V使α+β=0,β称为α的负元素,记为-α
⑤ 对P中单位元1,有 1α=α(α∈V)
⑥ 对任意k,l∈P,α∈V有 (kl)α=k(lα)
⑦ 对任意k,l∈P,α∈V有 (k+l)α=kα+lα
⑧ 对任意k∈P,α,β∈V有 k(α+β)=kα+kβ
如果想要“分析”某个东西只有线性当然是不够的,要把一个东西分解就必然要有基的概念,而作为基一定要有一个可以度量的长度 (实际上是测度) 的概念,这样其余的东西才能用这个基的倍数来表示。有长度的概念还不够,还要加上角度的概念,有了角度的概念空间才得以扩张,向量才得以描述,两个向量必须要错开0度以上的角度才能形成二维空间。而内积同时包含了角度和长度的概念,进一步定义了内积的线性空间就是欧几里得空间。
n维的欧几里得空间是以n维向量作为元素的,对于其中的两个向量 和
其内积定义为 :
也可以写为:
为两个向量的夹角。一个向量与自身的内积再开方就是这个向量的长度。
内积的定义不是唯一的,只要满足Schwarz不等式: (夹角余弦值小于1) 与三角不等式:
(两边之和大于第三边)的运算规则都能作为内积,这两点是从夹角和长度中抽象出来的最基本的规则。
有了内积的概念,坐标系就形成了,一组线性无关的向量,即相互之间夹角都不为零的向量就可以撑起一片空间,这些线性无关的向量就是这个空间的坐标系,也可以称为基。空间有多少维,基最多就有多少个,即n维空间的基可以由n个线性无关的向量表示,而向量可以表示为一个数组,这个数组其实是在一组长度为一个单位(乘法4条中的1元律的1)的正交基即标准正交基下表示的,n个数组写在一块就是一个矩阵,即n维空间的基可以用n×n阶的矩阵来描述。在这些基中比较特殊的就是正交基,正交基是基向量之间的内积互相为0的一组基,这样的基向量互相没有瓜葛,用正交基来表示向量就不会有冗余成分。要想获得一组正交基可以利用shimidt正交化,shimidt正交化通过不断减投影逐步消去线性无关向量组的冗余,得到正交基。除了内积,空间中还要有变换的概念,变换可以看作是一种运动,因此元素在空间中还要能够运动,运动如何实现呢?我们知道基可以写成矩阵,而向量与某一个基进行内积运算可以得到这个向量在这个基上的投影,也就是把向量变换成了在这个基上表示的形式。假设我们有一个列向量组 ,写成矩阵形式,则这个向量组可以看成是在之前提到过的标准正交基下表示的:
阶单位阵
就是是标准正交基。怎么让
运动呢?让向量在坐标
下运动,可以通过为向量
偷换一组基来实现,这个过程是这样的:将改变后的基在
下表示出来,即用基
下的向量表示出改变后的基,设这个基为
,则
在新基下的坐标为
,
是一组基的矩阵表示,也是线性变换,所以有句话叫矩阵就是线性变换。因此线性变换的本质是偷偷改变向量所在的基,在向量
看来,
就是它眼中的
,它没有发现自己的世界改变了,它所描述的倍数关系和角度关系都是
为单位的,但是在外界(原来的
)看来向量
为了使自己的世界看起来和原来一样,把自己给改变了,所以可以 说改变的是它,也可以说改变的是自己,这是相对的。
什么是相似变换呢?相似变换就是在不同基下的同一个线性变换。可以这么理解,假设在下有一个列向量
,把它看作是另一组基向量的线性组合的系数,就是说
里的数字表示的是以另一个基
中的基向量为单位的的倍数而不是以1为单位长度的正交基向量的倍数。如果有一个线性变换
,它所表示的对基的拉伸比例与旋转角度是对
而言的,那么如何对
做线性变换
呢,直接左乘?如果直接左乘我们就是默认
是在
下的向量,但实际上
是在
下的向量。所以在左乘之前必须要揭开
的真面目,即找出
在
下的真实坐标,做法很简单就是在
下把
表示出来,在
看来
就是标准正交基,但是在我们看来
只是
下的一组线性无关的向量,则
就是
在
下的真面目,现在,在同一个坐标系下就可以施加线性变换
了,得到
,变换后的结果回归以
为标准正交基的状态就要再乘上
,即
,因此
与
是同一个线性变换,只不过是这个线性变换在另一个世界即以
为标准正交基时的形态。不难理解线性变换
与向量
是绝对的、不随坐标改变的实体,所有矩阵数字的变化都只是因为基(参照系)在改变。矩阵的相似对角化就是在寻找线性变换在以不同基为标准正交基时能达到的最简形式,在这个基上这个线性变换只是简单的伸缩,广泛用于数据压缩降维的PCA算法和离散余弦变换DCT都是同样目的,即寻找一组基使数据的表示最简,在最简表示下的一些信息量小的空间维,可以选择舍弃而不影响其他维度,如PCA算法中奇异值小的项,DCT中的高频分量。当然不是所有的线性变换都有最简表示的,要能对角化,必须要有与空间维度数目相同的特征向量,对于某个线性变换,他的特征向量的独特之处在于,这个线性变换作用于其上只是简单的向量长度的缩放,特征值才是线性变换真正的“特征”,无论线性变换在各种基下如何千变万化,它是始终不变的,线性变换的DNA。特征向量的存在,是由基向量沿某个方向的分量相等造成的。这里举个二维空间的例子(三维不好画,四维没法画)来说明:
如图所示, 是在
即
下表示的线性变换,实际上它就是两个线性无关的新基(绿色的向量),如果对向量
做线性变换,即
从
的线性组合变成了
的线性组合,则如果在
把线性变换后的
表示出来,就是
,即
就是基
下的
,显然
经过线性变换后发生了旋转,但是我们会发现新的基向量,和旧的基向量都关于两条直线对称,这两条直线就是
和
,这两条直线之所以有这样的性质就是因为新基向量在与这两条直线垂直的方向上的分量长度,即图中的d是相等的,根据几何性质可以得出直线上存在一个方向,这个方向的向量在新基向量上的投影在与直线垂直方向上的分量互相抵消,这个方向就是特征向量的方向,更一般的,如果把基
换成
,因为其在d的方向上的分量仍与基
相等,所以其必然在
方向上也存在一个特征向量,前面说到线性变换在不同基下是千变万化的,但是如果通过一组相似变换将这一线性变换,变换到在以其特征向量为基的形式下会发现其在特征向量上的分量即特征值是不变的,但是其特征向量是会改变得,如果某个线性变换
在某个坐标下特征向量组为矩阵
,则其在特征向量下表示为对角阵
,
,如果对原线性变换
做一个相似变换
变到另一个坐标系下的形式
,
,那么
,所以特征值是不变的,特征向量是会改变的,因此相似变换的“相似”是针对其对特征向量的作用而言的。从这个“特”例也可以直观的看出,实对称矩阵的特征向量为什么是正交的,因为实对称矩阵的基向量的长度也相等的。
二、
空间的基
傅里叶变换实际上也是在寻找一组基来更简便的进行线性变换,但是目前所定义空间还不足以描述傅里叶变换。首先我们要将空间的维数扩展到无限维,即空间中的向量为,完备的无穷维内积空间就叫做希尔伯特空间。无穷维仍然不够,现在的基仍然是用向量来表示的,需要再进一步扩展,即把向量替换成连续的函数,这样一来就形成了线性泛函空间,因为要满足内积空间的基本要求,所以首先要定义函数的内积。
我们可以从向量内积的形式导出连续函数的内积:假设函数和
是我们所要定义的空间中的两个元素,先把它们离散化成向量形式,设它们的定义域为
,
是一个足够的整数,将区间
分成
段,每段长度为
,因为
足够大,所以
足够小,令
,则每一个小区间内的值都可以用
来近似,则函数
可写为:
这样就变成了一个N维的向量。对也做同样的处理,那么
和
的内积可以近似为:
因为随着区间数的增大这个值会越来越大,这样的定义显然不合理。所以更好的办法是求所有区间的平均值:
在N趋于无穷的时候就可以看作是微元
,将求和化为积分,则连续函数的内积可以定义为:
还有一点要求,那就是两个函数在定义域内的内积不能为无穷大即要满足平方可积条件:;
以函数来取代向量的无穷维内积空间就叫做空间,这个空间为什么以
命名呢?其原因是该空间是勒贝格(Lebesgue)可测集,所谓的勒贝格可测集指的是这个集合中所有的元素都具有勒贝格测度,测度在一维情况下就是长度,勒贝格测度定义了可数个子集的可加性,这是为处理可数个间断点所做的准备,拥有可数个间断点的函数只能进行勒贝格积分,而一般的黎曼积分只能处理有限个间断点(无穷包括可数无穷和不可数无穷)。需要注意一点,平方可积条件中的积分指的是勒贝格积分,虽然前面的定义用的是黎曼积分的分割方式(参考http://www.cmiw.cn/forum.php?mod=viewthread&tid=362833)。若
空间中的元素(函数)的定义域为
,则这个空间就表示为
,可以证明,即使用函数取代了向量,这个空间仍然是线性空间,满足线性空间的性质。可以用集合的观点来看待从向量到函数的过程,向量
可以认为是对整数集(interger)
的映射,即将整数集中的整数
映射成
,而函数
可以认为是对实数集(real)
的映射,即将实数集中的元素
映射成
,二者之差别仅在所在数域的大小,即整数集是可数无穷集,而实数集是不可数无穷集,这个差别并不足以破坏线性性质,需要注意的一点是如果这个映射是单射,则
必须为不可数无穷集,如实数集或复数集,而
可以为可数无穷集,从这点看来,研究可数无穷和不可数无穷哪个多还是有意义的(大概吧)。
前面提到过,线性变换就是基,现在就可以对傅里叶变换下定义了,傅里叶变换就是空间上的一个标准正交基。
这个基可以表示为:
容易证明和
在
时为零,且
无论何时都为零。即基中所有的函数只有与自己的内积不为零。这个
只是为了让积分结果为1而引入的。还有还有一个问题,就是在有限维空间中的基中的线性无关向量的数量要等于空间的维数,但是
是无限维的,函数系的数量也是无穷多的。不过可以通过zorn引理证明无穷维线性空间也必然存在极大线性无关集合,而通过shimidt正交化总可以获取一组正交基,并且只要某个正交系是希尔伯特空间的正交基,那么它就一定是完备的,这个完备指的是能够包含这组基的最小闭子空间是全空间(和线性无关向量的数量要等于空间的维数应该是一个意思),希尔伯特空间具有完备性,这个完备性指的是其中的元素在某个度量(内积)下的柯西序列的极限仍然属于这个空间(说白了就是对极限运算封闭),比如收敛的实数序列的在欧几里得距离度量下(减某个数平方小于
)的极限必然是实数,因而一维欧几里得空间即数轴R是完备的,但是有理数集却不是完备的,因为有理数序列可能收敛于无理数,
空间的完备性对频谱密度的定义是必要的。
空间的内积导出的范数为平方积分,所以正交基的完备性等价于帕斯瓦尔能量方程的成立。
这样一来所有定义在空间中的函数即定义域为
的所有平方可积函数都可以用这个基来进行表示。这个表示就是傅里叶系数,结合前面的概念,傅里叶系数就是另一组基下的一个向量罢了。现在让基中的每个函数都以
为周期重复(之前只取一个周期),则以它们为基的函数自然也以
为周期重复。周期一定要是
吗?
代表的是一个单位圆周,任何周而复始的事物都能抽象成这么一个周。但是不同的事情完成一个周的时间是有差别的,即周期
是不同的,而信号一般都是随时间变化的,所以必须要引入角频率
的概念来衡量完成一个周期的快慢,则有对应关系
。之前的微元
是对弧度
的微分,而
是对周期
的微分,如果以
为变量的话,两个坐标存在一个缩放关系,
改变一个
的时候
应该改变了一个
,则以
为变量的坐标下的
就相当于以
为变量的坐标下的基函数
中的1,正因如此
被称作为基频,这也是周期信号只有在基频和其谐波上存在频率分量的最根本原因了,假如其在谐波外的频率1.5倍基频上存在分量,则好比空间
上的函数在函数
(随便写的)上有分量,如果我们承认
是以
为周期的函数,那么这个函数显然不能以
为周期,周期性的前提都不成立了,能以
为周期的只能是周期为
整数倍的函数。
用时间信号一个周期的积分来替换一个圆周的弧度积分,就可以写出时间信号的三角形式傅里叶展开式了:
、
和
就是信号
在傅里叶变换下的坐标。具体坐标值就是函数在基上的投影,由内积就可求得,而连续函数的内积定义为积分形式,则坐标值为:
接下来给出复数形式的。不过在此之前需要弄明白复数与周期函数的渊源。
三、复数与傅里叶变换
对于一个运动方向不会改变的物体,可以容易的用一个数字(速率)确定其状态。但是对于运动方向会发生改变的物体,一维的数字显然不足以描述其状态,因为不仅需要表示大小,还必须表示方向。而在周期运动中速度的方向必然会发生改变,不然就回不到初始状态了。为了研究一维以上空间中的运动,我们将多个数字堆叠在一块,用以表示多维空间中的对象,多维的欧几里得空间中,一定存在正交基,在这个正交基下,各个维度的运动是独立的,因而我们可以通过叠加物体在不同维度的运动来描述高维空间中的运动。而函数则为我们提供了研究一维运动的方法,比如一个在一条线上振动的弹簧,它的运动完全可以用函数来描述,通过这个函数我们就能确定它任意时刻的状态。但是对于单一映射的函数而言也仅限于此,它无法描述一个沿单位圆不断匀速旋转的物体的运动,若要描述这个运动,我们需要两个函数,一个表示物体垂直方向的运动,一个表示物体水平方向的运动,则该物体的运动可以描述为
,
,这就是向量与函数相结合的分析方式,通过这种方式我们可以对任意维度的运动进行描述(欧几里得空间中的运动)。但是这些函数所描述的是多维运动在一维数轴上的投影量,就好比我们看地上影子的大小来判断一个人所在的高度,这种间接的方式无疑增加了分析多维运动的难度。对于二维平面中的运动而言,存在有一个更为简便的描述方式,那就是利用二维的数字 — 复数来实现二维映射。
复数是通过定义一种旋转来实现维度的扩张,引入的虚数单位 就代表一种旋转,数字1乘以
就转到了虚轴,再乘以
就转到了实数轴负半轴,即乘以
表示旋转90度的变换,而原来的实数运算也有了一些新的含义,如乘以-1就是在数平面上旋转180度。在复数平面的其他位置复数就如同一个二维向量,以实部和虚部来表示,但是区别在于向量的两个维度是具有相同意义、平等独立的,而复数的两个维度的含义不仅与向量不同,而且本身还是不对等的,这个不对等表现在乘法法则上,正如前面所说的,在乘法中实部代表伸缩和旋转180度的变换,虚部代表伸缩和旋转90度的变换,而向量的旋转需要利用旋转变换:
,实际上复数
,即完全可以用二维的笛卡尔坐标实现复数的所有功能,但是就像用极坐标处理圆周问题比较简便,用复数处理带有旋转的对象也是比较简便的,其原因就在于之前所提到的投影与原像的区别,复平面和笛卡尔坐标系的区别还体现在除法上,向量内积是没有逆运算的,因为内积结果的含义是长度,是一个一维的量,降维的过程是不可逆的,而旋转伸缩后的复数还是复数,并且旋转伸缩都是可逆的变换,所以复数的除法是有意义的。复数的强大作用体现在以其为变量的函数即复变函数中,实函数的自变量用一维的数轴即可表示,而复变函数的自变量是二维的复数,我们假设复平面上有一条曲线,这条曲线作为复变函数的自变量,复数的线性运算——加法可以实现对这条曲线的平移,乘法则可以实现对这条曲线的旋转和伸缩,这种类型的变换在几何学中被称为保向的相似变换,每一个这样的变换都可以用复变函数来表示。比如复变函数
可以将自变量直线
映射成抛物线。
直线得以映射为曲线,这允许我们用一维的自变量去描述二维的因变量,而伟大的欧拉公式允许我们用一维直线上的一个点来确定单位圆周上的一个点,即复变函数将自变量
(虚轴)映射成了单位圆周。欧拉公式
可以从
的泰拉级数中导出,也有更为直观的物理解释:当
取0时,
为1,即0时刻开始,质点处于正半轴上1的位置,把复变函数的输出轨迹视作质点的运动轨迹,那么质点的下一时刻位置由此刻的速度决定,在实函数中我们将满足求导为自身倍数:
,且初始值为1的函数定义为
,如果
为复数也纳入定义范围之内的话,这个微分方程仍然成立,则就可以对位置
求导得到速度
,在0时刻速度就为
,即速度的方向垂直于实轴大小也为1,如果继续对速度求导可以得到加速度
,加速度与速度垂直且方向指向原点。0时刻之后的任意时刻速度都会与原点到当前位置的位置向量方向垂直,大小相等,而加速度方向会与速度垂直、指向原点,符合这种规律的运动显然就是匀速圆周运动。总之,复变函数实现了一维自变量到二维曲线的映射,直接以这个匀速圆周运动为研究对象显然比研究一维投影要容易些。
这个容易体现在复数的代数运算比三角函数容易的多,所有的三角恒等式都来自于复数的乘法法则,因此用复数进行计算就不用再记忆繁多的三角函数公式,而是直接进行加减乘除,最后的结果可以通过欧拉公式再转变到三角形式,并且复指数的积分微分法则与实指数相同,在阻尼振动的情景中求解的微分方程总是比求解
要容易的多,因为
代表的是一条复杂的螺旋线的投影。但是复数的出现并不是出于便于计算的目的,而是一种必然,数字本就应该是二维的,若我们要求解二次代数方程
,设
为
则
就为
或
,可以发现这两个解是成180度角的,即在同一条直线上的,因此它们的值要么都在实轴上,要么都不在实轴上,因此不定义复数也不会影响我们对实根的求解,但是三次代数方程
就不一样了,
可以为
、
和
,显然当
时非实数也有可能落到实轴上了,虚实的边界被打破了,倘若不让数字翻身有可能影响到实数根的求解,所以复数必须要出现(感性理解,不一定对)。但是如同极坐标,复数只是因为它独特数学性质在某些领域大放异彩,作为一个数学工具,其不存在具体的物理意义。
言归正传,复指数函数在空间上构成了一组新的正交基:
在证明其正交之前必须要定义复数的内积,内积定义中很重要的一点就是元素与自身的内积为长度,而长度必须是正实数。所以定义复数内积要对第二变元取共轭,来保证这一点即:
可以证明这样定义内积是满足Schwarz不等式 与三角不等式的,而这两个不等式等价于夹角和长度的概念。则利用之前的三角函数的性质可得:
这样一来傅里叶级数就能写为复指数复指数形式(引入变量代换后):
(与三角形式不同,式中的
不再是实数,而是复数)
同理,系数可由内积求得:
在引入了复数之后就再也不用区分、
的系数了。我们知道这两者的区别仅仅是相位相差90度,而在复数域中
代表将复平面的所有点绕原点旋转90度的变换。如果把
看作是匀速圆周转子,那么乘上
即
相当于让转子位置突然向前变动了半个圆周,其在实轴上的投影分量相位变动了
,而实函数最终只会由实轴投影所叠加而成,虚分量必须抵消。因此原先三角函数形式的基中的
部分就可以表示为复数形式傅里叶系数中的虚部。正因如此偶函数的傅里叶系数必是实数,奇函数的傅里叶系数必是虚数。相位的差别不再用两个不同函数表示,而用一个复数表示,这导致了相位谱这个概念的形成。
和
的统一正是印证了直接以单位圆转子为对象相对一维投影的方便之处。
还有一点就是如果我们直接无视实函数傅里叶级数展开式 (注意不是系数) 的虚部,那么我们可以把傅立叶级数展开式写为:
当然这么做是不数学的,我们必须要引入共轭分量即叠加一个反向旋转的单位圆转子来抵消虚部——虚轴投影,正因如此正交基:
中才会有负系数项,这个负系数项与右半部分的正系数项成共轭关系,在进行的变量代换后这个负系数项对应的就是负频率部分,在加入这一部分后就可以这样表示傅里叶级数:
因此频率谱总是正负频偶对称的。
四、频谱密度及其性质
接下来就可以扩展出频谱密度的概念了,前面提到过空间上的所有函数都是只有在区间
上有意义的,其他区间只是周期重复而已,通过引入角速度
来将一个圆周弧度的微元
代换成时间微元
,一完成一个圆周
的时间为周期,
为基频,正交基中其他基函数的系数都是
的倍数,取基频
为无穷小,则若想完成一个圆周的运动需要无穷大的时间。这样一来一个周期为无穷大的函数就能在弧度
内进行积分了,即可以求出非周期函数在傅里叶基下的表示了。这里需要注意的一点是,虽然时间上扩张到了无穷,但是其仍然要满足
空间的基本要求,即弧度积分
,这意味着无限时间信号若能傅里叶变换,必须满足
,即为能量有限信号。
将基频取做无穷小使得式中的
为
微元的整数倍就变成了连续的变量
则
改写为;
可以发现傅里叶系数变成了的连续函数,同时数值也变成了无穷小,如果只关心它的形状轮廓即相对大小,而不关心其数值大小就是频谱密度函数了:
对应的傅里叶级数为:
因为频谱密度函数省略了即
,所以原时间函数与频谱密度函数差一个比例因子
,而
,所以还可以写为:
趋于无穷小求和变为积分:
直接将替换为
是不严谨的,因为可以这么做是建立在
空间是完备的前提下。这一过程就好像将傅里叶基中的每一项都压缩,使其对应于以
为变量的坐标轴上的某一个微元
,事实上每一个
都对应于某个
,每一个不同的
都对应了
空间的特征根,这一从离散到连续的过程必然要涉及极限的概念,要想让
足够“紧”且严丝合缝,那么
空间中任意柯西序列(函数序列)的极限必须仍属于
空间,即该空间完备。
傅立的变换满足以下性质:
①线性:
因为傅里叶变换本就是线性空间的基,线性变换自然满足线性性质。
②时移性质:
时间变化一个,意味着无穷多个 “转子” ,每一个都偏转了
的弧度,因为每个转子的
不同,所以偏转的弧度也不同。
③共轭对称性:
前面提到过信号实部只能由“转子”的实轴投影叠加而成,虚部由转子的虚轴投影叠加而成,对原信号取共轭,即实轴投影不变,虚轴虚轴投影要相移180度,将转子旋转方向改变,对实轴投影没有影响,实轴投影仍然是从1到0,但是虚轴投影相移了180度,原来是从0到1,现在是从0到-1。对傅里叶变换后的信号取取共轭,得到的是原信号共轭后在反向转子虚轴上的投影,若要得到共轭后的信号在正向转子上的投影,则需要将转子反向,即。
对于实函数来说还有一点就是偶函数的傅里叶系数必是实数,奇函数的傅里叶系数必是虚数,因此实函数的偶函数部分对应频谱密度的实部,奇函数部分对应频谱密度函数的虚部。
④尺度变换:
从式中观察,就会发现这是很显然的性质,因为
,在
前面加上系数
,则周期变为原来的
,则对
做傅里叶变换,其"基频"
就比
快
倍,即
,若用
取代
来表示
的傅里叶变换,即为性质④,这一性质直观的理解就是将音频快进,会产生尖锐的高频噪声,并且在频谱延展的同时原频率的能量也降低,转移到高频。
⑤微积分性质: 微分 ; 积分
因为积分需要用到冲击函数,这里先说微分,微分和积分都是线性运算满足齐次可加性,这对于积分而言显而易见,因为积分可以看作是求和(更专业点说的话积分是函数的分割集合的上和的下界和下和的上界)。对于一个函数,
在
点处的微分是
右侧的线性映射
,而非线性部分将作为高阶无穷小量,排除在定义外(若不能写成右侧形式即为不可微),由于有这样的定义,微分自然也是线性运算,满足线性性质。因此对函数微分,可以视作是对函数所展开的 “ 傅里叶级数 ” 的每一项
进行微分,而
的微分就是
。这一性质至关重要,因为这里体现了对傅里叶基下表示的向量做线性变换有多么简便。
五、线性空间的特征函数
对傅里叶级数做线性变换的简便性实际上等同于对对角矩阵左乘矩阵,即对对角矩阵做线性变换,这显然是极为简便的,因为对角矩阵是在以其特征向量为基的坐标下的矩阵的最简表示,特征向量的方向永远不会改变的,所以不论如何在以特征向量为基的坐标下对该矩阵做线性变换,最后的结果都能在特征向量下表示出来,所以对角矩阵的线性变换还是对角矩阵。傅里叶变换之所以能够得到广泛的应用,就是因为傅里叶基的地位等同与“对角矩阵”,傅里叶基是空间的特征函数,在这个空间进行的线性变换表现在特征函数上就只是投影长度的缩放(针对
空间而言的线性变换无法表示成矩阵,而只能作为线性算子)。
为什么傅里叶基会是线性函数空间的特征函数呢?实际上就是因为三角函数的定义,是我们把线性函数空间的特征函数定义为三角函数,进而用三角函数组成了傅里叶基。线性空间的特征函数有两类,一类是指数函数,一类是三角函数。我们在数学上是这么定义这两类函数的,指数函数就是求导等于自己的倍数的非周期函数,而三角函数为二次求导等于自己的倍数的周期函数,指数会爆炸,可以表示正反馈,不稳定。而三角函数会反复震荡,可以表示负反馈,是稳定的。这两类囊括了线性系统可以出现的所有情况,而线性系统的一种典型描述方式就是线性微分方程。正反馈与负反馈的差别只在于作用方向,正反馈加强输入的作用会使输入越来越大,如果系统保持线性的话就会爆炸,实现正反馈必须提供给额外的能量,工程中利用正反馈的典型例子就是振荡器,振荡器的起振就需要利用正反馈来加大振动幅度,所需要的额外能量由有源器件(晶体管放大器)提供,这个正反馈系统要不爆炸,就必须得是非线性的,因此振荡器还必须利用三极管的非线性特性来达到稳定。而负反馈系统的输出会减弱输入的作用,甚至使输入反向,负反馈系统本身就是稳定的,无需外界提供能量就能持续运转,就像一个没有阻力的单摆,会永远摆动下去,形成了周期运动。归结这两种反馈,无非只是在方向上有所差别,因此是可以归于一类的。
上图是一个小球在不同曲面上的运动(有重力),从这张图可以看出,负正反馈只是阴阳两面之区别,都能用线性微分方程描述。而将这二者结合的“太极”就是复平面,将数字扩展到复数域则线性微分方程的解就可以统一的表示为的线性组合,这就是线性系统的特征函数。
线性系统为什么重要呢?因为线性系统是可以理解、能够求解的系统,线性系统的解可以叠加,对即一个复杂的函数做一个线性变换,等同于将这个复杂函数分解,再对所有分解出来的信号做线性变换再叠加。这正是“分析”得以进行的原因。再者现实中的很多问题即便是非线性的,但仍能在某些情况下近似成线性,物理学定律基本都由微分、积分、来表示不同量的关系,因此这些定律往往都是线性的,如电学规律的麦克斯韦方程组和量子力学的薛定谔方程。
“分析”线性系统需要定义一种新的测度,它能实现对函数的分解,并且是分解到不能再分解。这个测度就是冲击函数 ,