泛函和变分:从最速降线谈起

泛函和变分:从最速降线谈起

处理最速降线等类似的问题,大家都喜欢直接对推导出来的极小化问题,直接代入欧拉-拉格朗日方程求解,我觉得这不易于对“变分”的理解,对于大家理论分析功底的增近,并无裨益。通过思考,我觉得直接从 Frechet 导数出发,进行变分推导得到更具化的欧拉-拉格朗日方程,是更为广泛的一种变分方法。本质上是一样的,只不过这个过程更容易推广。

简介

所谓的泛函,就是“函数的函数”,自变量本身就是函数的一个函数。找一个函数,使得某一个泛函最小,就是一个“能量”极小化的问题。可以用到变分方法。

  • 变分法在理论物理中非常重要:在拉格朗日力学中,以及在最小作用量原理在量子力学的应用中。
  • 变分法提供了有限元方法的数学基础,它是求解边界值问题的强力工具。它们也在材料学中研究材料平衡中大量使用。
  • 在纯数学中的例子有,黎曼在调和函数中使用狄力克雷原理。
  • 最优控制的理论是变分法的一个推广。

变分法是 17 世纪末发展起来的一门数学分支,是处理函数的数学领域,和处理数的函数的普通微积分相对。它最终寻求的是极值函数:它们使得泛函取得极大或极小值。

变分

微分是当自变量xx变化了一点点dx\text{d}x而导致了函数f(x)f(x)变化了多少。
变分是无限维空间上的微分,我们一般称之为Frechet 微分,其实就是微分在无限维空间的推广。Frechet 微分作用于泛函就叫变分。我们用 δ\delta 符号来替代微分中的 d。

Frechet 导数

Frechet 导数实变量函数在 Banach 空间中的推广,这个东西在做偏微分方程的时候,比如求能量极小,求欧拉-拉格朗日方程等方面,非常重要,任何做方程的,都应该熟练掌握。

Frechet 导数,就是一般导数的一个推广,可以简单地写为,对于需要极小化的函数 J(ϕ)J(\phi)ψ\forall \psi
<δJδϕ,ψ>=limϵ>0J(ϕ+ϵψ)J(ϕ)ϵ<\frac{\delta J}{\delta \phi},\psi> = \lim_{\epsilon->0}\frac{J(\phi+\epsilon\psi)-J(\phi)}{\epsilon}

Frechet 导数和一般的函数导数非常像,主要是这个对辅助函数 ψ\psi 的任意很关键,是把积分号去掉,提取出恒等式的原因。

最速降线问题

最速降线问题,又称最短时间问题、最速落径问题,是探讨在重力作用而忽略摩擦力的情况下,一个质点在一点A以速率为零开始,沿某条曲线,去到一点不高于A的B,该以何种曲线行进才能令所需的时间最短。由经验可知,这条线越陡,速度就会越快,但是相应的路径就会变长,路径和速度之间必然存在一个平衡。

泛函和变分:从最速降线谈起

如图所示建立坐标系,水平方向的运动距离为xx,竖直方向的运动距离为yy,速度的大小用vv来表示。

由高中的重力势能和动能的转化关系,mgy=1/2mv2mgy=1/2mv^2。可以得到,
v=2gyv = \sqrt{2gy}

在微分几何中,一条参数化曲线{x(t),y(t)}\{x(t),y(t)\},它的弧长是可以表示为:
t0t1x(t)2+y(t)2dt \int_{t_0}^{t_1}\sqrt{x'(t)^2+y'(t)^2}\text{d}t
这个公式不需要记,怎么理解呢,它表示曲线沿xx方向的变化率,和沿yy方向的变化率,利用“勾股定理进行组合,得到的就是沿切线方向的变化率,沿切线方向的变化率,再做个积分,肯定就是长度了。

那么,对于曲线 y(x)y(x),把 xx 看成 tt,仍用 xx 表示,那么它的弧长就是
ab1+y(x)2dx \int_{a}^{b}\sqrt{1+y'(x)^2}\text{d}x
接下来,有的地方就会利用“微元”的思想,把弧长和速度相除作为时间进行积分,对于不理解“微元法”的人来说,就会显得很牵强。那么应该怎么解释呢?

把弧长的表达式换成弧长参数,有
ab1+y(x)2dx=s0s11ds \int_{a}^{b}\sqrt{1+y'(x)^2}\text{d}x= \int_{s_0}^{s_1}1\text{d}s
也就是说,
ds=1+y(x)2dx \text{d}s = \sqrt{1+y'(x)^2}\text{d}x
这个是很容易理解的。那么,

v=dsdt=1+y(x)2dxdtv=\frac{\text d s}{\text d t} = \sqrt{1+y'(x)^2}\frac{\text{d}x}{\text d t}

则有,
dt=1+y(x)2vdx\text dt = \frac{\sqrt{1+y'(x)^2}}{v} \text dx

两边同时积分,可以得到从 a 到 b 的总时间,

J=ab1+y(x)22gydx:=abFdxJ = \int_{a}^{b} \frac{\sqrt{1+y'(x)^2}}{\sqrt{2gy}} \text dx:= \int_{a}^{b} F \text dx

变分求解最速降线

下面要做的就是选定 yy ,使得 JJ 达到最小,这是经典的变分问题,我们使用变分方法。

<δJδy,z>=limϵ>0J(y+ϵz)J(y)ϵ=limϵ>0abFyϵz+Fyϵz+o(ϵ)ϵ=abFyz+Fyz=Fyzab+ab(Fy+ddxFy)z=ab(Fy+ddxFy)z=0<\frac{\delta J}{\delta y},z> = \lim_{\epsilon->0}\frac{J(y+\epsilon z)-J(y)}{\epsilon}\\ =\lim_{\epsilon->0}\int_{a}^b \frac{\frac{\partial F}{\partial y}\epsilon z+\frac{\partial F}{\partial y'}\epsilon z'+o(\epsilon)}{\epsilon}\\ = \int_{a}^b \frac{\partial F}{\partial y}z+\frac{\partial F}{\partial y'}z'\\ ={\frac{\partial F}{\partial y'}z}|_a^{b}+\int_{a}^b (\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'})z\\ = \int_{a}^b (\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'})z = 0

第二个等号用了泰勒展开,因为积分不好相消,这种情况下,我们一般更倾向于用泰勒展开。这里的yyyy'都应该看成一个变量,类比一般的多元函数泰勒展开。

第四个等号用了分部积分,对第二项进行了处理,一般含辅助函数 zz 的都可以进行分部积分处理掉。

第五个等式是因为,y+ϵzy+\epsilon z 作为 y 的一个扰动,必须满足边界条件,即(y+ϵz)(a)=y(a)(y+ϵz)(b)=y(b)(y+\epsilon z)(a) = y (a)\\ (y+\epsilon z)(b) = y (b)
这意味着z(a)=z(b)=0z(a) = z(b) = 0。最后,由于 zz 的任意性(端点固定不影响),我们有,
Fy+ddxFy=0\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'} = 0

这便是我们得到的欧拉-拉格朗日方程。由于 FF 中不显含自变量,则,
ddx[FyFy]=yFy+yFyyFyyddx(Fy)=0\frac{d}{d x}\left[F-y^{\prime} \frac{\partial F}{\partial y^{\prime}}\right]=y^{\prime} \frac{\partial F}{\partial y}+y^{\prime \prime} \frac{\partial F}{\partial y^{\prime}}-y^{\prime \prime} \frac{\partial F}{\partial y^{\prime}}-y^{\prime} \frac{d}{d x}\left(\frac{\partial F}{\partial y^{\prime}}\right)=0
故而
FyFy=CF-y^{\prime} \frac{\partial F}{\partial y^{\prime}}=C
FF的表达式代入,并且化简,可以得到一个不显含 xx 的一个 ODE,
y[1+(y)2]=Cy\left[1+\left(y^{\prime}\right)^{2}\right]=C
这里的 C 是可以由边界条件得到。翻一翻常微分的课本,我们可以求解这个 ODE,得到:
{x=a+r(θsinθ)y=r(1cosθ)\left\{\begin{array}{l} x=a+r(\theta-\sin \theta) \\ y=r(1-\cos \theta) \end{array}\right.

这里的 r>0r>0,表示摆线圆半径。这里的 rr 等于多少呢?假设 a、b两点的坐标分别为——a:(a,0)b:(b,yb)a: (a,0),b:(b,y_b)。那么,可以求得:θ0=0\theta_0 = 0θ1\theta_1rr 可以根据求解方程组
{b=a+r(θ1sinθ1)yb=r(1cosθ1)\left\{\begin{array}{l} b=a+r(\theta_1-\sin \theta_1) \\ y_b=r(1-\cos \theta_1) \end{array}\right.
得到。涉及到非线性方程的求根,解析的表达式并不好写。

最速降线的物理意义

最速降线到底是什么呢?它是个是摆线,即圆周上固定一点在圆滚动时的轨迹。当然,这里的摆线是上下颠倒的。如图所示。

泛函和变分:从最速降线谈起
泛函和变分:从最速降线谈起