实值复变函数求导 ——(Wirtinger derivatives)
1.背景知识
在工程应用中,特别是信号处理领域,经常会遇到一些关于复信号的计算,一个典型的例子就是著名的快速傅里叶变换(FFT),它会将实信号也映射为复信号。与实信号相比,复信号包含额外的相位信息。某些物体,例如phase object,其有效信息完全包含在相位信号中。 而且实数作为复数的一个子集,针对复信号设计的算法往往有更加广泛的应用。因此,研究复信号是非常有必要的。
常见的对的复信号的处理是将其实部和虚部分开,然后进行单独处理,这样就可以用处理实信号的方法解决复信号的问题。但是,这种方法往往包含很多重复步骤分别用来处理实部和虚部。 我们希望能够直接在复数域进行相关分析,从而让整个算法的结构变得更加精简。
信号复原是信号处理中一个重要的方向,主要研究根据测量结果恢复出原始信号,而这个问题常常被看作是一个优化问题。解决优化问题经常要用到函数的梯度,因此有必要研究复变函数的一些求导理论。
2.经典的复变函数可导性
在传统的复变函数理论中,可导性的要求非常严格,具体定义为:如果复变函数在
处可导,那么极限
总是存在,与趋近于
的路径无关。因此,若将其写成实部和虚部的形式,那么对于函数
和变量
, 必须满足条件:
,
这一性质与势能函数类似,即做功只与始末位置有关,而与路径无关,比如重力势能只与高度有关。因此其在一个封闭路径上的积分为0,从而可导函数具有上述的偏导数约束。
这种定义下的导函数是实数导数理论的一个直接推广,但是适用性较窄,使用时限制条件较多。一类典型的不具有这种可导性的函数包括所有的实值复变函数(非常函数)。对于这种函数,不为常数,
,因此
,必不满足上述偏导数条件。但是,这类实值函数在实际应用中很常见,一个例子是评价函数。对于一个复原后的复信号,我们对它的评价一定为一个实数,这样才可以用该指标的大小评价信号的好坏(一般复数无法直接比较大小)。在模仿深度学习进行误差反向传播更新的过程中,必然会涉及到实值复变函数的求导,而上述导数定义无法使用,因此引入了Wirtinger导数体系解决这个问题。
3. Wirtinger 导数
Wirtinger 导数由Remmert与1995年提出 [1],用于解决实值复变函数的问题。首先通过实部与虚部分离的方法研究一个复变函数的微分问题。根据多元函数的微分性质
,
根据z与x和y的关系,可将其改写成关于z的微分:
,
带入上式可得,若,那么
,
这两个导数就被称为Wirtinger导数(Wirtinger derivatives)。
根据上述定义,可以得到一个Wirtinger求导法则中非常重要的一组等式
.
类比多元函数中偏导数恒为零的情况,我们可以很自然得得出一个结论:在Wirtinger求导法则中,和
可以看作两个互不相关的变量,只要分别对其单独求导即可。例如,对
求导时,可将
看作常量,反之亦然。
最后举一个例子。复数的模平方的计算公式为,那么在Wirtinger导数体系下,其关于z的导数为
.
模函数也为一个实值函数,它也具有实值函数特有的求导性质
.
对于梯度下降法,其最速下降方向为,其中F为实值复变函数。
参考文献:
[1] Remmert, R. (1991). Theory of complex functions (Vol. 122). Springer Science & Business Media.
[2] (一份实用课件) https://mediatum.ub.tum.de/doc/631019/631019.pdf