实值复变函数求导 ——(Wirtinger derivatives)

1.背景知识

在工程应用中,特别是信号处理领域,经常会遇到一些关于复信号的计算,一个典型的例子就是著名的快速傅里叶变换(FFT),它会将实信号也映射为复信号。与实信号相比,复信号包含额外的相位信息。某些物体,例如phase object,其有效信息完全包含在相位信号中。 而且实数作为复数的一个子集,针对复信号设计的算法往往有更加广泛的应用。因此,研究复信号是非常有必要的。    

实值复变函数求导 ——(Wirtinger derivatives)
一些余弦波叠加的FFT分析(图片来源:维基百科)

常见的对的复信号的处理是将其实部和虚部分开,然后进行单独处理,这样就可以用处理实信号的方法解决复信号的问题。但是,这种方法往往包含很多重复步骤分别用来处理实部和虚部。 我们希望能够直接在复数域进行相关分析,从而让整个算法的结构变得更加精简。

信号复原是信号处理中一个重要的方向,主要研究根据测量结果恢复出原始信号,而这个问题常常被看作是一个优化问题。解决优化问题经常要用到函数的梯度,因此有必要研究复变函数的一些求导理论。

2.经典的复变函数可导性

在传统的复变函数理论中,可导性的要求非常严格,具体定义为:如果复变函数实值复变函数求导 ——(Wirtinger derivatives)实值复变函数求导 ——(Wirtinger derivatives)处可导,那么极限

                                                                   实值复变函数求导 ——(Wirtinger derivatives)

总是存在,与实值复变函数求导 ——(Wirtinger derivatives)趋近于实值复变函数求导 ——(Wirtinger derivatives)的路径无关。因此,若将其写成实部和虚部的形式,那么对于函数实值复变函数求导 ——(Wirtinger derivatives)和变量实值复变函数求导 ——(Wirtinger derivatives), 必须满足条件:

                                                                           实值复变函数求导 ——(Wirtinger derivatives),

这一性质与势能函数类似,即做功只与始末位置有关,而与路径无关,比如重力势能只与高度有关。因此其在一个封闭路径上的积分为0,从而可导函数具有上述的偏导数约束。 

实值复变函数求导 ——(Wirtinger derivatives)
重力势能(来源:百度百科)

                         

这种定义下的导函数是实数导数理论的一个直接推广,但是适用性较窄,使用时限制条件较多。一类典型的不具有这种可导性的函数包括所有的实值复变函数(非常函数)。对于这种函数,实值复变函数求导 ——(Wirtinger derivatives)不为常数,实值复变函数求导 ——(Wirtinger derivatives),因此实值复变函数求导 ——(Wirtinger derivatives),必不满足上述偏导数条件。但是,这类实值函数在实际应用中很常见,一个例子是评价函数。对于一个复原后的复信号,我们对它的评价一定为一个实数,这样才可以用该指标的大小评价信号的好坏(一般复数无法直接比较大小)。在模仿深度学习进行误差反向传播更新的过程中,必然会涉及到实值复变函数的求导,而上述导数定义无法使用,因此引入了Wirtinger导数体系解决这个问题。

3. Wirtinger 导数

Wirtinger 导数由Remmert与1995年提出 [1],用于解决实值复变函数的问题。首先通过实部与虚部分离的方法研究一个复变函数实值复变函数求导 ——(Wirtinger derivatives)的微分问题。根据多元函数的微分性质

                                                实值复变函数求导 ——(Wirtinger derivatives),

根据z与x和y的关系,可将其改写成关于z的微分:

                                                                              实值复变函数求导 ——(Wirtinger derivatives),

带入上式可得,若实值复变函数求导 ——(Wirtinger derivatives),那么

                                                                                  实值复变函数求导 ——(Wirtinger derivatives),

这两个导数就被称为Wirtinger导数(Wirtinger derivatives)。

根据上述定义,可以得到一个Wirtinger求导法则中非常重要的一组等式

                                                              实值复变函数求导 ——(Wirtinger derivatives).

类比多元函数中偏导数恒为零的情况,我们可以很自然得得出一个结论:在Wirtinger求导法则中,实值复变函数求导 ——(Wirtinger derivatives)实值复变函数求导 ——(Wirtinger derivatives)可以看作两个互不相关的变量,只要分别对其单独求导即可。例如,对实值复变函数求导 ——(Wirtinger derivatives)求导时,可将实值复变函数求导 ——(Wirtinger derivatives)看作常量,反之亦然。

最后举一个例子。复数的模平方的计算公式为实值复变函数求导 ——(Wirtinger derivatives),那么在Wirtinger导数体系下,其关于z的导数为

                                                                 实值复变函数求导 ——(Wirtinger derivatives).

模函数也为一个实值函数,它也具有实值函数特有的求导性质

                                                                                         实值复变函数求导 ——(Wirtinger derivatives).

对于梯度下降法,其最速下降方向为实值复变函数求导 ——(Wirtinger derivatives),其中F为实值复变函数。

参考文献:

[1] Remmert, R. (1991). Theory of complex functions (Vol. 122). Springer Science & Business Media.

[2] (一份实用课件) https://mediatum.ub.tum.de/doc/631019/631019.pdf