对范数求偏导数

首先介绍点基础知识,另一方面也算是巩固下:
A1表示A的逆矩阵;
AT表示A的转置;
AH表示Hermitian矩阵(A的共轭转置矩阵A∗==A)

基础

对范数求偏导数

(1)迹(Trace)

eig(A)表示A的特征值

对范数求偏导数

(2)行列式(Determinant)

对范数求偏导数

(3)特例2*2矩阵

对范数求偏导数

以上是摘自:The Matrix Cookbook
也可参考维基百科:Matrix calculus

L1范数的次微分

L1范数不可微。但是存在次梯度,即是次微分的
L1范数的次梯度如下:

x||x||1=sign(x)

其中sign(x) 表示如下:
sign(x)=+11[1,1]xi>0xi<0xi=0

L1范数:
||X||1=|x1|+|x2|++|xn|

例如:x=(3,2,5)T
故其梯度为:sign(x)=(1,1,-1)

L2范数的微分

对范数求偏导数

例如:求解下面函数的偏导数:

f(W)=12i,jϵSγi,j||wTiXwTjX||22

得:
f(W)wi=i,jϵsγi,j(wTiXwTjX)(wTiXwTjX)wi=i,jϵsγi,j(wTiXwTjX)XT=i,jϵsγi,j(wTiwTj)(XXT)

注意这里得到的是行向量的形式,因此还需要对其进行转置

以上的推倒是基于上图公式得到。。。