在《SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS》 中,作者对《Convolutional Neural Networks on Graphs
with Fast Localized Spectral Filtering》作出了改进,提出了以下创新:
(1)提出了一个可以直接在图上操作的神经网络模型的逐层传播规则;
(2)证明了这种形式的图卷积网络怎样在图上实现半监督的节点分类;
1.神经网络模型的逐层传播规则
卷积公式的频域表示:
g∗x=UgθUTx(1)
定义L为对称归一化图拉普拉斯矩阵,L=IN−D−21AD−21=UΛUT,A是无向图的邻接矩阵(可以是二值,也可以是权值),Dii=∑jAij是图的度矩阵。U是L特征向量矩阵。L的特征值范围为[0,1]。
由论文《Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering》得到,式(1)可以推导为:
gθ′(Λ)≈k=0∑Kθk′Tk(Λ~)(2)
其中Λ~=λmax2Λ−IN,θ′∈RK是切比雪夫系数。得到:g∗x≈∑k=0Kθk′Tk(L~)x,其中L~=λmax2L−IN。L~的特征值范围为[-1,1]。
当使用K=1时,式(2)在频域变为线性函数,即:
g∗x≈θ0′x+θ1′(λmax2L−IN)x(3)
将λmax≈2,则
g∗x≈θ0′x+θ1′(L−IN)x=θ0′x−θ1′(D−21AD−21)x(4)
由于θ0′,θ1′是训练参数,是可调整的,使得θ0′=−θ1′=θ,那么
g∗x≈θ(IN+D−21AD−21)x(5)
IN+D−21AD−21的特征值范围为[0,2],可能会导致梯度消失和梯度爆炸的问题,将IN+D−21AD−21再次归一化为D~−21A~D~−21,其中,A=~A+IN,D~ii=∑jA~ij,可以有效的避免这个问题,同时由于θ为一个数,可以放到等式的最后,得到:
g∗x≈(D~−21A~D~−21)xθ(6)
当信号x为多通道信号X∈RN×C时,并且使用F个卷积核,使得每个输出节点的通道数为F,则:
Z=(D~−21A~D~−21)XΘ(7)
C为输入节点的通道数,F为输出节点的通道数,同时也是卷积核数目;Θ∈RC×F为这F个卷积核的参数。
2.半监督的节点分类
令D~−21A~D~−21=A^,Θ=W,则两层的图卷积分类网络可以表示为:
Z=f(X,A)=softmax(A^ ReLU(A^XW(0))W(1))(8)

需要说明的是,一个图就是一个样本,每个样本在逐层传播的过程中认为A^是一样的,也就是说每层中A^是共享的。softmax(xij)=∑jexp(xij)exp(xij),i∈[1,N],j∈[1,F],xi∈R1×F表示两层卷积后输出(RN×F)的第i行。交叉熵为L=−∑l∈YL∑f=1FYlflnZlf,其中YL是有标签节点的集合。