Semi-Supervised Classification with Graph Convolutional Networks
Semi-Supervised Classification with Graph Convolutional Networks
时间:2017
Intro
要解决的问题:图上的结点分类,其中只有小部分结点有label。
这是一个基于图的半监督学习,可以通过在损失函数中额外加一项graph-based regularization来解决:
其中表示label的损失,表示神经网络,是结点特征矩阵,表示unnormalized graph Laplacian(???),是邻接矩阵,,这个方程假设了连接的结点更可能有一样的label,但因为边的存在除了表示结点之间的相似性外还有别的信息,所以这一假设可能限制模型的表达能力
本文通过直接用神经网络来encode图结构并在上训练来避免在损失函数中包括graph-based regularization,以邻接矩阵为条件的神经网络会使得模型将监督学习损失的梯度信息传递到其他图的其他结点上,使得无论是否有标签的结点都能学习到好的representation
本文贡献有以下两点
- 提出了一个直接在图上作用的神经网络
- 使用提出的网络在图上进行半监督学习,得到了更好的效果
Fast Approximate convolutions on graphs
multi-layer GCN的一层传播规则如下
其中,是无向图的邻接矩阵加上每个结点自连接,,是训练参数,是第层的**矩阵,且,接下来证明这个形式是受到图上局部光谱滤波(localized spectral filter)的一阶逼近得到的
Spectral Graph Convolutions
图上的谱卷积定义为对信号和卷积核的乘积
其中是normalized graph Laplacian的特征向量,其中是特征值的对角矩阵,是图傅里叶变换,可以将看做的特征值的函数,上图的计算复杂度很高,因此通过truncated expansion来逼近
此时计算复杂度由降低到了
Layer-Wise Linear Model
将上面的式子stack起来就可以得到层的结构,此时选择,后面的看不懂
Semi Supervised Node Classification
下面使用之前的模型来进行半监督学习,因为邻接矩阵中包括了中不包含的信息,因此通过图卷积将它们融合起来,整个模型如图所示
Example
考虑一个两层的GCN
其中是输入到隐层的权值,是隐层到输出的权值,最后计算所有带标签样本的交叉熵损失
Conclusion
本文提出了一个图卷积网络,它能够以图作为输入,通过逐层的特征映射,完成了半监督的学习任务,达到了较好的效果
问题
- 图结点的个数是样例的个数,在样本多的情况下计算量会很大
- 暂时不支持有向图
- 内存开销和数据集成正比