元图Meta-Graph: Few shot link prediction via meta learning理解与部分翻译

引言

链接预测的目的是能够从图中学习并推测出新的或者未知的关系。比如说,从社交网络方面,通过链接预测构建一个朋友推荐系统,从生物网络方面,通过链接预测推断出药物、蛋白质和疾病直接的关系。但是这些工作只聚焦于单一的问题设置:链接预测都用于一个单一的大图,并且这个图中的关系完整,至少有50%的真实链接(边)可以在训练阶段被看到。

本篇文章要做是基于小样本链接预测这么一个更有挑战性的设定,目标是在多个只包含一小部分真实、潜在的边的图中进行链接预测。比如说,在生物网络方面,高通量的原子提供了评估上千个来自不同组织、细胞类型、器官的生物原子的可能性。但是也存在一些用于评估关系的图,它们的图结构存在较大的噪声和稀疏情况,这时候就存在这么一种情况,对于一些稀疏图的链接预测可能得益于其他更加密集的图的知识迁移方法,假设这些图之间,有着相似的可利用结构。

小样本链接预测的最终目标是通过观察一个特殊领域的许多例图,然后利用得到的经验对同一个领域内但是完全崭新的另一个稀疏图进行链接预测时,能够达到快速适应和高准确率的能力。

目前的工作

引进了一种新的元图结构,并且暂定了一系列任务的全局基准。采用了经典的基于梯度的元学习方法,将小样本分类方法用于图领域。
元图Meta-Graph: Few shot link prediction via meta learning理解与部分翻译

前提和问题定义

我们可以从图中得到一个分布p(G)p(G),然后对图进行取样,使Gip(G)G_i\sim p(G),其中Gi=ViξiXiG_i=(V_i,\xi_i,X_i)由图的一系列节点ViV_i,边ξi\xi_i和真实的节点特征矩阵XRVi×dX\in R^{|V_i|\times d}。为了方便起见,我们同样可以用Gi=ViAiXiG_i=(V_i,A_i,X_i)表示图结构,其中使用了邻接矩阵AiZVi×ViA_i\in Z^{|V_i|\times |V_i|}代替了边ξi\xi_i

在这之中,我们假设GiG_i是一个简单图,即只包含一种类型(节点之间只有一条边)且不包含自环,每个节点vViv\in V_i,并且都有一个真实值的特征向量与之关联。我们进一步假设,训练阶段用的采样图GiG_i只是一个稀疏的子图,即它的边仅仅包含一部分的真实边,ξitrainξi\xi_i^{train}\subset \xi _ip(G)p(G)也是由这一系列的关联图定义。

我们的目的是为了学习到一个全局或元结构内的链接预测模式。有一些列的采样训练图结构数据Gip(G),i=1...nG_i \sim p(G),i=1...n,才能使用这些元图的模式去快速学习一种链接预测模型,有效地对新的采样图Gp(G)G_*\sim p(G)进行链接预测。更具体地说,我们想要优化一系列的全局参数 θ\theta,以及可以被用于图GG_*的局部链接预测模式,汇聚产生一个有效的参数初始化结果ϕ\phi _*的图信号函数ψ(G)\psi(G_*)

与标准链接预测的关系

小样本链接预测与标准链接预测的三个重要区别:
1、区别于标准链接预测时学习的单一图结果GG,小样本预测学习的是从同分布或同领域采样得到的多图结构{G1,...,GnG_1,...,G_n}
2、我们假定使用的是非常稀疏的真实边的样本。我们只聚焦于最多只包含30%真实边的样本,即ξtrainξ0.3{|\xi ^{train} |\over |\xi|}\leq0.3
3、我们区别开两种参数,一个是被用于编码关于图的潜在分布的经验的全局参数,另一个是在特定的图GiG_i中被用于进行优化处理链接预测局部参数ϕi\phi _i。这种区分允许我们去考虑使用从多图中提取到的信息,同时也运行对每一张特地的图进行链接预测模型的单独调整。

与传统元学习的关系

针对小样本分类问题的传统元学习方法总体上是先针对分类任务假设一个分布p(Γ)p(\Gamma),然后目标是学习得到的全局参数能够通过较少数量的样本对于一个新样本任务Γip(Γ)\Gamma _i\sim p(\Gamma)进行快速适应。而我们考虑的是先针对图结构得到一个分布p(G)p(G),目标是对一个新的图样本进行链接预测。其中一个很重要的难点在于,图之间的预测都是独立同分布的,而且对于小样本学习,我们要求训练数据只是一个完整图的一个稀疏子图,只占有很小比例的真实边的数量,我们为了小样本的分类打破所有的图结构,并恢复监督设置。

未完待续