实体对齐2.IJCAI 2017:(IPTransE)Iterative Entity Alignment via Joint Knowledge Embeddings
-
关键词:Iterative Alignment,Joint Embedding
-
摘要
文章指出之前的实体对齐方法通常依赖于实体的外部信息,比如Wikipedia连接,并且需要昂贵的人工构造特征来完成实体对齐。而本文提出一种利用联合知识嵌入实现实体对齐。该方法根据一个小的对齐实体种子集,将不同KG的实体和关系联合编码到一个统一的低维语义空间中。更具体地说,我们提出了一种迭代和参数共享的方法来提高对齐性能。
-
介绍
本文方法主要由三部分组成:(1)知识嵌入。利用基于翻译的KRL(Knowledge Representation Learning)学习实体和关系的嵌入。(2)联合嵌入。根据种子集将不同KG的知识嵌入映射到联合语义空间。(3)迭代对齐。通过考虑那些在方法中越来越多地发现的高度自信的对齐实体,迭代地对齐实体及其对应实体,并更新联合知识嵌入。
-
方法
由于本文方法由三部分组成,故目标函数也定义成对应的三部分:
模型总体架构如下:
该图表明了我们的方法通过TransE与参数共享和软对齐实现。蓝色和红色的点分别表示来自和
的实体,灰色箭头在
和
中都表示关系。KG之间的实线和虚线表示迭代学习中的对齐种子和新对齐的实体对。我们使用KG和score函数之间的链接来表示嵌入源和相应的目的地。相同的颜色表示相同的实体/关系和相应的嵌入。
1.知识嵌入(Knowledge Embeddings)
虽然TransE在许多任务中表现出色,但它在KG中忽略了重要的多步路径信息,难以建模复杂的关系。因此使用了PTransE来代替TransE,PTransE考虑了多步路径信息,可以获得更好的实体对齐性能。根据PTransE,我们将关系路径定义为,且有
。在PTransE中,如果一个关系路径起到一个与关系相同的作用,即
和
,我们将路径嵌入定义为
。能量函数被定义为:
2.联合嵌入(Joint Embeddings)
本文提出三个联合嵌入模型,分别是Translation-based Model(基于翻译的模型),Linear Transformation Model(线性变换模型)和Parameter Sharing Model(参数共享模型)。
Translation-based Model(基于翻译的模型) 给定两个对齐实体和
,假设存在对齐关系
使得
,则联合嵌入的能量函数被定义为:
Linear Transformation Model(LT,线性变换模型) 给定两个对齐实体和
,定义一个变换矩阵
,使得
。故能量函数被定义为:
对于Translation-based Model和LT Model,可以将得分函数定义为对齐种子上的能量函数之和,形式为:
其中是加权系数。
Parameter Sharing Model(PS,参数共享模型) 上面两种模型可以看作是学习知识嵌入的正则化。由于对齐的实体在KG中具有相同的含义,因此让这些对齐的实体共享相同的嵌入对我们来说也是很直观的。形式上,对于每一个对齐实体对,定义:
PS模型简单有效地将和
的知识嵌入到相同的语义空间中。在该模型中,没有正则化变量,因此其得分函数
。
3.迭代对齐(Iterative Alignment)
基于知识嵌入和连接嵌入,可以根据实体之间的语义距离在统一的语义空间内进行实体对齐。针对不同的关节嵌入模型,采用不同的方法计算语义距离。基于翻译的模型使用公式(9)计算距离;线性变换模型使用公式(10)计算距离;参数共享模型使用以下公式计算模型:
以这种方式,对于一个KG中的每一个非对齐实体,我们都会从另一个KG中找到最相近的非对齐实体
:
。我们还定义了一个距离阈值
作为超参数,如果
,我们自信
很有可能是
的对应,否则我们就不会将
看作是
的对应。我们将这些实体称作新对齐实体。
显然,新对齐实体可以帮助更新联合嵌入,并找到更多要对齐的实体。因此,我们提出迭代实体对齐,并设计了联合嵌入和实体对齐的两种迭代学习策略。
Hard Alignment(HA,硬对齐) 对于参数共享模型,我们可以简单地对那些新对齐实体应用参数共享规则。即,我们将新对齐实体对添加到对齐种子
中,并简单地强制
与
。然后根据更新后的种子集
更新联合嵌入。对于HA来说,新对齐实体对是直接添加到
中的,所以HA的得分函数是
。
Soft Alignment(SA,软对齐) 由于实体对齐存在不可避免的错误,硬对齐在引入错误对齐时可能会产生错误传播。例如,由于乔治·w·布什(George W. Bush)和比尔·克林顿(Bill Clinton)都是美国总统,他们表现出类似的嵌入。假设中的George W. Bush和
中的Bill Clinton偶然地被HA对齐,那么它可能相应地将它们的出生地,
中New Haven和
中的Hope,强制地嵌入得更接近,导致更多错误。
为解决这一问题,我们提出了软对齐(SA),通过为每个新对齐实体分配一个可靠性得分。该方法可与基于翻译的模型、线性变换模型和参数共享模型相结合使用。形式上,我们创建一个集合,并迭代地将新对齐实体加入这个集合。对于每个对齐实体对
,我们定义映射
来计算可靠性得分:
其中是sigmoid**函数,
是一个超参数,满足
。可以观察到,可靠性函数对应语义距离
。
基于新对齐实体的可靠性函数,我们将软对齐的评分函数公式化为:
其中表示在该三元组上的损失。对于TransE和PTransE,我们有不同的U:在TransE中,
;在PTransE中,
。