Relational retrieval using a combination of path-constrained random walks

Relational retrieval using a combination of path-constrained random walks


Written by title date
zhengchu1994 Relational retrieval using a combination of path-constrained random walks 2018-5-22 07:12:55

(提出的算法)PRRW:核心思想是利用连接两个实体的路径去预测他们之间是否有潜在的关系。

定义

  • An Entity-Relation graph G=(T,E,R), is
    • a set of entities types T={T}
    • a set of entities E={e}, Each entity is typed with TT
    • a set of relations R={R}
  • input:查询节点(query nodes)和指定返回的类型(answer type)。
  • output:返回指定类型下,排好序(ordered by proximity to the query nodes)的节点。
  • R:是二元关系,R(e,e) 表示实体ee 之间存在关系R
  • R(e){e:R(e,e)},即和e存在关系R的所有实体集合。
  • dom(R) :关系R 的值域。
  • range(R):关系R 的排名。
  • P:查询下给出的关系路径P={R1R2...Rl},约束是
    i:1<i<l1range(Ri)=dom(Ri+1),定义dom(R1)=dom(P)range(Rl)=range(P)

则对于路径P={R1R2...Rl}

T0R1...Rl...Tl

T0=dom(R1)=dom(P)T1=range(R1)=dom(R2) 等。

  • Path Constrained Random Walk

    • Given a query q=(Eq,Tq)
    • Recursively define a distribution for each path:
  • P是empty path:

    (1)hs,P(e)={1, if e=s 0,otherwise

  • P是nonempty:

    (2)hs,P(e)=erange(P)hs,P(e)P(e|e;Rl)

    这里的P(e|e;Rl)=Rl(e,e)|Rl(e,)| 是给定Rle ,一步随机游走到e的概率。

    1. 这里的s是查询的节点,e是返回的最终节点。
  • 路径特征(path feature):把查询到的se 之间的各个路径P1,...,Pn ,即 hs,Pi(e) 都作为特征,整个查询的得分是:

    (3)score(e;s)=PPlhs,P(e)θP

    这里的 Pl 是长度小于l的关系路径集合。

    1. 给出关系集合 R 和节点对集合 {(si,ti)} ,构造训练集 D={(xi,ri)} ;
      其中 xi(si,ti) (查询节点,返回终点)的全部路径和一起的向量,比如xi的第j 个标量是 hsi,Pj(ti) ,ri 表示关系 R(si,ti) 是否为真。

    2. 目标函数:

      (4)O(θ)=ioi(θ)λ|θ|1λ2|θ|2,

(5)oi(θ)=wi[rilnpi+(1yi)In(1pi)]

这里的pi 是预测相关性:

(6)p(ri=1|xi;θ)=exp(θTxi)1+exp(θTxi)

wi 衡量每个样本的重要性程度

  • 待补充:Low-Variance Sampling(LVS),附加查询限制条件,只为保证只有小部分负样本被用在目标函数的优化中。原因是KB中的关系类型很多,即时限制路径长度,得到的关系路径还是巨大且无用。

实践

在已有知识库如NELL上做预测,48条关系,对每个关系做给定x预测y,正反预测共96个任务,训练集是
$$ each \ node \ x \ has \ relation\ R_i\ in \ KB \xrightarrow{R_i}any\ node \ y \$$
* $y$是正样本:如果$y$在KB中已经满足$R(x,y)$,
* $y$是负样本:不在上面都是负样本。

实验

结论

参考

http://www.cbdio.com/BigData/2016-08/30/content_5224578.htm
https://wenku.baidu.com/view/ddca21030166f5335a8102d276a20029bd64636e.html
《Relational retrieval using a combination of path-constrained random walks》
《Random Walk Inference and Learning in A Large Scale Knowledge Base》