[EMNLP2017]End-to-End Neural Relation Extraction with Global Optimization
我们首先了解该paper解决的问题,也就是任务:
句子级的实体识别和关系判断,针对Figure 1给出的一句话:Associated Press writer Patrick McDowell in Kuwait City 识别这句话中出现的识别,其实就是给句子打标签,在本在本文中,实体的标签表示如下:
B-
在识别完实体之后,针对识别出的实体进行两两关系判断,关系的标签类型如下:
下图给出了本文在做实体识别和关系抽取时最主要的流程:
仔细观察Figure 2的table的上半三角中每个表格,每个表格中都有数字,就是解析过程中每一步.表格的个数是
在解析的过程中,仍然是识别句子中所有的entity, 就是首先填充对角线,然后针对识别出的实体进行两两判断关系,但是本文用了beam search,在每一步都保留之前解析结果的top k个得分最好的,第i+1步时保留的top k个解析结果的排序已经发生了变化,而且重要的是,将实体识别序列和关系识别序列一起打分的,所以说是全局最优的.
打分函数如下:
部分填充的table:
根据公式(1)那么目前的问题是:如何用embedding表示
在上图的(a), (b)中的实体识别和关系判定的神经网络中都有一个
一个解析序列的得分就是
在选取特征时用了LSTM-Minus, 我觉得挺有意思的.