NRE论文总结：Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification

数据集详情

SemEval-2010 Task 8 dataset

blstm+attention机制，使用BLSTM对句子建模，并使用word级别的attention机制。

此论文所使用的方法F1值可以达到84.0，目前所有方法中最高的F1值为84.3（BLSTM (Zhang et al., 2015)），但此方法的缺陷是需要手动构造特征，而此论文是把数据灌入模型，不需要手动提特征。

论文对lstm正反向结果的处理（即上文中的第三步）
和之前直接把lstm的最终正反向输出直接拼接相比，作者这里是把每一个单词的前馈输出与反馈输出逐个元素求和得到的向量作为最后的输出，关于这一块文中并没有给出具体解释。
Attention机制中权重的处理
和随机初始化不同的是，本论文中的权重和lstm层的输出有关，文中没有具体解释这样做的原因。

没有找到论文的源码，从github找到一份类似思想的脚本进行调试，脚本调试过程。

论文理解的不透，代码也处于很弱的阶段，且行且珍惜，祝自己保持初心！