《Selective Expression For Event Coreference Resolution on Twitter》阅读笔记

这篇文章来自IJCNN 2019: 1-8,其研究的问题是基于社交媒体数据的事件共指消解任务,并提出了相应的数据集(ECT)。ECT数据集上标注了event mention以及event trigger之间的共指关系。作者使用的方法架构如下图所示:
《Selective Expression For Event Coreference Resolution on Twitter》阅读笔记
模型输入的基本特征包括基于BiLSTM得到的sentence level feature和mention level feature。

在此基础上,作者认为在同一个句子中,对于特定事件触发词trigger,不同单词的“地位”不一样(core word或者confusing word),有的重要,不要不重要,融入重要单词的特征有助于触发词的消解。因此,作者提出了selective expression来融入重要单词的特征。具体实现上,作者用trigger的mention level feature与句子中每个单词相乘,然后使用全连接层来计算出一个权重,最后将计算出的权重分别与原始sentence level feature相乘,从而得到句子相对于该trigger的selective expression。
《Selective Expression For Event Coreference Resolution on Twitter》阅读笔记
《Selective Expression For Event Coreference Resolution on Twitter》阅读笔记
然后,考虑到在一个句子包含多个event mention的时候,同一单词对于不同event的语义表达的重要性并不一样。因此,作者在selective expression的基础上又应用注意力机制来计算不同word的selective expression对于特定event的重要性,然后加权求和得到最终的latent feature。最后,基于latent feature进行二分类。
《Selective Expression For Event Coreference Resolution on Twitter》阅读笔记
最后,作者的实验证明Selective expression有利于过滤句子中不重要或者不相关的单词,使模型关注重要信息,但selective expression的结果仍然需要通过注意力机制来进一步优化。