任务三:面向中文电子病历的医疗实体及事件抽取

任务记录:2020.03.21导师让了解任务三
本任务是CCKS围绕中文电子病历语义化开展的系列评测的一个延续,在CCKS 2017,2018, 2019相关评测任务的基础上进行了延伸和拓展。

本任务包括两个子任务:
(1) 医疗命名实体识别:于给定的一组电子病历纯文本文档,识别并抽取出与医学临床相关的实体提及(entity mention),并将它们归类到预定义类别(pre-defined categories),比如疾病、治疗、检查检验等。
(2) 医疗事件抽取:本任务为中文病历医疗事件抽取任务,即给定主实体为肿瘤的电子病历文本数据,定义肿瘤事件的若干属性,如肿瘤大小,肿瘤原发部位等,识别并抽取事件及属性,进行文本结构化。


1.关于实体识别

待整理…

2.关于事件抽取

事件抽取可以分为预定义事件抽取和开放域事件抽取,行业知识图谱中主要为预定义事件抽取。

采用模式匹配方法,包括三个步骤:

①准备事件触发词表
②候选事件抽取:寻找含有触发词的句子
③事件元素识别:根据事件模版抽取相应的元素
任务三:面向中文电子病历的医疗实体及事件抽取
多策略学习方法示例:
任务三:面向中文电子病历的医疗实体及事件抽取
任务三:面向中文电子病历的医疗实体及事件抽取