【论文阅读笔记】Automatically Detecting Hypoglycemia Events from Electronic Health Record Notes

本文发表在Machine Learning for Health (ML4H) Workshop at NeurIPS 2018,方法可以概述为word2Vec获取词向量+CNN获取定长句子向量+分类)

         研究表明,很多低血糖时间不是由ICD代码表示而是直接在EHR中描述。本文使用CNN对500份专家标注的EHR进行低血糖信息的 NLP方法检测。在10-fold交叉验证后得到的精度0.96,召回率0.86,F1分数0.91。

1.数据准备

由于低血糖可能是罕见事件[2,7因此,文中采用的方法是通过查询500份EHR中低血糖症ICD-9代码(251. *)和相关的糖尿病药物(例如胰岛素和二甲双胍),使用NLTK将每个病历切分为句子,请经验丰富的专家将每个句子注释为含有低血糖事件(阳性)或不含(阴性),如果出现描述任何与低血糖相关的诊断和症状(例如“患者具有低血糖水平”),则将该句子注释为阳性。

500个EHR共包含95,246个句子(平均每个EHR有190个句子,最少6个,最大912个),其中1,316个(3%)注释为阳性。平均句子长度是11.2(最少2和最多318)字。考虑到网络效率原因,裁剪了超过40个单词的句子。

2.方法

网络结构可以分为三个部分:

输入层输入句子并构造包含每个单词的嵌入矩阵。使用Word2Vec在非医领域及医学领域语料库中训练得到的100维的词向量初始化输入。

句子嵌入层从最后输入层的最后一层的变长嵌入矩阵中生成定长的句子向量。使用了三种模型:RNN、CNN、TCN,每种模型的句子向量长度均为300。

最后的输出层将句子映射为概率。

【论文阅读笔记】Automatically Detecting Hypoglycemia Events from Electronic Health Record Notes

3.结果

【论文阅读笔记】Automatically Detecting Hypoglycemia Events from Electronic Health Record Notes 

实验证明,CNN捕捉句子模式的效率比RNN模型高,TCN也是一个值得研究的方向。

4.局限性

数据集太小

检测还是主要针对文本型数据,对于数值型描述的血糖数据会出错

对于血糖描述是跨多个句子的情况还不准确。