每天一篇论文 271/365 Effificient Epileptic Seizure Prediction Based on Deep Learning
新闻
新的人工智能系统近乎完美的预测癫痫发作
A.摘要
癫痫是世界上最常见的神经系统疾病之一。癫痫发作的早期预测对癫痫患者的生活有很大的影响。本文提出了一种新的基于深度学习的患者特异性癫痫发作预测技术,并将其应用于长期头皮脑电图记录中。其目的是准确检测发作前的脑状态,并尽早将其与流行的发作间期状态区分开来,使之适合实时性。特征提取和分类过程被组合成一个单一的自动化系统。将未经预处理的原始脑电信号作为输入,进一步减少了计算量。提出了四种深度学习模型来提取最具鉴别能力的特征,提高了分类精度和预测时间。该方法利用卷积神经网络从不同的头皮位置提取显著的空间特征,利用递归神经网络比现有方法更早地预测癫痫发作的发生率。提出了一种基于迁移学习技术的半监督优化方法。提出了一种信道选择算法来选择最相关的EEG信道,使系统具有很好的实时性。采用了一种有效的测试方法来保证系统的鲁棒性。该方法的最高准确度为99.6%,最低误报率为0.004h-1,同时具有1h的早期癫痫发作预测时间,是目前最有效的方法。
B.引言
由于癫痫发作的时间不可预料,它具有很强的心理和社会效应,而且可以被认为是一种危及生命的疾病。因此,癫痫发作的预测将在许多方面对提高癫痫患者的生活质量有很大的帮助,如在癫痫发作前发出警报,为癫痫患者提供足够的时间采取适当的行动,发展新的治疗方法和制定新的策略,以更好地了解疾病的性质。根据以上对癫痫患者脑活动的分类,癫痫预测问题可以看作是发作前和发作间期脑状态之间的分类任务。 如图1所示,当检测到主要发作间期状态中的发作前状态时,发出警报,指示潜在的癫痫发作即将到来。预测时间是癫痫发作前检测到发作前状态的时间。
现有的研究问题
1.针对特定病人的特定数据集作为监督数据集
2.以往研究针找到特定发作的脑电特征,并以此特征对对脑电信号进行分类
3.针对以前的特征提取分析然后分类,需要对人工设定特征信号,并且提取分析信号需要很多时间和计算资源,不能够达到实时,本文提出一种输入原始脑电信号,将特征提取和分类结合在一起的,自动辨识系统网路。
文献中提出了多种方法来解决癫痫预测问题,试图通过早期预测达到较高的分类精度。由于癫痫发作类型和位置的不同,患者的脑电图信号也不同[4],因此大多数癫痫发作预测方法都是针对患者的。在这些方法中,监督学习技术主要分为两个阶段:特征提取和前庭状态与间庭状态的分类。在文献[5]中,作者将特征提取方案分为单变量和二变量,并将线性和非线性多个特征结合起来,以获取最终导致维数增加的大脑动力学。提取的特征用于训练分类器,然后用于分析新的EEG记录,通过检测发作前的状态来预测发作的发生。
在以往的研究中,提取的特征主要分为三类:时域、频域和非线性特征。文献[6]中的作者使用了一些统计指标,如方差、偏度和峰度作为时域特征。在文献[7]中,作者计算了用于频域分析的脑电信号的谱功率。研究了由动态系统理论导出的一些非线性特征,如Lyapunov指数[8]和动态相似指数[9]。基于所选择的特征,实现了一种检测前庭脑状态的预测方案。以往的研究大多提出了基于机器学习的预测方法,如支持向量机(SVM)。支持向量机分类器在许多研究中被用来预测癫痫发作,如[7]、[10]、[11]。支持向量机在特异性和敏感性方面均优于其他类型的分类器[5]。
深度学习算法在计算机视觉和语音识别等多种应用领域的多分类问题中取得了巨大的成功。以往的一些工作是在分类阶段利用深度学习来解决癫痫预测问题。在文献[12]中,作者将多层感知器应用于提取的特征。在[13]和[14]中,作者使用了卷积神经网络作为一种分类器,用于从脑电数据中提取特征来预测癫痫发作。以前提出的方法的主要挑战是确定最能代表每一类的最具鉴别能力的特征。提取这些特征所需的计算时间取决于过程复杂性,并且被认为是另一个挑战,特别是在实时应用中。
基于这些挑战和早期准确的癫痫预测的重要性,我们开发了基于深度学习的癫痫预测算法,将特征提取和分类阶段结合到一个单一的自动化框架中。在本文中,我们的目标是通过开发不需要任何预处理的基于深度学习的算法来自动提取最重要的特征。将多层感知器作为一个简单的可训练隐层结构应用于原始脑电记录中,然后利用深卷积神经网络(DCNN)学习发作间期和发作前状态的空间分辨特征。在另一个模型中,双向长短期记忆(Bi LSTM)递归神经网络被连接到DCNN中来完成分类任务。提出了一种基于自动编码器(AE)的半监督模型,并利用传递学习技术对模型进行了预训练,提高了模型的优化和收敛速度。为了使系统适合于实时使用,应该考虑计算复杂度,因此,我们引入了一种信道选择算法来从多通道EEG记录中选择最佳表示信道。
C.本文提出的方法
为了使用DCNN,脑电数据用一个矩阵表示,其中一个维度是通道数,另一个维度是时间步长。
本文提出了四种基于深度学习的模型,以期在考虑实时操作的前提下,实现早期准确的癫痫发作预测。癫痫预测问题被描述为发作间期和发作前脑状态之间的分类任务,其中当在如图1所示的预定发作前期间内检测到发作前状态时,考虑真实警报。尽管在癫痫发作预测方面做了大量的研究工作,但对于前庭状态没有标准的持续时间。
在我们的实验中,发作前时间选择在发作前1小时,发作间期选择在发作前或发作后至少4小时,如[15]。未经任何预处理和手工提取特征的原始脑电数据被用作所有模型的输入。利用深度学习算法对识别特征进行自动学习,以减少系统开销,加快分类速度。由于每个病人的癫痫发作次数有限,发作前和发作间的样本之间存在不平衡。很明显,间歇样本的数量远远大于间歇样本的数量,分类器倾向于对训练样本数量较大的类更准确[16]。在我们的实验中,我们选择发作间期样本数等于发作前样本数,以使数据平衡。将脑电信号分成不重叠的5秒段,每一段作为训练批。
在我们的第一个模型中,多层感知器(Multi-layer Perceptron,MLP)是一个简单的深层神经网络,它通过训练选定的患者来学习能够完成分类任务的网络参数。模型的框图如图2所示。为了提高分类精度,我们提出了基于深度卷积神经网络(DCNN)的第二种模型,该模型从不同电极位置提取空间特征,并使用MLP进行分类,如图3所示。
第一种
第二种
在文[17]提出的第三个模型中,DCNN被用作模型后端,并与双向长短期存储器(Bi LSTM)网络连接,以进行如图4所示的分类。LSTM网络以其在学习时间特征的同时保持有助于早期预测的长时间序列依赖性而闻名。使用Bi LSTM可以更好地处理预测问题,因为它使用来自上一次和下一次实例的信息。为了减少训练时间,我们开发了第四个模型来实现深度卷积自动编码器(DCAE)架构。在DCAE中,我们以无监督的方式预先训练模型前端DCNN。然后,在训练过程中引入一些初始值,帮助网络更快地收敛,增强网络优化,从而减少训练时间,提高精度。转移学习方法用于训练DCAE,以提高同一患者在不同癫痫发作之间的泛化能力。
第三第四
在对AE进行训练后,将训练好的编码器连接到Bi LSTM网络进行分类图5示出了DCAE模型的两部分。我们提出了一种信道选择算法来减少EEG信道的数目,从而连续降低计算复杂度并分配存储器,使得系统适合于实时应用。
第三、四
实验对象选择
波士顿儿童医院[18],[19]已公开[20]。该数据集由22名儿童难治性癫痫患者的长期头皮脑电图数据和一份缺失数据记录组成。这些记录是在抗癫痫药物停药后的几天内进行的,以描述其癫痫发作的特征,并评估其是否适合手术治疗。根据国际10-20系统,大多数病例的脑电图记录来自23个通道的表面电极。采集的脑电信号采样率为256个采样/秒,16位分辨率。各受试者在许多因素上都存在差异,如发作间期、发作前期、通道数和记录连续性。因此,本研究选择了8个受试者,以满足前庭间期和前庭间期的要求,不中断录音,并提供全频道录音。表一总结了我们实验中使用的脑电图记录的细节。
D.本文提出网络结构详解
1.多层感知器
多层感知器(MLP)被认为是应用最广泛的人工神经网络(ANN)之一。MLP通常由三个连续的层组成,称为:输入层、隐藏层和输出层[21]。
深度ANN由多个隐藏层组成,使网络能够更好地利用非线性**函数学习特征。人工神经网络的思想是由人脑神经系统的结构所驱动的。典型的人工神经网络是由被称为神经元的连接单元组成的。这些人工神经元将接收到的数据整合起来,并将其传输给其他相关神经元,就像大脑中的生物神经元一样。任何神经网络中的神经元输出都是通过对前一层神经元输出的加权和应用线性或非线性**函数来计算的。当神经网络用作分类器时,在输出层的最终输出指示相应输入数据的适当预测类别。
本文的网络从第一个隐藏层到第四个隐藏层,每层的单位数分别为300、100、50、20。训练参数总数为8870291,由于采用全连接架构,因此被认为是较高的。利用反向传播对模型进行训练,利用RMSprop算法对模型进行优化。使用的损失函数是由熵定义的二元交叉熵 :
2.深度卷积网络
卷积神经网络(CNNs)在不同的模式识别和计算机视觉应用中取得了巨大的成功。这是因为CNN能够自动从原始数据中提取最能代表数据的重要空间特征,而无需任何预处理,也无需人工选择这些特征。
典型的CNN由三种层组成:卷积层、池层和全连接层。卷积层用于通过对输入数据应用具有可训练权重的滤波器来生成特征映射。然后,通过应用汇集层来降低该特征映射以减少特征的维数,从而降低计算复杂度。最后,将全连通层应用于前一层的所有输出,生成一维特征向量。CNN被用作特征抽取器,以取代以往工作中使用的复杂特征工程。
我们选择每个卷积层的核数为32,核大小为3×2,以覆盖脑电数据的非平方矩阵。最大池层的池尺寸为2×2。RELU**函数用于所有卷积层。
3.双向LSTM递归神经网络(有短时记忆功能的网络)
长短期存储器网络(LSTMs)[27]是一种RNN,其实现是为了克服基本RNN的问题。LSTMs能够通过保持训练过程中的梯度值来解决梯度消失的问题,并通过层和时间进行反向传播,从而具有学习长期依赖关系的能力。
在前向传递块中,从DCNN的第一次实例开始到最后处理从DCNN生成的特征向量,而后向传递块以相反的顺序处理同一段。
每个时间步的网络输出是该时间步的两个块的组合输出。除了标准LSTM中的前一个上下文处理外,bilstm还处理未来的上下文,从而提高预测结果。利用Bi LSTM作为分类器,除了DCNN提取的空间特征外,还提取了重要的时间特征,提高了预测精度。
4.深度卷积自动编码Deep Convolutional Autoencoder
自编码(AEs)是一种无监督的神经网络,其目标是寻找输入数据的低维表示。AE网络主要由编码器和解码器两部分组成。编码器将高维输入数据压缩成低维表示,称为潜在空间表示或瓶颈,解码器将数据恢复到原始维。简单的AE使用完全连接的层作为编码器和解码器。其目的是学习表示原始数据和检索数据之间差异的最小代价函数的参数。深卷积自动编码器(DCAE)用卷积层代替了简单AE中的全连通层。
5.训练方法
为了克服数据集不平衡的问题,我们选择了在训练过程中,间隔段的数量等于间隔段的可用数量。从整个发作间期样本中随机选择发作间期段。为了保证所提出模型的稳健性和通用性,我们使用漏掉一次交叉验证(LOOCV)技术作为所有所提出模型的评估方法。在LOOCV中,训练分N次进行,其中N是特定患者的癫痫发作次数。每一次,所有的癫痫发作都参与训练过程,除了一次进行测试的癫痫发作。然后通过改变受试者的癫痫发作来重复这个过程。通过使用这种方法,我们确保测试覆盖了所有的癫痫发作,并且测试的癫痫发作在训练期间是看不见的。一个病人的表现是N个试验的平均值,而整体表现是所有病人的平均值。