《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

本文提出了一种名叫LightNet的模型用于对雷电进行预测。通过数值天气预报系统(NWP)计数出参数,对参数进行编码,同时通过对观测图像也进行编码,其目的是校准参数编码并协助预测,对两个编码后的输出进行融合,在进行编码,最后得到需要的结果。实验证明LightNet效果优于传统气象方法和单纯的ConvLSTM。

研究目的

严重的雷电现象通常会对人类活动产生危害,因此对雷电现象的预测就显得至关重要。现存的预测方法都是基于数值天气预报系统,但这些方法都存在两个缺点:

1.基于数值天气预报的模型仿真时会在空间和时间领域上造成偏差,这就会对后续的参数化处理造成无法弥补的偏差。

2.关于雷电的参数化方案都是由专家们手动设计的,而没有利用历史信息。

因此,在本文中,作者提出了一种数据驱动的神经网络模型LightNet。LightNet不仅建立在数值天气模型上,还引入了近期雷电观测,从这两部分提取时空特征。本文的贡献在于:

1.提出了数据驱动的LightNet模型。这个模型的效果要优于现存的那些无法利用历史信息的模型。

2.引入了双编码器用于提取基于仿真和基于预测的特征。

3.通过融合模型将仿真编码器和预测编码器的特征结合。(结果证明这点有效的抵抗了仿真中的偏差)

4.通过中国南边的雷电数据集实现了三方面的提高。

实验相关

作者引用了其他几种基于深度学习的预测模型,在下文中会将LightNet同这几种模型进行对比,这里对这几个模型进行一个简单的介绍:

3D ConvNet:将传统的仅在空间上滑动的二维卷积扩展到空间和时间上都移动的三维卷积。

PredCNN:设计了一个级联乘法单元,并通过一个完全基于CNN的体系结构来建模下一帧和时空输入之间的依赖关系。

DCRNN:将交通流建模为有向图上的扩散过程,并引入扩散卷积RNN进行交通预测

StepDeep:将移动物体预测问题定义为一个时空任务,然后设计一个时空进程单元来处理。

模型框架

模型的框架如下图所示:

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

传统的方法具体流程:首先通过历史天气收集的数据对数值天气预测系统进行初始化,在初始化之后,这个系统能够仿真和计算出未来的天气的状况。仿真后有一个网格结构,其中每个网格表示一个空间局部区域。最后,利用闪电参数化方案,将仿真转换为闪电预报。

在本文的LightNet中,作者还引入了最新的雷电观测观测数据。但由于NWP无法直接吸收观测数据并进行自更正,因此需要LightNet Model对仿真数据进行校验并协助预测。

实验相关

在雷电预测中,需要用到以下的几个数据:

It:冰混合比

St:雪混合比

Gt:霰混合比

Rt:雷达反射率

(以上四种数据在空间上都是三维的——经度、纬度和高度,在时间上是一维)

Vt:最大垂直速度

(在空间上是二维的——经度和纬度,时间上是一维的)

Lt:观测数值

Pt:仿真数组

问题定义:

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

损失函数:

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

训练细节:

作者采用了Adam梯度下降算法,学习率设置为0.0001,并不设置失活。将模型训练50个周期,并挑选出损失函数最小的模型。

模型结构

作者引入了ConvLSTM作为模型的骨架,(ConvLSTM详见施行健2015年的论文)接下来具体讲述一下这个预测模型。

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

这个模型主要分为四部分:WRF编码器,Obs编码器,融合模型和预测解码器。

WRF编码器

Pt的值是通过对雪混合比,冰混合比,霰混合比,雷达反射率和最大垂直速度在z方向的叠加得到。但这样做会造成空间冗余,因此引入了带ReLU**函数的卷积层以减少空间分辨率。

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

之后将经过**函数的Pt送入ConvLSTM来获取WRF特征张量:

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

Obs编码器

观测编码器从最近s个时段的观测图中提取出信息,在这部分同样采用了卷积层来减少水平分辨率。过程均与WRF相同。

融合模型

WRF仿真数据能够提供长期的天气信息,但易造成空间和时间上的偏差。观测数据能够提供短期的预测,但其效果随着时间的增长而弱化。因此作者引入了融合模型以提高短期的预测和长期的仿真——通过将WRF特征和观测特征融合:

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

预测模型

预测模型接受融合模型输出的特征,并进行预测。以图中模型为例,预测模型会运行t个时间步,并给出0-t时间段的预测。

实验结果

作者通过将LightNet同7种方法(PR92,LF1,LF2,GBDT,StepDeep,只含有WRF编码器的LightNet-W,只含有obs编码器的LightNet-O)进行对比来凸显其效果。评价指标为POD,FAR和ETS。作者在Strict Metric的基础上,又提出了Neighb-Based Metric,即同时考虑半径为r范围内的TP、FP、FN和TN。

《LightNet:A Dual Spatiotemporal Encoder Network Model for Lighting Prediction》论文解读

从实验结果中可以看出三种气象的方法与数据驱动的方法相比效果要差得多。在数据驱动的方法中,短期内LightNet-O和LightNet效果相近,StepDeep也同样具有竞争力,而另外两种方法效果并不好。而从长期的结果来看,LightNet在POD这一项指标上效果要明显优于其他办法。

作者之后又将LightNet-O,LightNet和StepDeep进行对比,得出以下结论:

1.所有方法在1小时预测上都表现得很好,这得益于最后一小时的观测数据。

2.StepDeep在最后三小时的预测中更倾向于预测没有雷电的情况。

3.从最后几个小时看,LightNet-O较LightNet也更倾向于预测没有雷电的情况,这是因为观测数据没有提供关于雷电发展的充足信息。

4.LightNet捕获了合适雷电出现的区域,得益于WRF数据提供的信息。

最后,作者又将LightNet-O,LightNet-W和LightNet相比较,得出了结合WRF仿真数据和观测数据的必要性。

在接下来的工作中,作者计划继续提高天气预测的质量和进一步预测雷电的强度,并将预测时间从6小时延伸至12小时。除此之外,希望能将该模型推广到其他领域。