图卷积神经网络GCN-在交通预测中考虑网络拓扑 STGCN-A Deep Learning Framework for Traffic

论文:Spatio-Temporal Graph Convolutional Networks A Deep Learning Framework
for Traffic
出处:IJCAI 2018

大体思路:使用Kipf & Welling
2017的近似谱图卷积得到的图卷积作为空间上的卷积操作,时间上使用一维卷积对所有顶点进行卷积,两者交替进行,组成了时空卷积块,在加州PeMS和北京市的两个数据集上做了验证。但是图的构建方法并不是基于实际路网,而是通过数学方法构建了一个基于距离关系的网络。原文链接:Spatio-Temporal
Graph Convolutional Networks: A Deep Learning Framework for Traffic
Forecasting

具体内容解释[转]:****博客

核心思想:模型融合+时空特征提取+全卷积模块

RELATED WORK:

[Wu and Tan, 2016] Yuankai Wu and Huachun Tan. Shortterm traffic flow forecasting with spatial-temporal correlation in a hybrid deep learning framework. arXiv preprint arXiv:1612.01022, 2016.

[Shi et al., 2015] Xingjian Shi, Zhourong Chen, Hao Wang, Dit-Yan Yeung, Wai-Kin Wong, and Wang-chun Woo. Convolutional lstm network: A machine learning approach for precipitation nowcasting. In NIPS, pages 802–810, 2015.

使用RNN/LSTM的缺陷:需要迭代训练,逐步引入了错误累积,同时加大了训练难度。

在该论文中提出了一种新的深度学习结构,时空图卷积网络,用于交通预测任务。该体系结构由多个时空卷积块组成,时空卷积块由图卷积层和卷积序列学习层组合而成(参考论文Convolutional neural networks on graphs with fast localized spectral filtering),对时空依赖关系进行建模。这是第一次使用图卷积神经网络结构进行交通预测。

图卷积神经网络GCN-在交通预测中考虑网络拓扑 STGCN-A Deep Learning Framework for Traffic

重点:抽取时间特征的门控卷积神经网络

时间卷积层包含了一个一维卷积,核的宽度为Kt,之后接了一个门控线性单元(GLU)作为**。对于图中的每个顶点,时间卷积对输入元素的Kt个邻居进行操作,不带填充,使得每次将序列长度缩短Kt-1。

因此,输入(每个节点)可被描述为长度为M,通道数为Ci(这里Ci=1)的序列。输入Y∈R^(M* Ci)。
卷积核:
ΓRKt×Ci×2Co\varGamma \in \mathbb{R}^{K_t\times C_i \times 2C_o}

作用:将输入Y映射到一维输出。

卷积公式:

ΓτY=Pσ(Q)R(MKt+1)×Co\varGamma *_\tau Y = P\odot \sigma(Q)\in \mathbb{R}^{(M-K_t+1)\times C_o}

其中P、Q分别是GLU中门的输入,⊙表示逐元素的Hadmard乘积。sigmoid门σ控制当前状态的那个输入对于发现时间序列中的组成结构和动态方差是相关的。

相似地,通过将卷积核应用到图中所有节点,可以将时间卷积扩展到3维。

句子建模之门控CNN

重点:时空卷积块

vl+1=ΓτReLU(ΘlG(Γ0lτvl))v^{l+1}=\Gamma*_\tau ReLU(\Theta^l*_\mathcal{G}(\Gamma_0^l*_\tau v^l))

使用L2损失来衡量效果。
图卷积神经网络GCN-在交通预测中考虑网络拓扑 STGCN-A Deep Learning Framework for Traffic

  • STGCN是处理结构化时间序列的通用框架。
  • 时空块结合了图卷积和门控时间卷积,可以提取最有用的时空特征。
  • 该模型完全由卷积结构构成,因此实现了输入的并行化,参数更少,训练速度更快。

其他细节内容见论文。