1.DCNN框架

DCNN以节点的特征矩阵以及节点的概率转移矩阵（可以认为是结构矩阵）为输入，然后以每个节点为中心，将不同的跳（hop）上的节点信息进行聚合，得到前 $H$ 跳的聚合向量，构成节点的扩散表示 $Z_t(i,:,:)\in R^{H\times F}$ ，所有节点的扩散表示组成张量 $Z_t\in R^{N_t\times H\times F}$ 。对节点（图）的分类任务就是将扩散表示直接送入全连接网络，通过softmax函数得到各类的分类概率。下图是DCNN的实现节点分类和图分类的流程图。
《Diffusion-Convolutional Neural Networks》论文理解

2.扩散卷积表示

$A_t$ 表示图的邻接矩阵， $P_t$ 表示度归一化转移矩阵， $(P_t)_{ij}$ 表示由节点 $i$ 转移到 $j$ 的概率，可以由 $A_t$ 计算得到，可以认为是权重矩阵。 $A_t$ 矩阵有一个性质： $A_t$ 矩阵的幂级数 $A^n_t$ 中的一个元素 $(A^n_t)_{ij}$ ，表示节点 $i$ 到节点 $j$ 长度为 $n$ 的游走(英文为 $walk$ )的数量，当不存在这样的游走时，该值为0，之后将该矩阵归一化后，就可以表示长度为 $n$ 时，节点 $i$ 转移到 $j$ 的概率。这种性质对应与公式（1）：
$P^*_{tijk}=P^j_{tik}\tag1$

其中， $P^*_t\in R^{N_t\times H\times N_t}$ 表示由 $P_t$ 组成的幂级数； $i$ 表示节点 $i$ ； $j$ 表示跳(hop)为 $j$ ，也就是游走的长度为 $j$ ； $k$ 表示节点的第 $k$ 个特征。从公式（1）可以看出来， $P^*_t$ 的元素 $(P^*_t)_{ijk}$ 表示：游走长度为 $j$ 时，节点 $i$ 转移到节点 $k$ 的概率。

（1）节点的扩散卷积表示

扩散卷积表示为：
$Z_{tijm}=f(W_{jm}^c\cdot \sum_{l=1}^{N_t}{P^*_{tijl}X_{tlm}})\tag2$

其中， $m$ 表示所有节点的第 $m$ 个特征， $W_{jm}$ 表示权重， $Z_{tijm}$ 表示：以节点 $i$ 为中心，在第 $m$ 个特征上，游走长度为 $j$ 的节点信息的聚合值； $\sum_{l=1}^{N_t}{P^*_{tijl}X_{tlm}}$ 部分的意义是以概率方式对节点 $i$ 的 $j$ 跳节点的一个信息聚合, $f$ 为非线性**函数。
式（2）的张量表示形式为:
$Z_t=f(W^c\bigodot P^*_tX_t)\tag{3}$

其中， $\bigodot$ 表示逐元素相乘， $W^c \in R^{H\times F}$ ，为训练权重； $P^*_tX_t\in R^{N_t\times H\times F}$ 表示每个节点的各个跳 $[0,H-1]$ 的聚合信息；在计算 $W^c\bigodot P^*_tX_t$ ，存在广播机制，会将 $W^c$ 复制 $N_t$ 遍，然后逐元素相乘； $Z_t \in R^{N_t\times H\times F}$ 。

(2)图的扩散卷积表示

图的扩散卷积表示：
$Z_t=f(W^c\bigodot \frac{(1_{N_t})^TP^*_tX_t}{N_t})\tag{4}$

其中 $P^*_tX_t$ 的意义不变， $1_{N_t}\in R^{N_t\times 1}$ 表示将各个节点信息 $\in R^{H\times F}$ 聚合的权重；除以 $N_t$ 得到平均值。 $W^c$ 训练得到的加权权值。

3.分类任务

（1）节点分类

在得到节点的扩散卷积表示 $Z_t$ 之后，可以直接将 $Z_t$ 送入全连接层;
$P(Y|X)=softmax(f(W^dZ))\tag5$

其中，在送入全连接层之前需要将 $Z_t$ 展平，变成二维矩阵 $Z\in R^{N_t\times (HF)}$ ， $W^d\in R^{(HF)\times C}$ ， $C$ 表示分类种数。
论文中表达的公式为 $P(Y|X)=softmax(f(W^d\bigodot Z))$ 应该和公式（5）是一致的。

（2）图分类

图分类与节点分类的原理一致：
在得到图的扩散卷积表示 $Z_t$ 之后，可以直接将 $Z_t$ 送入全连接层;
$P(Y|X)=softmax(f(W^dZ))\tag6$

其中，在送入全连接层之前需要将 $Z_t$ 展平，变成一维向量 $Z\in R^{(HF\times 1)}$ ， $W^d\in R^{(HF)\times C}$ ， $C$ 表示分类种数。

《Diffusion-Convolutional Neural Networks》论文理解