图卷积学习一

一、为什么使用图卷积

传动的深度学习方法,比如卷积网络,效果很好,但是它研究的对象是Euclidean data,这种数据的特征就是有规则的空间结构,比如图片是规则的正方形格子,比如语音是规则的一维序列。这些数据结构能用一维、二维矩阵表示,卷积神经网络处理起来很高效。
但是,现实中有很多数据没有规则的空间结构,称为Non Euclidean data。比如推荐系统抽出的图谱。图谱结构的每个节点连接不一定相同,有的节点有两个连接,有的有三个,是不规则的数据结构。

二、图的特征

  1. 每个节点都有之间的特征信息
  2. 图谱中每个节点还具有结构信息

在图数据中,我们要同时考虑到节点的特征信息和结构信息,而用来自动化的学习图的特征信息和结构信息的一种方式就是,图卷积神经网络。

三、什么是图卷积神经网络

图卷积神经网络(Graph Convolutional Network)是一种能对图数据进行深度学习的方法。
图卷积算子:
图卷积学习一
如何理解图卷积算法?

  1. 发射(send):每个节点将自身的特征信息经过变换后发送给邻居节点。这一步是在对节点的特征信息进行抽取变换。
  2. 接收(receive):每个节点将邻居节点的特征信息聚合起来。这一步是在对节点的局部结构信息进行融合。
  3. 变换(transform):把前面的信息聚集之后做非线性变换,增加模型的表达能力。

图卷积神经网络具有卷积神经网络的以下性质:

  1. 局部参数共享,算子适用于每个节点,处处共享。
  2. 感受域正比于层数,一层包含邻居,二层包含邻居的邻居。层数越多,感受域越广,参与运算的信息越多。

GCN模型同样具备深度学习的三种性质:

  1. 层级结构(特征一层一层抽取,一层比一层更抽象,更高级)
  2. 非线性变换 (增加模型的表达能力)
  3. 端对端训练(不需要再去定义任何规则,只需要给图的节点一个标记,让模型自己学习,融合特征信息和结构信息。)

图在现实世界中的应用
图卷积学习一
社交网络:
1、推荐用户可能感兴趣的人
2、推荐用户可能感兴趣的帖子或者内容
3、社群发现(通过用户社交关系网络挖掘群体结构)
4、用户画像(地点、兴趣、关系网络)
图卷积学习一
评分系统:
分析比如哪些用户可能对啤酒感兴趣,哪些用户可能对尿布感兴趣,从而实现商品推荐。
还可以实现评分清洗,建模用户的公平度、商品的良心度、评分的可信度,按照一定的规则迭代更新这三个值,从而分析商品的优劣或者区分恶意用户。例如上图中的用户f,很大可能就是恶意评价用户。
图卷积学习一
推荐系统:
比如沿着用户-歌曲-曲风-歌曲这个路径是推荐用户喜欢的曲风下的其他歌曲;沿着用户-年代-歌曲-歌手是推荐活跃在用户出生年代的歌手的歌曲(可能是用户小时候听过的歌,俗称回忆杀系列),这些就是可解释的推荐。