小世界模型简介
小世界模型
“小世界现象”源于社会心理学家Stanley Milgram在20世纪60年代所做的试验。Milgram设计了一个实验,他在美国内布拉斯加州奥马哈市或者堪萨斯州戚奇托市,随机选取了一些用户,给在波士顿的日标用户送信。 只 有送信者和收信者之间非常熟悉才能直接将信送出。否则,送信者需要把信先发给那些有可能熟 知目标用户的人。 结果表明,这些信平均经过**5.5~6次**转手才能最终到达波士顿的目标用户手中。
提出的原因:
随机图模型正确模拟真实世界网络中的平均路径长度,但是低估了聚类系数。
为解决这个问题,Duncan J. Watts和Steven Strogatz 于1998年提出了小世界模型。
Watts D J , Strogatz S H . Collective dynamics of ‘small-world’ networks[J]. Nature, 1998.
小世界模型时介于规则格和随机图之间的一种模型,我们先来看一下规则格。
规则格的概念:
我们假设真实世界网络中有一个平等的模型,其中人们有相同数量的邻居(朋友)。
这显然也不现实,但可以更准确地模拟真实世界网络中的聚类系数。
在图理论中,这个假设等同于在一个规则网络中模拟这些个体。
规则格是规则网络的一种特殊形式,其中存在着一种特殊的规则对具有连接关系的结点进行排序。
在一个度是????的规则格中,结点与它们的前????/????个邻居和后????/????个邻居进行连接。
形式上,对于结点集合????={????_????,????_????,????_????,…,????_????},边存在于结点????_????和????_????之间,当且仅当????≤????????????(????−|(????−|????−????|,|????−????|)|)≤????/????.
缺点:
1.平均路径长度太长(约为????/????????);
2.聚类系数约为3/4,定值,不能根据真实网络世界的聚类系数进行调整。
请证明在规则格中邻居结点间的连接数量是3/8c(c-2) ,其中c是平均度。
此时,每个节点左右两边各有????/????个邻近节点,容易得到这些邻近节点间的连接数为
????????=????(????/????)[????/????-????]/????
于是对应的聚类系数
????(????)=????_????/[????(????-????)/????]*
=???? [????/????-????]/[????(????-????)] =(????(????−????))/(????(????−????))*
为解决随机图低估聚类系数的问题,提出的小世界模型就动态地位于规则格和随机网络之间。
在小世界模型中,我们假设参数????控制模型中的随机率。模型初始为规则格,继而以????的概率增加随机边。参数。
????≤????≤????代表了模型的随机性。
当????=????时,模型退回为规则格;
当????=????时,模型变为随机图。
根据????值,该网络拥有较高的聚类系数,同时有较短的平均路径长度,但度分布仍然不能与真实世界网络完全匹配。
由称为重链(rewiring)的步骤生成新边。——WS小世界模型
WS小世界模型的构造算法如下:
①从规则图开始:考虑一个含有N个节点的最近邻耦合网络,它们围成一个环,其中每个节点与它左右相邻的各c/2个节点相连,c是偶数。参数满足N>>c>>ln(N)>>1。
②随机化重连:以概率p随机地重新连接网络中的每条边,即将边的一个端点保持不变,而另一个端点取为网络中随机选择的一个节点。其中规定,任意两个不同的节点之间至多只能有一条边,且每个节点都不能有边与自身相连。这样就会产生pNc/2条长程的边把一个节点和远处的节点联系起来。
在上述模型中,p=0对应于完全规则网络,p=1则对应于完全随机网络,通过调节p值就可以控制从完全规则网络到完全随机网络的过渡,如下图所示。
[注意]p=1的情形下,算法得到的ws小世界模型与er随机图还是有很大的区别的,因为ws小世界模型中每一个节点的度至少为c/2,而在er随机图中对单个节点的度的最小值没有任何的限制。
最近邻耦合网络(对应????=????)是高度集聚的(????(????)≈????/????),但平均路径长度很大(????(????)≈????/????????>>????)。
当????较小时(????<????<<????),重新连线后得到的网络与原始的规则网络的局部属性差别不大,从而网络的聚类系数变化也不大(????(????)∝????(????),但其平均路径长度下降很快(????(????)<<????(????))。
这个结果是不难想象的:一方面,只要几条边的随机重连就足以减小网络的平均路径长度;另一方面,几条随机重连的边并不足以改变网络的局部集聚特性。
这类既具有较短的平均路径长度又具有较高的聚类系数的网络就是典型的小世界网络。
WS小世界模型构造算法中的随机化过程有可能破坏网络的连通性。因此,Newman和Watts稍后提出了NW小世界模型。
NW小世界模型是通过用“随机化加边”取代WS小世界模型构造中的“随机化重连”而得到的,具体构造算法如下:
①从规则图开始:考虑一个含有????个点的最近邻耦合网络,它们围成一个环,其中每个节点与它左右相邻的各????/????个节点相连,????是偶数。参数满足????>>????>>ln(????)>>????。
②随机化加边:以概率p在随机选取的一对节点之间加上一条边。其中,任意两个不同的节点之间至多只能有一条边(重边),并且每一个节点都不能有边与自身相连(自边)。
``
在NW小世界模型中,????=????对应于原来的最近邻耦合网络,????=????则对应于全局耦合网络,如下图所示。在理论分析上,NW小世界模型要比WS小世界模型简单一些。当????足够小和????足够大时,NW小世界模型本质上等同于WS小世界模型。
当????=????????,????=????,????=????.????(重连或加边概率)时程序生成的WS、NW小世界网络如下图所示。
在现实朋友关系网络中,小世界网络模型反映了如下一种特性:
大部分人的朋友都是和他们在一条街上的邻居或在同一单位工作的同事;
另一方面,也有些朋友住得较远,甚至远在异国他乡,这种情景对应于WS小世界模型中通过重连或在NW小世界模型中通过加入连线产生远程连接。
实际上,除了WS小世界模型和NW小世界模型,还有许多改进模型:加点,加边,去点,去边及不同形式的交叉,可产生多种形式的小世界模型。