空间分析:3-3.geoda计算莫兰指数
莫兰指数是一个地学统计概念,用来表示空间自相关性。
我们使用geoda来计算一下北京二手房的莫兰指数,看看它的空间自相关。
一、莫兰指数
莫兰指数是最常用的空间自相关指标,最早由统计学家莫兰提出,所以叫做莫兰指数,很好听的名字。
莫兰指数计算公式:
其中:
看着有点晕,没关系就是个统计公式,我们只需要知道通过这个公式能计算出来莫兰指数。
莫兰指数的取值范围是[-1,1]。
莫兰指数结果如果在0到1之间,则为正相关,表示具有相似属性的对象聚集在一起。
莫兰指数结果如果在-1到0之间,则为负相关,表示具有相异属性的对象聚集在一起。
莫兰指数结果如果接近于0,则为随机分布,不存在空间自相关。
二、p值和z值
p值和z值都是用来表明置信度的,如果p值很小,意味着所观测的空间模式不太可能是随机的。z值表示标准差的倍数,如果z很大或很小,也意味着所观测的空间模式,不太可能是随机的。z值和p值,都与标准正态分布相关联,用来表示统计显著性,既零假设为真的情况下,拒绝零假设所要承担的风险水平,换到莫兰指数这里,零假设既是空间随机分布。
下图是一个显著性的正态分布。
把p值和z值与莫兰指数关联上,就是空间自相关性的置信度。
下表是z值、p值与置信度的关系。
三、geoda计算莫兰指数
1.打开shp文件。
我的shp文件是bjfy.shp。
打开——连接数据源——ERSI Shapefile,Choose a spatial file to open,打开shp文件即可。
2.空间权重设置
工具——空间权重管理,打开空间权重管理。
首先点击“创建”。
然后在创建空间权重文件对话框中点击添加ID变量。
然后在添加新ID变量中,现有变量中选择field_8,这个字段存的是单价。
然后 点击添加变量。
返回到创建空间权重文件对话框,点击“创建”。
把gal文件保存到一个位置,即可。
如果提示“将重复的泰森多边形保存到表中”,点击确定既可以,因为的确有坐标重复的点。
我们创建空间权重,选择的是邻接空间权重,因为郊区的点肯定会稀疏,所以基于距离的空间权重不太合适。
3.计算莫兰指数
最简单的莫兰指数。
菜单栏空间分析——单变量 Moran’s I。
变量设置中,第一变量选择POLY_ID,就是我们刚才用房源单价filed_8这个字段构建的空间权重。
空间权重文件是bjfy.gal,就是我们刚才保存的空间权重文件。
点击确定即可。
4.莫兰指数结果
莫兰指数为0.997,且成线性。
这就能看出来,房价是呈现空间自相关性的,既有相似属性的对象在空间上是聚在一起的,房价高的聚在一起,房价低的聚在一起。
5.随机化
随机化主要是为了对比显著性的。
在Moran’s I(bjfy):POLY ID窗口,右键,选择随机化——99次置换。
结果如下:
999次置换,结果如下:
通常情况下,999次置换的结果要比99次置换的结果可靠。
我们可以看到999次置换生成的pseudo p-value是0.001,这个值的计算方式是1/(permutations+1)。
E[I]=-1/(n-1),n是数据集中的观测值,我的对象数量是34717,这个在空间权重管理界面上能看到。
mean是参考分布的平均值。
sd是参考解析的标准偏差。
z-value是标准差的倍数。
看着似乎有点晕,但是我们看这个很大的z值,就可以确定,我们的莫兰指数计算结果是强烈拒绝零假设的,既强烈拒绝随机分布。
结论就是0.997的全局莫兰指数,和901.8945的z值,证明至少有99%的可能,北京二手房的单价是有空间正相关的。
四、总结
Geoda其实不难用,比较麻烦的是莫兰指数和p值、z值理解起来稍稍有点绕。