空间分析:3-3.geoda计算莫兰指数

 

莫兰指数是一个地学统计概念,用来表示空间自相关性。

我们使用geoda来计算一下北京二手房的莫兰指数,看看它的空间自相关。

一、莫兰指数

莫兰指数是最常用的空间自相关指标,最早由统计学家莫兰提出,所以叫做莫兰指数,很好听的名字。

莫兰指数计算公式:

空间分析:3-3.geoda计算莫兰指数

 

其中:

 

空间分析:3-3.geoda计算莫兰指数

空间分析:3-3.geoda计算莫兰指数

看着有点晕,没关系就是个统计公式,我们只需要知道通过这个公式能计算出来莫兰指数。

莫兰指数的取值范围是[-1,1]。

莫兰指数结果如果在0到1之间,则为正相关,表示具有相似属性的对象聚集在一起。

莫兰指数结果如果在-1到0之间,则为负相关,表示具有相异属性的对象聚集在一起。

莫兰指数结果如果接近于0,则为随机分布,不存在空间自相关。

 

二、p值和z值

p值和z值都是用来表明置信度的,如果p值很小,意味着所观测的空间模式不太可能是随机的。z值表示标准差的倍数,如果z很大或很小,也意味着所观测的空间模式,不太可能是随机的。z值和p值,都与标准正态分布相关联,用来表示统计显著性,既零假设为真的情况下,拒绝零假设所要承担的风险水平,换到莫兰指数这里,零假设既是空间随机分布。

下图是一个显著性的正态分布。

 

空间分析:3-3.geoda计算莫兰指数

把p值和z值与莫兰指数关联上,就是空间自相关性的置信度。

下表是z值、p值与置信度的关系。

 

空间分析:3-3.geoda计算莫兰指数

三、geoda计算莫兰指数

1.打开shp文件。

我的shp文件是bjfy.shp。

打开——连接数据源——ERSI Shapefile,Choose a spatial file to open,打开shp文件即可。

2.空间权重设置

工具——空间权重管理,打开空间权重管理。

首先点击“创建”。

然后在创建空间权重文件对话框中点击添加ID变量。

然后在添加新ID变量中,现有变量中选择field_8,这个字段存的是单价。

然后 点击添加变量。

空间分析:3-3.geoda计算莫兰指数

 

返回到创建空间权重文件对话框,点击“创建”。

把gal文件保存到一个位置,即可。

如果提示“将重复的泰森多边形保存到表中”,点击确定既可以,因为的确有坐标重复的点。

空间分析:3-3.geoda计算莫兰指数

 

我们创建空间权重,选择的是邻接空间权重,因为郊区的点肯定会稀疏,所以基于距离的空间权重不太合适。

3.计算莫兰指数

最简单的莫兰指数。

菜单栏空间分析——单变量 Moran’s I。

变量设置中,第一变量选择POLY_ID,就是我们刚才用房源单价filed_8这个字段构建的空间权重。

空间权重文件是bjfy.gal,就是我们刚才保存的空间权重文件。

点击确定即可。

 

空间分析:3-3.geoda计算莫兰指数

4.莫兰指数结果

莫兰指数为0.997,且成线性。

这就能看出来,房价是呈现空间自相关性的,既有相似属性的对象在空间上是聚在一起的,房价高的聚在一起,房价低的聚在一起。

 

空间分析:3-3.geoda计算莫兰指数

5.随机化

随机化主要是为了对比显著性的。

在Moran’s I(bjfy):POLY ID窗口,右键,选择随机化——99次置换。

 

空间分析:3-3.geoda计算莫兰指数

结果如下:

 

空间分析:3-3.geoda计算莫兰指数

999次置换,结果如下:

空间分析:3-3.geoda计算莫兰指数

 

通常情况下,999次置换的结果要比99次置换的结果可靠。

我们可以看到999次置换生成的pseudo p-value是0.001,这个值的计算方式是1/(permutations+1)。

E[I]=-1/(n-1),n是数据集中的观测值,我的对象数量是34717,这个在空间权重管理界面上能看到。

 

mean是参考分布的平均值。

sd是参考解析的标准偏差。

z-value是标准差的倍数。

看着似乎有点晕,但是我们看这个很大的z值,就可以确定,我们的莫兰指数计算结果是强烈拒绝零假设的,既强烈拒绝随机分布。

 

结论就是0.997的全局莫兰指数,和901.8945的z值,证明至少有99%的可能,北京二手房的单价是有空间正相关的。

 

四、总结

Geoda其实不难用,比较麻烦的是莫兰指数和p值、z值理解起来稍稍有点绕。