莫兰指数是一个地学统计概念，用来表示空间自相关性。

我们使用geoda来计算一下北京二手房的莫兰指数，看看它的空间自相关。

一、莫兰指数

莫兰指数是最常用的空间自相关指标，最早由统计学家莫兰提出，所以叫做莫兰指数，很好听的名字。

莫兰指数计算公式：

空间分析：3-3.geoda计算莫兰指数

其中：

空间分析：3-3.geoda计算莫兰指数

看着有点晕，没关系就是个统计公式，我们只需要知道通过这个公式能计算出来莫兰指数。

莫兰指数的取值范围是[-1,1]。

莫兰指数结果如果在0到1之间，则为正相关，表示具有相似属性的对象聚集在一起。

莫兰指数结果如果在-1到0之间，则为负相关，表示具有相异属性的对象聚集在一起。

莫兰指数结果如果接近于0，则为随机分布，不存在空间自相关。

二、p值和z值

p值和z值都是用来表明置信度的，如果p值很小，意味着所观测的空间模式不太可能是随机的。z值表示标准差的倍数，如果z很大或很小，也意味着所观测的空间模式，不太可能是随机的。z值和p值，都与标准正态分布相关联，用来表示统计显著性，既零假设为真的情况下，拒绝零假设所要承担的风险水平，换到莫兰指数这里，零假设既是空间随机分布。

下图是一个显著性的正态分布。

空间分析：3-3.geoda计算莫兰指数

把p值和z值与莫兰指数关联上，就是空间自相关性的置信度。

下表是z值、p值与置信度的关系。

空间分析：3-3.geoda计算莫兰指数

三、geoda计算莫兰指数

1.打开shp文件。

我的shp文件是bjfy.shp。

打开——连接数据源——ERSI Shapefile，Choose a spatial file to open，打开shp文件即可。

2.空间权重设置

工具——空间权重管理，打开空间权重管理。

首先点击“创建”。

然后在创建空间权重文件对话框中点击添加ID变量。

然后在添加新ID变量中，现有变量中选择field_8，这个字段存的是单价。

然后点击添加变量。

空间分析：3-3.geoda计算莫兰指数

返回到创建空间权重文件对话框，点击“创建”。

把gal文件保存到一个位置，即可。

如果提示“将重复的泰森多边形保存到表中”，点击确定既可以，因为的确有坐标重复的点。

空间分析：3-3.geoda计算莫兰指数

我们创建空间权重，选择的是邻接空间权重，因为郊区的点肯定会稀疏，所以基于距离的空间权重不太合适。

3.计算莫兰指数

最简单的莫兰指数。

菜单栏空间分析——单变量 Moran’s I。

变量设置中，第一变量选择POLY_ID，就是我们刚才用房源单价filed_8这个字段构建的空间权重。

空间权重文件是bjfy.gal，就是我们刚才保存的空间权重文件。

点击确定即可。

空间分析：3-3.geoda计算莫兰指数

4.莫兰指数结果

莫兰指数为0.997，且成线性。

这就能看出来，房价是呈现空间自相关性的，既有相似属性的对象在空间上是聚在一起的，房价高的聚在一起，房价低的聚在一起。

空间分析：3-3.geoda计算莫兰指数

5.随机化

随机化主要是为了对比显著性的。

在Moran’s I(bjfy):POLY ID窗口，右键，选择随机化——99次置换。

空间分析：3-3.geoda计算莫兰指数

结果如下：

空间分析：3-3.geoda计算莫兰指数

999次置换，结果如下：

空间分析：3-3.geoda计算莫兰指数

通常情况下，999次置换的结果要比99次置换的结果可靠。

我们可以看到999次置换生成的pseudo p-value是0.001，这个值的计算方式是1/（permutations+1）。

E[I]=-1/(n-1)，n是数据集中的观测值，我的对象数量是34717，这个在空间权重管理界面上能看到。

mean是参考分布的平均值。

sd是参考解析的标准偏差。

z-value是标准差的倍数。

看着似乎有点晕，但是我们看这个很大的z值，就可以确定，我们的莫兰指数计算结果是强烈拒绝零假设的，既强烈拒绝随机分布。

结论就是0.997的全局莫兰指数，和901.8945的z值，证明至少有99%的可能，北京二手房的单价是有空间正相关的。

四、总结

Geoda其实不难用，比较麻烦的是莫兰指数和p值、z值理解起来稍稍有点绕。

空间分析：3-3.geoda计算莫兰指数

一、莫兰指数

二、p值和z值

三、geoda计算莫兰指数

1.打开shp文件。

2.空间权重设置

3.计算莫兰指数

4.莫兰指数结果

5.随机化

四、总结

相关推荐