白话空间统计二十九:空间插值(七)
今天讲第二个插值算法:径向基函数插值(Radial basis function:RBF)。
好吧,我知道这个名称很拗口,连我自己都不怎么说,我一般都把这个插值叫做样条插值,因为它模拟的是这样一种插值方法:
首先,需要有一个样条,可以看成是一个薄铁皮板子:
然后还需要一个锤子哥——这个锤子哥负责用他的锤子来锤这个薄铁皮:
按照锤子哥锤这个薄铁皮力气,锤出若干锤,那么最后自然就变成了一个起伏不平的曲面:
以上就是样条函数的插值原理了,是不是灰常简单形象。
下面是官宣说明:
这种插值方法的优势如下:
样条函数的理论主要是基于距离和曲率的,所以有他的一些理论特征和应用范围:
样条函数插值的时候,生成的曲面,会在最小化表面总曲率的同时,会正好经过所有的采样点。另外针对周边的点(寻找的子集),采用了一个数学公式来进行拟合。所以,他可以生成非常平滑的表面。如下所示:
蓝色的曲线是二次样条,黄色的是三次样条。
那么样条插值法一般在什么地方使用呢?一般来说,如果你的值不存在急剧跳变,那么就适用于样条函数了,比如水体的污染插值一类的场景。
因为水体污染不会出现相邻的两个点,一个污染值巨高,一个巨低这种极端变化,一般都是根据水流渗透蔓延扩散开来的,所以比较适用于这种插值方法。
下面来看看ArcGIS里面,这个工具怎么使用:
它的位置如下:ArcToolbox —— 空间分析工具——插值——样条插值:
打开之后,发现它比IDW还要简单一些:
红字标出来的5个参数,与IDW的意义完全一致,就不说了
属于样条特有的参数有两个,下面来解释一下:
1、样条类型,一共有两种:(下面是直接复制官方文档的说明,虽然我不知道它在说什么,但是听这些名词就觉得很厉害的样子)
REGULARIZED (规则样条函数)— 产生平滑的表面和平滑的一阶导数。
TENSION (张力样条函数)— 根据建模现象的特征调整插值的硬度。
这两种类型都配合着权重的数字来使用的。
那么我们来看看这两种类型分布有什么不同:
REGULARIZED类型,用的是经典的样条函数来进行建模的,用权重来控制一阶导数的大小。
(不知道有没有人会问我,一阶导数是神马?)
所以用这个参数会获得比较平滑的结果,那么你可以把这个权重的参数看成与反距离权重里面的幂是同样的含义:
这个值越大,对周边的影响就越大,值越小,对周边的影响就越小。
TENSION 模式的话,权重的参数用来控制你这个薄板样条的“硬度”。
如何来理解这硬度呢?如下所示
硬度越高,插值的结果就越不平滑。
对于权重来说,两种不同的类型,对应经典值也有不同:
对于规则样条函数方法,权重参数定义曲率最小化表达式中表面的三阶导数的权重。权重越高,输出表面越平滑。为该参数输入的值必须大于或等于零。可能会用到的典型值有 0、0.001、0.01、0.1 和 0.5。
对于张力样条函数方法,权重参数定义张力的权重。权重越高,输出表面越粗糙。输入的值必须大于或等于零。典型值有 0、1、5 和 10。
两种不同模型的不同权重得到的插值结果如下:(大家来找茬)
Spline打完收工。
这IDW和Spline两种插值是比较有代表意义的插值,如果掌握了这两种插值的原理,插值基本上就算是入门了,那么从下一节开始,进入大家期待已久的地统计学部分。
地统计学的核心是克里金插值,但是克里金和地统计学的关系就相当于米饭和食品……地统计学的概念外延更大,所以会专门开一个章节来讲地统计学,而作为核心的克里金自然会有大量的篇幅,欢迎大家继续关注。
待续未完。