elasticsearch plane 踩的坑

问题背景:在使用ES内置的坐标距离筛选功能时,出现了问题,有一部分理论上平面距离大于界定值的数据,并没有被筛选掉

 

因为百度和google找到的文献,都只是提及了ES的plane算法的优势劣势,但对其具体实现都是没有提及,所以我只能硬着头皮去github上抠ES开源源码,最终找到问题原因。

 

问题原因:由于项目在小范围的距离计算上采用的是最基本的平面坐标距离计算公式:elasticsearch plane 踩的坑

是完全将经纬度坐标作为平面坐标来计算,最终再乘上一个统一的系数得出距离。

而ES内置plane的具体实现是

elasticsearch plane 踩的坑

可见公式截然不同,结果有差距也是理所当然了,因为这部分源码二次开发的权利不在我这,而且ES不只是我现在这个项目在使用,所以想更改源码是不行了,由于暂时不能更改老的解决方案,所以最终决定使用脚本方式而不是使用ES的API去实现这个距离计算操作。

下文只留给对这套距离计算理论感兴趣的人,ES内部有多种距离计算方式,plane是性能高但准确性一般的方式,经过学习,其使用的是Equirectangular approximation算法,以下对其性能优势做了详细阐述

elasticsearch plane 踩的坑

其理论支撑我就不在这赘述了,如有兴趣自行查阅。

最后,还有很多其他根据经纬坐标计算距离的算法,见http://www.movable-type.co.uk/scripts/latlong.html