数据科学家应该知道的3个距离概念

来源:https://towardsdatascience.com/3-distances-that-every-data-scientist-should-know-59d864e5030a

翻译:小马

无论你是刚开始接触数据科学还是已经在这个领域工作多年,理解以下3个距离概念是工作中必备的知识。

1. 欧式距离

欧氏距离是最直观的,当有人让我们测量两个点的距离时,我们首先会想到欧氏距离。

欧氏距离是两点之间的直线距离,点用坐标x和y表示,例如我们可以通过给出两个坐标(维度和经度)在世界地图上找到任何一个城市。

想象以下,我们要测量下图从A点到B点的直线距离。

数据科学家应该知道的3个距离概念

我们只需要这两个点的(x,y)坐标,利用毕达哥拉斯公式计算这两点的欧式距离。

毕达哥拉斯定理告诉我们:当我们知道直接三角形的水平长度和垂直长度时,使用公式数据科学家应该知道的3个距离概念计算斜边。

因此上图中A,B两点的欧式距离为:

数据科学家应该知道的3个距离概念

2. L1距离

L1距离,又称为曼哈顿距离,或街区距离。

大家想象以下如果两个人在曼哈顿市区的不同地方,我们如何计算他们之间的距离了?

曼哈顿距离只能是沿直线的距离,如下图:

数据科学家应该知道的3个距离概念

如上图的两个点A和B,有不同的路径沿着A走向B,如先向东走3个街道的距离再向西走2个街道的距离,或先向北走2个街道的距离再向东走3个街道的距离。

但是L1距离是一个距离,所以实际的轨迹并不重要,我们所需要知道的是,我们向东走的距离x和向北走的距离y,两者的和是点A到点B的L1距离。

因此,上图两点的L1距离计算为:

数据科学家应该知道的3个距离概念

3. 切比雪夫距离

切比雪夫距离也称为棋盘距离,最直观的理解是国王可以在棋盘任一方向移动1步。

与L1距离不同的是,对角线位置的两点只需要1步,L1距离需要2步,欧氏距离需要1.41步,如下图3种距离的比较:

数据科学家应该知道的3个距离概念

切比雪夫距离的一个直观例子是一架无人机有两个独立的马达:1个向前移动,另1个侧向移动,这两个马达可以同时运行也可以同时以最高速度运行。

这样做的结果是,无人机在对角线方向上的速度与在水平方向上的速度一样快,只要让两个马达以最大速度运行即可。

下图两个点A和B的切比雪夫距离:

数据科学家应该知道的3个距离概念

步骤1和步骤2两个电机同时运行,步骤3不再需要向前移动,只需要侧向电机仍在运行。因此,切比雪夫距离被定义为一个轴上的最长距离。

即上图两点A和B的切比雪夫距离为:

数据科学家应该知道的3个距离概念

欢迎扫码关注:

数据科学家应该知道的3个距离概念