数据科学家应该知道的3个距离概念
来源:https://towardsdatascience.com/3-distances-that-every-data-scientist-should-know-59d864e5030a
翻译:小马
无论你是刚开始接触数据科学还是已经在这个领域工作多年,理解以下3个距离概念是工作中必备的知识。
1. 欧式距离
欧氏距离是最直观的,当有人让我们测量两个点的距离时,我们首先会想到欧氏距离。
欧氏距离是两点之间的直线距离,点用坐标x和y表示,例如我们可以通过给出两个坐标(维度和经度)在世界地图上找到任何一个城市。
想象以下,我们要测量下图从A点到B点的直线距离。
我们只需要这两个点的(x,y)坐标,利用毕达哥拉斯公式计算这两点的欧式距离。
毕达哥拉斯定理告诉我们:当我们知道直接三角形的水平长度和垂直长度时,使用公式计算斜边。
因此上图中A,B两点的欧式距离为:
2. L1距离
L1距离,又称为曼哈顿距离,或街区距离。
大家想象以下如果两个人在曼哈顿市区的不同地方,我们如何计算他们之间的距离了?
曼哈顿距离只能是沿直线的距离,如下图:
如上图的两个点A和B,有不同的路径沿着A走向B,如先向东走3个街道的距离再向西走2个街道的距离,或先向北走2个街道的距离再向东走3个街道的距离。
但是L1距离是一个距离,所以实际的轨迹并不重要,我们所需要知道的是,我们向东走的距离x和向北走的距离y,两者的和是点A到点B的L1距离。
因此,上图两点的L1距离计算为:
3. 切比雪夫距离
切比雪夫距离也称为棋盘距离,最直观的理解是国王可以在棋盘任一方向移动1步。
与L1距离不同的是,对角线位置的两点只需要1步,L1距离需要2步,欧氏距离需要1.41步,如下图3种距离的比较:
切比雪夫距离的一个直观例子是一架无人机有两个独立的马达:1个向前移动,另1个侧向移动,这两个马达可以同时运行也可以同时以最高速度运行。
这样做的结果是,无人机在对角线方向上的速度与在水平方向上的速度一样快,只要让两个马达以最大速度运行即可。
下图两个点A和B的切比雪夫距离:
步骤1和步骤2两个电机同时运行,步骤3不再需要向前移动,只需要侧向电机仍在运行。因此,切比雪夫距离被定义为一个轴上的最长距离。
即上图两点A和B的切比雪夫距离为:
欢迎扫码关注: