马氏距离

含义一

马氏距离可以描述一个点P到一个分布D之间的距离

设这个点P为x⃗ =(x1,x2,x3,...,xn)T

D分布均值为μ⃗ =(μ1,μ2,μ3,...,μn)T

D分布协方差矩阵为S

则P点到D分布之间的马氏距离为:

DM(x⃗ )=(x⃗ μ⃗ )TS1(x⃗ μ⃗ )

含义二

也可表示两个向量x⃗ y⃗ 之间的距离,但这两个向量需要是同一分布D的

D分布协方差矩阵为S

则两向量距离为

d(x⃗ ,y⃗ )=(x⃗ y⃗ )TS1(x⃗ y⃗ )

理解马氏距离

当求距离的时候,由于随机向量的每个分量之间量级不一样,比如说x1x220003000

马氏距离除以了一个方差矩阵,这就把各个分量之间的方差都除掉了,消除了量纲性,更加科学合理

马氏距离

(图片来自:链接

如上图,看左下方的图,比较中间那个绿色的和另外一个绿色的距离,以及中间绿色到蓝色的距离

如果不考虑数据的分布,就是直接计算欧式距离,那就是蓝色距离更近

但实际上需要考虑各分量的分布的,呈椭圆形分布

蓝色的在椭圆外,绿色的在椭圆内,因此绿色的实际上更近

马氏距离除以了协方差矩阵,实际上就是把右上角的图变成了右下角

一个例子

马氏距离

马氏距离

图片出处