【2.1.1】--闵氏距离(闵可夫斯基距离,minkowski-distance)
闵氏距离不是一种距离,而是一组距离的定义,是对多个距离度量公式的概括性的表述。
以俄罗斯数学家闵可夫斯基命名的距离;是欧式距离的推广,p=2时等价于欧氏距离,和p-范数等值
两个n维变量a(x1,x2,…,xn)与 b(y1,y2,…,yn)间的闵可夫斯基距离定义为:
$$ d = \sqrt[p]{\sum\limits_{i=1}^{n} (x_{i} -y_{i})^{p} }$$
其中p是一个变参数。
- 当p=1时,就是曼哈顿距离
- 闵可夫斯基距离当p=2时,就是欧氏距离
- 当p→∞时,就是切比雪夫距离
根据变参数的不同,闵氏距离可以表示一类的距离。
二、优缺点
闵氏距离,包括曼哈顿距离、欧氏距离和切比雪夫距离都存在明显的缺点。
e.g. 二维样本(身高[单位:cm],体重[单位:kg]),现有三个样本:a(180,50),b(190,50),c(180,60)。那么a与b的闵氏距离(无论是曼哈顿距离、欧氏距离或切比雪夫距离)等于a与c的闵氏距离。但实际上身高的10cm并不能和体重的10kg划等号。
闵氏距离的缺点:
- 将各个分量的量纲(scale),也就是“单位”相同的看待了;
- 未考虑各个分量的分布(期望,方差等)可能是不同的。
参考资料
