【2.1.1】--闵氏距离(闵可夫斯基距离,minkowski-distance)

闵氏距离不是一种距离,而是一组距离的定义,是对多个距离度量公式的概括性的表述。

以俄罗斯数学家闵可夫斯基命名的距离;是欧式距离的推广,p=2时等价于欧氏距离,和p-范数等值

两个n维变量a(x1,x2,…,xn)与 b(y1,y2,…,yn)间的闵可夫斯基距离定义为:

$$ d = \sqrt[p]{\sum\limits_{i=1}^{n} (x_{i} -y_{i})^{p} }$$

其中p是一个变参数。

  • 当p=1时,就是曼哈顿距离
  • 闵可夫斯基距离当p=2时,就是欧氏距离
  • 当p→∞时,就是切比雪夫距离

根据变参数的不同,闵氏距离可以表示一类的距离。

二、优缺点

闵氏距离,包括曼哈顿距离、欧氏距离和切比雪夫距离都存在明显的缺点。

e.g. 二维样本(身高[单位:cm],体重[单位:kg]),现有三个样本:a(180,50),b(190,50),c(180,60)。那么a与b的闵氏距离(无论是曼哈顿距离、欧氏距离或切比雪夫距离)等于a与c的闵氏距离。但实际上身高的10cm并不能和体重的10kg划等号。

闵氏距离的缺点:

  1. 将各个分量的量纲(scale),也就是“单位”相同的看待了;
  2. 未考虑各个分量的分布(期望,方差等)可能是不同的。

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学