【1.1】距离概述

运用算法做分类时需要估不同样本之间的相似性度量(Similarity Measurement,SM),这时通常采用的方法就是计算样本间的“距离”(Distance)

首先,了解一下距离计算(聚类分析)

对于函数Dist( ; ),倘若它是一个“距离度量”(distance measure),则需要满足一些基本性质:

  • 非负性:d ( i , j ) ≥ 0(距离是一个非负的数值)
  • 同一性:d ( i , i ) = 0(对象到自身的距离为0)
  • 对称性:d ( i , j ) = d ( j , i ) (距离是一个对称函数)
  • 直递性:d ( i , j ) ≤ d ( i , k ) + d ( k , j )(从对象 i ii 到对象 j jj 的直接距离不会大于途经的任何其他对象k的距离和)

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn