【1.1】距离概述
运用算法做分类时需要估不同样本之间的相似性度量(Similarity Measurement,SM),这时通常采用的方法就是计算样本间的“距离”(Distance)
首先,了解一下距离计算(聚类分析)
对于函数Dist( ; ),倘若它是一个“距离度量”(distance measure),则需要满足一些基本性质:
- 非负性:d ( i , j ) ≥ 0(距离是一个非负的数值)
- 同一性:d ( i , i ) = 0(对象到自身的距离为0)
- 对称性:d ( i , j ) = d ( j , i ) (距离是一个对称函数)
- 直递性:d ( i , j ) ≤ d ( i , k ) + d ( k , j )(从对象 i ii 到对象 j jj 的直接距离不会大于途经的任何其他对象k的距离和)
参考资料
这里是一个广告位,,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn