【2.1.3】--标准化欧氏距离(Standardized Euclidean Distance)

标准化欧氏距离是针对欧氏距离的缺点而作的一种改进。标准欧氏距离的思路:既然数据各维分量的分布不一样,那先将各个分量都“标准化”到均值、方差相等。假设样本集X的均值(mean)为m,标准差(standard deviation)为s,X的“标准化变量”表示为:

$$ X' = \frac{X-m}{s}$$

标准化欧氏距离公式:

$$ d = \sqrt{ \sum \limits_{k=1}^{n} ( \frac{x_{1k} - x_{2k}}{s_{k}} )^{2} }$$

如果将方差的倒数看成一个权重,也可称之为加权欧氏距离(Weighted Euclidean distance)。

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学