【2.1.3】--标准化欧氏距离(Standardized Euclidean Distance)
标准化欧氏距离是针对欧氏距离的缺点而作的一种改进。标准欧氏距离的思路:既然数据各维分量的分布不一样,那先将各个分量都“标准化”到均值、方差相等。假设样本集X的均值(mean)为m,标准差(standard deviation)为s,X的“标准化变量”表示为:
$$ X' = \frac{X-m}{s}$$
标准化欧氏距离公式:
$$ d = \sqrt{ \sum \limits_{k=1}^{n} ( \frac{x_{1k} - x_{2k}}{s_{k}} )^{2} }$$
如果将方差的倒数看成一个权重,也可称之为加权欧氏距离(Weighted Euclidean distance)。
