距离[2]––类之间距离的度量方法

系统聚类法不仅需要度量个体与个体之间的距离,还要度量类与类之间的距离。类间距离被度量出来之后,距离最小的两个小类将首先被合并成为一类。由类间距离定义的不同产生了不同的系统聚类法。

SPSS 中提供了如下几种类间距离测度方法:

  1. 组间平均连接距离(Between-group linkage):以两类个体两两之间距离的平均数作为类间距离;
  2.  组内平均连接距离(Within-group linkage):将两类个体合并为一类后,以合并后
    类中所有个体之间的平均距离作为类间距离;
  3. 最近邻距离(Nearest neighbor):以两类中距离最近的两个个体之间的距离作为类
    间距离;
  4.  最远邻距离(Furthest neighbor):以两类中距离最远的两个个体之间的距离作为类
    间距离;
  5.  重心距离(Centroid cluster):以两类变量均值之间的距离作为类间距离;
  6. 中位数距离(Median cluster):以两类变量中位数之间的距离作为类间距离;
  7.  离差平方和法(Ward method): 该方法是Ward提出来的,所以又称为Ward法。具
    体做法是先将n个样品各自成一类,然后每次减少一类,随着类与类的不断聚合,
    类内的离差平方和必然不断增大,选择使离差平方和增加最小的两类合并,直到所
    有的样品归为一类为止。

参考资料:
第 10 章 聚类分析(超级赞的一个资料)

发表评论

电子邮件地址不会被公开。 必填项已用*标注