距离[2]–--类之间距离的度量方法

系统聚类法不仅需要度量个体与个体之间的距离,还要度量类与类之间的距离。类间距离被度量出来之后,距离最小的两个小类将首先被合并成为一类。由类间距离定义的不同产生了不同的系统聚类法。

SPSS 中提供了如下几种类间距离测度方法:

  1. 组间平均连接距离(Between-group linkage):以两类个体两两之间距离的平均数作为类间距离;

  2.  组内平均连接距离(Within-group linkage):将两类个体合并为一类后,以合并后 类中所有个体之间的平均距离作为类间距离;

  3. 最近邻距离(Nearest neighbor):以两类中距离最近的两个个体之间的距离作为类 间距离;

  4.  最远邻距离(Furthest neighbor):以两类中距离最远的两个个体之间的距离作为类 间距离;

  5.  重心距离(Centroid cluster):以两类变量均值之间的距离作为类间距离;

  6. 中位数距离(Median cluster):以两类变量中位数之间的距离作为类间距离;

  7.  离差平方和法(Ward method): 该方法是Ward提出来的,所以又称为Ward法。具 体做法是先将n个样品各自成一类,然后每次减少一类,随着类与类的不断聚合, 类内的离差平方和必然不断增大,选择使离差平方和增加最小的两类合并,直到所 有的样品归为一类为止。

参考资料:

第 10 章 聚类分析(超级赞的一个资料)

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学