【3.4】UPGMA非加权组平均法

非加权组平均法(unweighted pair-group method with arithmetic means, UPGMA,also known as average linkage)是一种较常用的聚类分析方法 ,最早是用来解决分类问题的。当用来重建系统发生树时 ,其假定的前提条件是:在进化过程中 ,每一世系发生趋异的次数相同,即核苷酸或氨基酸的替换速率是均等且恒定的。通过 UPGMA 法所产生的系统发生树可以说是物种树的简单体现 ,在每一次趋异发生后 ,从共祖节点到 2 个 OTU 间的支的长度一样。因此 ,这种方法较多地用于物种树的重建。

UPGMA 法在算法上较简单。聚类时,首先将距离最小的2个OTU聚在一起 ,并形成一个新的OTU ,其分支点位于2个OTU间距离的 1/ 2 处;然后计算新的OTU与其它OTU 间的平均距离 ,再找出其中的最小2个OTU 进行聚类;如此反复,直到所有的OTU都聚到一起 ,最终得到一个完整的系统发生树。

参考资料:

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学