距离[3]–欧氏距离(EUCLIDEAN DISTANCE)

欧氏距离定义: 欧氏距离( Euclidean distance)是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。

在二维和三维空间中的欧式距离的就是两点之间的距离,二维的公式是

三维的公式是

推广到n维空间,欧式距离的公式是

xi1表示第一个点的第i维坐标,xi2表示第二个点的第i维坐标
n维欧氏空间是一个点集,它的每个点可以表示为(x(1),x(2),…x(n)),其中x(i)(i=1,2…n)是实数,称为x的第i个坐标,两个点x和y=(y(1),y(2)…y(n))之间的距离d(x,y)定义为上面的公式.

欧氏距离看作信号的相似程度。在文献【1】中,它设定的最大EUCLIDEAN DISTANCE为0.1,可以理解为将每条序列对应的256个四核苷酸概率为一个256维数的点,然后跟另一条序列比较,就可以根据TNF得出两条序列间的EUCLIDEAN DISTANCE,然后通过设定的这个值,如果在这个值内就说明这两条序列相关,不在这个值内就说明这两条序列不相关。

我的问题是既然在利用TNF的时候已经有了z-scores和p值,用这个EUCLIDEAN DISTANCE啥意思呢,是因为这个更准确?如果我这个值好,我应该用什么工具来得到这么个值呢?

参考资料:
简单-高效-优雅 http://www.blogjava.net/spec-second/archive/2008/08/17/222609.html
文献:【1】Metagenomic discovery of biomass-degrading genes and genomes from cow rumen

发表评论

电子邮件地址不会被公开。 必填项已用*标注