距离[3]--欧氏距离(EUCLIDEAN DISTANCE)

欧氏距离定义: 欧氏距离( Euclidean distance)是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。

在二维和三维空间中的欧式距离的就是两点之间的距离,二维的公式是

d = sqrt((x1-x2)^+(y1-y2)^) 

三维的公式是

d=sqrt(x1-x2)^+(y1-y2)^+(z1-z2)^) 

推广到n维空间,欧式距离的公式是

d=sqrt( ∑(xi1-xi2)^ ) 这里i=1,2..n 

xi1表示第一个点的第i维坐标,xi2表示第二个点的第i维坐标 n维欧氏空间是一个点集,它的每个点可以表示为(x(1),x(2),…x(n)),其中x(i)(i=1,2…n)是实数,称为x的第i个坐标,两个点x和y=(y(1),y(2)…y(n))之间的距离d(x,y)定义为上面的公式.

欧氏距离看作信号的相似程度。在文献【1】中,它设定的最大EUCLIDEAN DISTANCE为0.1,可以理解为将每条序列对应的256个四核苷酸概率为一个256维数的点,然后跟另一条序列比较,就可以根据TNF得出两条序列间的EUCLIDEAN DISTANCE,然后通过设定的这个值,如果在这个值内就说明这两条序列相关,不在这个值内就说明这两条序列不相关。

我的问题是既然在利用TNF的时候已经有了z-scores和p值,用这个EUCLIDEAN DISTANCE啥意思呢,是因为这个更准确?如果我这个值好,我应该用什么工具来得到这么个值呢?

参考资料:

简单-高效-优雅 http://www.blogjava.net/spec-second/archive/2008/08/17/222609.html

文献:【1】Metagenomic discovery of biomass-degrading genes and genomes from cow rumen

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学