排序【2】--RDA冗余分析

RDA是基于线性模型,CCA是基于单峰模型。一般我们会选择CCA来做直接梯度分析。但是如果CCA排序的效果不太好,就可以考虑是不是用RDA分析。那么有什么原则来选择用RDA或CCA呢?可以按照一下步骤来选择。

先用species-sample资料做DCA分析,看分析结果中Lengths of gradient 的前4个轴中最大的值,如果大于4.0,就应该选CCA,如果3.0-4.0之间,选RDA和CCA均可,如果小于3.0, RDA的结果要好于CCA。

在RDA和CCA之间选择,根本上还是看,你认为物种沿着环境梯度的变化,其响应曲线到底是线性的还是单峰(钟形)的。之所以用第一轴长度判断,就是因为第一轴若较短,那么可能只是钟形曲线的单调性的局部,用线性来拟合更准确一些而已

CCA要比RDA用得更普遍。我觉得有两个原因,第一,大部分情况下,两者的分析结果并差别并不大。其实,CCA非线性模型其实可以容纳线性模型,线性关系可以算是非线性模型的特例。所有用RDA可以做的,CCA也可以做,只不过在如果梯度比较短的话RDA要精确一点。但是,如果是非线性关系,用线性的RDA来分析,那个准确度就大大打折扣了。因为,本来点就不在同一条直线上,现在非得用直线去拟合,肯定不合适。这也是为什么SD小于3也可以用CCA,但是SD大于4,就不能用RDA的原因。第二,正因为大家都用CCA,用得多了,文献多了,大家为了方便比较,所有更多的选择是CCA,RDA自然就越来越少了。

ps:

找了好久,硬是没有找到他的计算过程,以后附上吧。

参考资料:

普蘭塔 http://www.planta.cn/forum/viewtopic.php?t=4105

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学