【4.3.5】 qiime2的alpha和beta分析
Alpha和Beta多样性分析
一、介绍
QIIME 2的多样性分析可通过q2-diversity插件获得,该插件支持计算alpha和beta多样性指标,应用相关的统计测试以及生成交互式可视化。我们将首先应用核心指标系统发生方法,该方法将FeatureTable [Frequency]稀疏到用户指定的深度,计算多个alpha和beta多样性指标,并使用Emperor为每个指标生成主坐标分析(PCoA)图、 Beta多样性指标。默认情况下计算的指标是:
Alpha diversity
- 香农的多样性指数(衡量社区富裕程度的指标) Shannon’s diversity index (a quantitative measure of community richness) Observed Features (a qualitative measure of community richness)
- 观察到的特征(对社区丰富度的定性度量) Faith’s Phylogenetic Diversity (a qualitiative measure of community richness that incorporates phylogenetic relationships between the features)
- Faith的系统发育多样性(一种定性的衡量社区丰富程度的方法,其中纳入了特征之间的系统发育关系)
- 均匀度(或Pielou的均匀度;衡量社区均匀度的指标) Evenness (or Pielou’s Evenness; a measure of community evenness)
Beta多样性
- 雅卡德距离(定性度量社区差异) Jaccard distance (a qualitative measure of community dissimilarity)
- Bray-Curtis距离(社区差异的定量度量) Bray-Curtis distance (a quantitative measure of community dissimilarity)
- 未加权的UniFrac距离(结合特征之间的系统发育关系的社区差异的定性度量) unweighted UniFrac distance (a qualitative measure of community dissimilarity that incorporates phylogenetic relationships between the features)
- 加权UniFrac距离(结合特征之间的系统发育关系的社区差异的定量度量) weighted UniFrac distance (a quantitative measure of community dissimilarity that incorporates phylogenetic relationships between the features)
二、命令行
需要为此脚本提供的一个重要参数是–p-sampling-depth,它是均匀的采样(即稀疏度)深度。 因为大多数多样性度量标准对不同样本之间的不同采样深度敏感,所以此脚本将随机地将每个样本的计数子采样到为此参数提供的值。
例如,如果您提供–p-sampling-depth 500,则此步骤将对每个样本中的计数进行二次采样而不进行替换,以便结果表中的每个样本的总数为500。如果任何样本的总数小于此值,这些样本将从多样性分析中删除。
选择此值很棘手。 我们建议您通过查看上面创建的table.qzv文件中提供的信息来做出选择。 选择一个尽可能高的值(以便每个样本保留更多的序列),同时排除尽可能少的样本。
查看table.qzv,尤其是该可视化文件中的“ Sample Detail”选项卡。 对于 –p-sampling-depth,您选择通过什么值? 根据此选择,您的分析中将排除多少个样本? 您将在 core-metrics-phylogenetic 命令中分析多少个总序列?
比如,我看到样本中,reads数最少的为 17890
qiime diversity core-metrics-phylogenetic --i-phylogeny rooted-tree.qza --i-table table.qza --p-sampling-depth 17890 --m-metadata-file sample-metadata.tsv --output-dir core-metrics-results
说明:
- rooted-tree.qza 来自进化树分析那一步
- table.qza 来自dada2,序列聚类那一步
- 17890来自,所有样本中样本reads数最小的那个
- sample-metadata.tsv 最开始创造的样本数据
在计算了多样性指标之后,我们可以开始在样品元数据的背景下探索样品的微生物组成
分析数据可视化展现
我们将在此进行 Faith Phylogenetic Diversity(衡量社区丰富程度)和evenness指标的操作。
qiime diversity alpha-group-significance --i-alpha-diversity core-metrics-results/faith_pd_vector.qza --m-metadata-file sample-metadata.tsv --o-visualization core-metrics-results/faith-pd-group-significance.qzv
qiime diversity alpha-group-significance --i-alpha-diversity core-metrics-results/evenness_vector.qza --m-metadata-file sample-metadata.tsv --o-visualization core-metrics-results/evenness-group-significance.qzv
qzv可以在 https://view.qiime2.org/ 查看
qiime diversity beta-group-significance –i-distance-matrix core-metrics-results/unweighted_unifrac_distance_matrix.qza –m-metadata-file sample-metadata.tsv –m-metadata-column body-site –o-visualization core-metrics-results/unweighted-unifrac-body-site-significance.qzv –p-pairwise
参考资料
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn