【3.2.1.2】pangolin
A and B virus: two nucleotides (positions 8,782 in ORF1ab and 28,144 in ORF8) difference
Maximum likelihood phylogeny of globally sampled sequences of SARS-CoV-2 downloaded from the GISAID database on 18 May 2020. (27,767 genomes)
pango Lineage 命名规则,详见文献:https://www.nature.com/articles/s41564-020-0770-5
一个新的谱系必须满足以下所有标准:
- 它与祖先谱系表现出一个或多个共享的核苷酸差异;
- 它包含至少五个基因组,并且超过 95% 的基因组已测序;
- 谱系内的基因组表现出至少一种共有的核苷酸变化;
- 谱系定义节点的引导值 >70% (a bootstrap value >70% for the lineage-defining node)
迭代过程最多可以进行三个子级别(例如,A.1.1.1),之后为新的后代谱系赋予一个字母(按照从 C 开始的英文字母顺序),因此 A.1.1.1.1将成为 C.1,A.1.1.1.2 将成为 C.2
二、pangolin程序的用法
https://github.com/hCoV-2019/pangolin
pangolin ${output}/${ID}/${ID}.genome.fasta -o ${output}/${ID}/pangolin_lineage -t 64
参考资料
这里是一个广告位,,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn