【3.2.1.2】pangolin

A and B virus: two nucleotides (positions 8,782 in ORF1ab and 28,144 in ORF8) difference

Maximum likelihood phylogeny of globally sampled sequences of SARS-CoV-2 downloaded from the GISAID database on 18 May 2020. (27,767 genomes)

pango Lineage 命名规则,详见文献:https://www.nature.com/articles/s41564-020-0770-5

一个新的谱系必须满足以下所有标准:

  1. 它与祖先谱系表现出一个或多个共享的核苷酸差异;
  2. 它包含至少五个基因组,并且超过 95% 的基因组已测序;
  3. 谱系内的基因组表现出至少一种共有的核苷酸变化;
  4. 谱系定义节点的引导值 >70% (a bootstrap value >70% for the lineage-defining node)

迭代过程最多可以进行三个子级别(例如,A.1.1.1),之后为新的后代谱系赋予一个字母(按照从 C 开始的英文字母顺序),因此 A.1.1.1.1将成为 C.1,A.1.1.1.2 将成为 C.2

二、pangolin程序的用法

https://github.com/hCoV-2019/pangolin

pangolin ${output}/${ID}/${ID}.genome.fasta -o ${output}/${ID}/pangolin_lineage -t 64

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn