【2.1.4.1】MNV(多核苷酸变异)
一.定义
多核苷酸变异(MNV)是一种临床和生物学上重要的遗传变异类型,定义为存在于个体中同一单倍型上的两个或多个相邻变异。然而,现有的工具通常不能准确地对MNV进行分类,对其突变起源的理解仍然有限。
区分MNV和SNVs
二.基因定相(Phasing)
要把一个二倍体(甚至是多倍体)基因组上的等位基因(或者杂合位点),按照其亲本正确地定位到父亲或者母亲的染色体上,最终使得所有来自同一个亲本的等位基因都能够排列在同一条染色体里面。
变异位点经过Phasing和不经过Phasing的示意图。右上图代表通常的Genotype,右下图代表Phasing之后的情况,实现了亲本的区分
三.基于reads定相识别MNV
MNV的鉴定需要对组成变异体进行适当的定相,即准确地鉴定为发生在同一单倍型(顺式)或两种不同单倍型(反式)上的两种变异体。分相可以按照以下三大策略进行:
- 基于reads的分相,它评估附近的变体是否在DNA测序数据中的相同reads上共同分离;
- 以家庭为基础的分相,评估两对变异是否在家庭内共同遗传;
- 以及基于群体的分相,它利用大基因型群体成员之间的单倍型共享,对分阶段进行统计推断。基于reads的相位调整对附近的成对突变特别有效,因此适合于MNV的分析。
四.MNV的全基因组突变机制
(1)不同的单核苷酸突变事件的组合,先后变异事件。MNV是两个或更多SNV的产物,通常发生在不同的时间,因此可能具有不同的等位基因频率。由于SNV突变率的潜在差异,预计与非CpG颠换相比,CpG转换在这一类中会更加丰富。
(2)易出错聚合酶zeta的复制错误,一次性事件。DNA聚合酶zeta(pol zeta)引入的复制错误,是一类众所周知的复制错误,它引入了MNV。研究表明,pol zeta容易出现特定类型的复制错误,主要是TC- > AA,GC- > AA和它们的反向互补物,实验证据表明这些MNV模式发生在一代中。
(3)重复连接处的聚合酶滑移事件,特殊序列事件。复制滑移,是另一种已知的DNA复制错误模式。这一过程在具有重复序列背景的位点尤其频繁。
五.MNV的影响
例如,下图中描绘的两个突变分别被预测为具有同义突变和错义突变,但组合在一起会导致无义突变。几乎所有现有的临床变异注释工具都会漏掉这些病例,在对受遗传病影响的家庭进行分析时,这些病例可能会导致漏诊和假阳性致病候选病例。
MNV的影响
六.工具
突变检测工具,如Mutect2、Sentieon TNScope和Sentieon TNHaplotyper ,包括相位信息。 分相工具:bcftools csq、MAC、MACARON、varDic、COPE等。 注释工具:SnpEff、ANNOVAR、VEP等。
GATK HaplotypeCaller基于reads的分相标签
参考资料
- https://www.jianshu.com/p/c0055f49834a
- https://www.jianshu.com/p/7ec65a0c7739 1.Landscape of multi-nucleotide variants in 125,748 human exomes and 15,708 genomes 2.Misannotated Multi-Nucleotide Variants in Public Cancer Genomics Datasets Lead to Inaccurate Mutation Calls with Significant Implications 3.Watch Out for a Second SNP: Focus on Multi-Nucleotide Variants in Coding Regions and Rescued Stop-Gained
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn