【6.1.1】遗传变异
最近开始接触NGS了,每天听带头大哥谈各种变异,却总是缺少一个系统的概念,今天我们就一起来聊聊什么叫遗传变异吧。
遗传突变来自3个方面:
- 遗传自父母;
- 新发突变(de novo nucelotide mutation,即我们父母没有的突变);
- 体细胞突变(著名的例子是癌症,肿瘤细胞一般都会有模中体细胞突变,会导致细胞不受控制地增殖)。
几个容易搞混淆的词: mutation ,polymorphism,variation,variant 突变,多态性,变异
- mutation:在整个踢球上所有对人群中,小于%1的这种突变,大家把它通称为突变
- polymorphism: 如果超过1%的这种变异,大家把它叫做~,有时用5%这个cutoff
- variation,variant:一般是mutation和polymorphism的统称
就人而言,基因突变有以下几种:
- Chromosomal aneuploidy
- Structural Variations (SVs)
- Copy Number Variations (CNVs)
- Short insertion/deletions (indels)
- Single Nucleotide Variations (SNVs)
一、 染色体倍数增加
最熟悉的例子是唐氏综合症,21号染色体上有3条,这些孩子的智力和一些身体的特征都有很多异常的表现
二、structral variation和copy number variation
如上图所示,包括,insertion,deletion,duplication(包括紧挨着的tandem duplication和距离相对较远的这种interspersed duplication),染色体上的inversition和translocation
短的插入删除(indel)可能在基因间区或是在内含子区,多数时候对表现的影响不是很大,但这不是绝对的。它还有可能在编码蛋白的编码区,如果在编码区它又会有两种可能的结果,一种导致frameshift(丢失或增加非3的倍数的碱基,导致整条链的位移,它就会编码一个完全不同的肽段,不光是这个蛋白的序列完全改变,它会在后面引入一个pre-mature stop codon,所以会提前出现一个终止密码子,那么这个蛋白就不会被翻译出来),一种不会导致frameshift
三、 SNV单核苷酸变异
在我们人的基因组是很常见的,一般来说每个人的基因组都会有300万个单核苷酸的变异相当于1/1000这样的一个频率,它可能出现在基因间区,或内含子区,也有可能是出现在启动子区。在基因区,它有可能出现在UTR,有可能是在内含子,也可能在编码区,也可能在非编码RNA区域。
编码区:
a,最严重的后果是它会引入一个stop codon,这样这个蛋白会提前终止,或者这个蛋白无法搬移出来,或者会翻译出来出来一个截短的一个一个版本。这个我通常叫做stop gain或者nonsense mutation;
b,它有时会造成一个终止密码子的缺失(stop loss),那就是它最后这个蛋白会比原来的蛋白更长,但同时也有可能它无法被翻译;
c,影响氨基酸的变异,叫做missense mutation或者是non-synonymousmutation,它是造成这个mi changes;
外显子区:
d,还有一些在外显子区,又是编码蛋白的外薪资区发生的这个变异,但是它因为这个codon,他是degenerative,所以它有一些是synonymous,就是不引起氨基酸的改变,也叫做silient mutaion
外显子和内含子交界处:
e,最后在内含子和外显子交界的地方,有的变异会影响剪切,也会对蛋白造成很严重的影响。
讨论
missense mutation(non-synonymous)非同义突变是目前研究最多的 ,主要的原因是它会改变氨基酸,也就是改变蛋白的序列。虽然加起来不到人的基因组的2%
参考资料
北大高歌老师的生物信息课程
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn