【1.1】HapMap与国际人类基因组单体型图计划

1.何谓HapMap

HapMap是Haplotype Map 的简称,Haplo意为单一,在基因组中专指来自父母的一对染色体中的一条。Haplotype就是单条染色体中的一段,译作单体型(有人译作单倍型),是描述遗传差异的一种主要方式。DNA作为遗传物质,不但编码了物种间的差异,物种内不同个体之间的差异也含在其中,均表现为基因组之间的DNA序列差异,也就是基因组的多态性上。

    DNA由四种核苷酸单个连接而成,基因组最常见的多态就是单核苷酸多态(single nucleotide polymorphism),简写为SNP或SNPs(复数),指在群体中染色体的某一位点上由不同的核苷酸构成(图1)。

hapmap

图1 单核苷酸多态位点SNP和单体型。A:在来自4个个体的一段6kb序列上,大部分核苷酸相同但有5处显示不同(彩色)即SNPs。B:这段6kb区域的20个临近SNPs组成单体型(Haplotypes)。摘自Nature. 426:189-193。

目前发现的人类基因组中的SNP位点已经超过一千万。在人群中,染色体上每一二百个核苷酸就有一个SNP位点。单体型描述的是一段单条染色体上的序列差异,就是由SNP位点的顺序排列组成。因此也可以说单体型是分别来自父母的单条染色体上SNP的分布和传递模式。根据邻近SNP的连锁特性(即连锁不平衡),单体型上的多个SNPs还可以由少数几个tag即标签SNP代表。Haplotype Map是单体型图谱,就是全基因组上所有DNA序列的SNP分布和人群频率、标签SNPs、连锁性质与规律等。

2. 单体型的起源

人类基因组中的单体型源于人类有性生殖的分子机制和我们作为一个物种的历史。

除性细胞外,染色体在人类细胞中成对出现。其中一条染色体来自父方,另一条来自母方。但染色体在一代代的传递过程中并不是一成不变的。在精子和卵细胞形成的过程中,染色体对发生重组,即一对染色体中聚集到一起并交换片段。由此产生的杂合染色体含有这对染色体的两个成员的片段,并传递给下一代。

多代之后,经过反复的重组事件,祖先染色体的片段的原有排布在非近亲结婚的人群中已被打乱。某些祖先染色体片段会在许多后代个体的DNA序列中出现(图1)。这些是没有被重组打破的区段,相互间被那些发生了重组的区域隔开。这些区段就是单体型,遗传学家利用它可以寻找与疾病或者其它医学上的重要特征相关的基因。

hapmap2]

图示两个祖先染色体经过多代的重组拼接产生不同的子代染色体。如果祖先染色体上的一个多态位点(用X作为标记)会增加罹患某种疾病的风险,当代的两个遗传了祖先染色体的带X标记部分的个体也会增加这种风险。被X标记的变异附近有许多SNPs可以用来定位此处变异。

3.国际单体型图计划(TheInternational HapMap Project)是什么?

国际人类基因组单体型图计划(The International HapMap Project)是继国际人类基因组计划(The Human Genome Project,HGP)之后人类基因组研究领域的又一个重大研究计划。 由加拿大、中国、日本、尼日利亚、英国和美国共同资助和合作进行的项目,旨在确定和编目人类遗传的相似性和差异性,建立一个将帮助研究者发现人类疾病及其对药物反应的相关基因的公众资源,所产生的全部数据将免费向公众开放

4.干什么的?

HapMap计划建立了人类全基因组遗传多态图谱,依据这张图谱我们可以进一步研究基因组的结构特点以及SNP位点在人群间的分布情况,为群体遗传学的研究提供数据,为遗传性疾病致病基因在基因组上的定位提供高密度的SNP位点。HapMap的构建分为三个步骤:

  1. 在多个个体的DNA样品中鉴定单核苷酸多态性(SNPs);
  2. 将群体中频率大于1%的那些共同遗传的相邻SNPs组合成单体型;
  3. 在单体型中找出用于识别这些单体型的标签SNPs。通过对图中的三个标签SNPs进行基因分型,可以确定每个个体拥有哪一个单体型。

5.什么时候开始干的?

项目正式开始于2002年10月的一次会议( http://genome.gov/10005336 ),预计进行3年。中国科学家们由中科院北京基因组研究所牵头,承担3号、21号和8号染色体短臂单体型图的构建,约占总计划的10%。项目共取样270个正常个体,其中欧洲30个三联家系,亚洲45个中国人,45个日本人,非洲30个三联家系。

6.都有什么结果了?

笨蛋,结果就是把图给做出来了啊。 HapMap是人类基因组中常见遗传多态位点的目录,它描述了这些变异的形式、在DNA上存在的位置、在同一群体内部和不同人群间的分布状况。HapMap计划并不是利用HapMap中的信息来建立特定的遗传变异与某一疾病之间的联系,而是为其他研究者提供相关信息使之能够将遗传多态位点和特定疾病风险联系起来,从而为预防、诊断和治疗疾病提供新的方法。

7.样本来源

Short Name Description
ASW African ancestry in Southwest USA
CEU Utah residents with Northern and Western European ancestry from the CEPH collection
CHB Han Chinese in Beijing, China
CHD Chinese in Metropolitan Denver, Colorado
GIH Gujarati Indians in Houston, Texas
JPT Japanese in Tokyo, Japan
LWK Luhya in Webuye, Kenya
MXL Mexican ancestry in Los Angeles, California
MKK Maasai in Kinyawa, Kenya
TSI Toscani in Italia
YRI Yoruba in Ibadan, Nigeria

参考资料:

https://www.pharmgkb.org/page/hapMapPopulations

http://www.bjb.cas.cn/kytd/kjdt/201101/t20110112_3060128.html

http://hapmap.ncbi.nlm.nih.gov/originhaplotype.html

http://hapmap.ncbi.nlm.nih.gov/index.html.zh

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn