【2.1】序列俩俩比较-打点法

一、打点法介绍

比较两个序列的方法有打点法和序列比对法。打点法是最简单的比较两个序列的方法, 理论上可以用纸和笔来完成。如果要比较下面这两条序列:

seq1:THEFASTCAT
seq2:THEFATCAT

我们需要把序列 1 整齐的水平书写,然后把序列 2 整齐的竖直书写,然后依次横横竖竖的比 较每一个位置上的残基。相同的话就在这个位置上打个点,不同话,什么也不干(图 1)。 这样我们一共需要比较序列 1 的长度乘以序列 2 的长度个位置,也就是 10 乘 9 个位置,也 就是进行 90 次比较,最终产生图 1 的打点矩阵。

这样一个打点矩阵上可以总结出一些东西来。首先,说是打点你也可以打叉。这就是 做个标记,标记下这个位置上对应的两个残基是相同的。第二点发现,这个矩阵中绝大部分 地方是没有点的,只有少数位置上有点。第三个发现,这个矩阵中打点打出了一条较为明显 的对角线。这条对角线想要告诉我们什么呢?

在打点矩阵中,连续的对角线及对角线的平行线代表两条序列中相同的区域。这个矩阵 中在主对角线位置上连续的红色的对角线说明这个位置对应的序列 1 的部分和序列 2 的部分 是完全相同的,都是 THEFA。此外,跟红对角线平行的蓝色平行线和绿色平行线,同样指 出了序列 1 和序列 2 中两条相同的序列。也就是序列 1 和序列 2 中对应位置的 TCAT,以及序列 1 和序列 2 中对应位置的 AT。由这三条线,我们找到了序列 1 和序列 2 中三条相同的 子序列。最后,我们放眼全局,红色的线和蓝色的线加起来基本上构成了一条主对角线。由 此我们可以得出结论:序列 1 和序列 2 是比较相似的两条序列。事实上,如果直接看一下这 两条序列,确实是挺相似的。如果是风马牛不相及的两条序列,做出的打点矩阵里是不会出 现对角线的,哪怕是模糊的对角线,也不会出现。比如,让序列 1 和序列 3 打点做出的打点 图(图 2)中,完全是散点,根本就没有连续的线,更别提主对角线了。

除了可以用打点法给两条不同的序列打点,还可以用一条序列自己跟自己打点。这样可 以发现序列中重复的片段。比如我们让下面这条序列自己和自己打点:

Seq1:THEFASTHESTHE

这样的打点矩阵必然是对称的,并且一定有一条主对角线(图 3)。此外,在横向或纵向上, 与主对角线平行的短平行线所对应的序列片段就是重复的部分。其中,红色短平行线对应的 THE 在序列中重复出现了 3 次。包括主对角线在内,平行线出现的次数就是重复的次数。

用这种方法我们还可以快捷的发现序列中的串联重复序列以及重复的次数。我们只要数 数在半个矩阵中包括主对角线在内的所有等距的平行线的个数,就可以知道重复的次数,而且最短的平行线对应的序列就是重复单元(图 4)。短的串联复序列具有高度多态性,也就 是说不同的个体间重复次数存在差异,而且这种差异在基因遗传过程中一般遵循孟德尔共显 性遗传规律,所以快速查找某些特定的短的串联复序列的重复次数可以用于法医学的个体识 别或亲子鉴定等领域。

二、Dotlet界面介绍

我们挑其中最常用的 Dotlet 软件做为演示 (http://myhits.isb-sib.ch/cgi-bin/dotlet)。Dotlet 基于 Java 开发,所以页面打开后会蹦出 JAVA 对话框。像对待 Jsmol 一样,接受 JAVA,信任 JAVA,运行 JAVA。当然前提是你的电脑已 经安装了 JAVA。如果还没有安装,可以到课程附件或者 JAVA 官网下载安装。别忘了安装 后,重启浏览器,JAVA 才能生效。同样的,IE 如果不好使,可以尝试其他浏览器。

PS:这个以后应该不会怎么用了吧,所以就不看咯。。

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学