【7.2】寻找保守序列-MEME(序列基序)

MEME 是一款寻找序列基序(motif)的软件。在核酸或蛋白质序列中存在一些有特定 模式的序列片段,这些片段称为序列的基序(motif)。序列的基序与生物功能密切相关。比 如,发生 N 糖基化位点的基序:发生糖基化的天冬酰胺后面一定紧跟一个脯氨酸以外的氨 基酸,再紧跟丝氨酸或者苏氨酸,再紧跟一个脯氨酸以外的氨基酸。这个特定模式可通过正 则表达式来规范描述,也可以通过序列标识图来直观描述。基序的发现要通过大量相关序列 的分析。MEME 就是一款可以自动从一组相关的核酸或蛋白质序列中发现序列基序的软件。

MEME 是 The MEME Suite 在线软件套装中的一员(http://meme-suite.org/)。MEME 的 使用非常简单,只需要将待分析的序列上传即可(图 1)。而且,上传的序列为原始序列, 不需要提前为它们做多序列比对。你也可以指定返回排名前几的基序。MEME 的等待时间 稍长,大约 10 分钟以上,所以最好留下邮箱。

Meme 的返回结果被保存成各种格式:HTML、XML、test 等。便于在线查看的是“MEME HTML output”,即网页格式。

网页格式的 MEME 结果页面中,给出了找到的排名前三的基序(图 2)。它们以序列标 识图的形式展现出来。同时还提供这三个基序在每条序列中的大体位置。如果要进一步了解 某个基序,可以点击序列标识图右侧的“More”下面的“”箭头,以查看详细(图 3)。 点击后,会得到大比例序列标识图,以及该基序在每条序列中对应的序列片段和它们出现的 具体位置。此外,还可以点击序列标识图右侧的“Submit/Download”下面的“”箭头(图 4),将某个基序提交至各种数据库,并进行针对该基序的序列相似性搜索,已找到数据库中 含有该基序的序列,进而推测该基序的功能。这步操作是通过 The MEME Suite 软件套装下 的另一个软件 FIMO 来实现的。

参考资料:

山东大学 生物信息学课题组荣誉出品 http://www.crc.sdu.edu.cn/bioinfo 巩晶老师课件

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学