【6.1】二级蛋白质结构数据库-Pfam(结构域家族数据库)

Pfam 数据库(http://pfam.xfam.org/)是一个蛋白质结构域家族的集合,包括了一万六 千多个蛋白质家族。蛋白质一般是由一个或多个功能区域组成,这些功能区域通常称作结构 域(domain)。在不同的蛋白质中结构域以不同的组合出现,形成了蛋白质的多样性。识别 出蛋白质中的结构域对于了解蛋白质的功能有重要意义。比如 Toll 样受体蛋白。人的免疫 系统中有许多种Toll 样受体蛋白,所有这些种类的Toll 样受体蛋白都可以分成三个结构域, 每个结构域行使不同的功能。胞外域用于识别不同的入侵物,跨膜区穿膜,胞内域用于胞内 信号转导。另一个免疫蛋白 MyD88,存在于胞内。它与 Toll 样受体的功能不同,但它有一 个和 Toll 样受体胞内域相同的结构域。这两个不同蛋白上的相同结构域可以相互结合以激 活下游的信号传导。因此,如果我们能够探明一个未知功能的蛋白质上有哪些已知的结构域, 那我们就大致可以推测出它的功能。

Pfam 主页上的搜索工具可以帮助我们查找某条序列上有哪些结构域。输入序列(示例 序列请从之后的富文本附件 pfam.fasta 中下载)。这是一条 Toll 样受体蛋白的序列。搜索结 果显示,一共找到 4 个区域匹配 Pfam 数据库中已记录的结构域。前三个是 Toll 样受体蛋 白胞外域典型的重复序列片段。最后一个是 TIR 结构域,也就是我们刚才说的 Toll 样受体 蛋白的胞内域。点击胞内域查看详细信息如下:

  • Summary 里可以获得这个结构域的功能注释以及结构信息。
  • DomainOrganization 里可以看到目前有多少蛋白质拥有TIR 结构域,以及TIR 结 构域和其他结构域之间的组合搭配关系。
  • Structure 会列出目前所有包含 TIR 结构域的蛋白质结构,以及他们在序列数据库 UniProt 和结构数据库 PDB 中的链接。同时,也提供 JSmol 在线结构查看工具。

参考资料:

山东大学 生物信息学课题组荣誉出品 http://www.crc.sdu.edu.cn/bioinfo 巩晶老师课件

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学