【6.3】二级蛋白质结构数据库-SCOP2(结构分类数据库)

SCOP 数据库与 CATH 类似,也属于蛋白质结构分类数据库,但 SCOP 的分类原则更 多考虑蛋白质间的进化关系,而且分类主要依赖于人工验证。和 CATH 一样,SCOP 的结构 分类也基于四个层次。第一层也叫 Class,也是基于二级结构成分分类。Class 之下是 Fold, 主要考虑结构的空间几何关系。再往下是 Superfamily,基于远源的蛋白质进化关系分类。最 后是 Family,基于近源的蛋白质进化关系分类。注意 SCOP 和 CATH 里面都有提到 Superfamily 这个词,但两者的含义并不相同。CATH 里 Superfamily 是指的从 C 到 A 到 T 再到 H 这样四 层的一个精细结构分类。而 Scop 中,Superfamily 是结构分类的第三个层次的名称。目前, SCOP 已升级为 SCOP2(http://scop2.mrc-lmb.cam.ac.uk)。

SCOP2 的主页上也有搜索条,可以查看某一个 PDB 结构的结构分类。图 1 搜索结果中 的第 2 到第 5 条,就是该蛋白质结构的四层分类。第一层 Class,第二层 Fold,第三层 Superfamily, 第四层 Family。第一层 Class 之上是 SCOP 数据库的根。第 4 层 family 之下是这个蛋白质的 名字,再往下是所属物种。虽然从这个谱系上看有 7 个层次,但实际上真正的结构分类只有 中间四层。

参考资料:

山东大学 生物信息学课题组荣誉出品 http://www.crc.sdu.edu.cn/bioinfo 巩晶老师课件

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学