【3.4.5】gromacs读取二级结构信息do_dssp

GMX.3 do_dssp

本程序调用第三发软件 DSSP,从轨迹文件中读出蛋白质的二级结构信息。要使用该程序,必先安装好 DSSP 软件(恩,用 google 或者 baidu 小搜一下)。安装 DSSP 完毕后(/home/user/soft/bin/dssp),在 shell 中定义 DSSP 变量:

setenv DSSP /home/user/soft/bin/dssp

如果使用 bash,则

export DSSP='/home/user/soft/bin/dssp'

可以该变量直接加到 shell 的配置文件中。

程序输出文件为 .xpm 文件,该文件其实是一个文本文件,可以一般文本编辑器打开。文件中用不同字符表示蛋白质每一个残基属于什么二级结构,并随时间变化,同时定义每个字符的颜色。.xpm 文件可视化有一点麻烦,Gromacs 的另外一个程序 xpm2ps 可以将其转化为 PostScript 文件,为 .eps 文件后缀,可以直接打开或直接使用到 Latex 文件中。

do_dssp可以统计属于某二级结构类型的残基数目,“-sss” 参数用于选择二级结构类型,“-sc“ 参数则把统计结果输出到 scount.xvg 文件中(其实这个文件包含了所有不同二级结构氨基酸残基数目,可以用 xmgrace 的 “-nxy” 参数打开)。本程序还可以计算每一个残基的溶液可及化面积(Solvent Accesible Surface, SAS),以绝对平方埃(A^2)表示,或者最大 SAS 面积的分数表示(最大 SAS 定义为该一残基在甘氨酸链中的 SAS 面积)。Gromacs 另外一个程序 g_sas 也可以求取 SAS, 效率较高并且相对简单。

程序同时可以使用输出一个 ssdump.dat 文件。该文件包含了各个残基的二级结构信息,可以被另外一个程序 g_chi 使用,以分析残基直接二面角性质与二级结构直接的关系。(其实这个文件就是一个文本文件,里面用字符代表残基的二级结构,如 H 表示螺旋,B 表示折叠等。)

程序输入输出文件:

-f:
轨迹文件,xtc、trr等。
-s :
模拟系统 tpr 文件。
-n:
索引文件。
-ssdump:
输出 ssdump.dat 文件。
-map:
程序输出 xmp 文件的原色库文件,如无则默认输出。(让其默认挺好的啦)
-o:
输出文件,xmp 文件。各个残基属于某二级结构信息并随模拟时间变化。
-sc:
统计某二级结构残基数目,输出文件 scount.xvg。
-a:
各个残基的溶液可及化面积,xmp文件。
-ta:
总可及化面积,包括疏水和亲水面积,xvg 文件。
-aa:
平均可及化面积,xvg 文件。

其他参数:

-b:
指定可是统计时间帧。

-e:
指定结束统计时间帧。(“-b” 和 “-e” 可以用来读取轨迹中某一时间断的信息。)-dt:
指定读取帧的时间间隔。
-tu:
设定输出时间单位。
-w:
统计结束,自动打开输出文件。
-xvgr:
在输出 xvg 文件中添加其他信息,坐标标题等。
-sss:
设定统计二级结构类型。
GMX.2 anadock
anadock是一个分析分子对接(docking)软件 Autodock 计算结果的程序,其作用是根据距离或者 RMSD 对分子对接结果的分子结构进行归簇,然后依据分子对接能量和自由能,并进行统计和输出。(本人没有用过 AutoDock,只用过 Dock,故不作任何评论。)
对分子结构进行归簇,Gromacs 也提供 g_cluster 程序,故可以使用该程序对结构进行提前归簇在计算能量,同样可以达到目的。

程序输入输出文件:

-f:
输入文件,PDB 文件格式。
-ox:
归簇输出文件,PDB文件格式。
-od:
能量输出文件,为 xmgrace 的 xvg 文件格式。
-of:
自由能输出文件,xvg 文件格式。
-g:
程序记录文件。

其他参数:

-xvgr:
在 xvg 输出文件中添加文字说明,坐标名称等。
-free:
使用 AutoDock 估算的自由能对结构进行结构排序。
-rms:
使用 RMS 进行归簇。
-cutoff:
归簇尺度,偏离大于给出数值时认为不同簇,默认为 0.2 nm。
药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn