【3.4.2】Gromacs多链模拟

进行模拟计算时,如果模拟分子由两条以上的链组成,一般都要明确告诉模拟软件区分两条链。模拟软件一般没有那么聪明,除非明确定义,否则它会把两条以上的化学链(如肽链,DNA,其他聚酰胺等)看成一条链。在建立模拟文件是,上一条链尾端会于下一条链头部加一个共价化学键(如肽键)。由于该化学键一般很长,开始模拟时系统就“爆炸”了。

AMBER软件在处理这样的问题的,需要编辑原始的PDB文件,在每一条链结尾处添加“TER”。在GMX中,这种做法行不通(其实开发人员应该考虑这个问题)。解决的办法要在原始PDB文件中给每一条链添加链标识符,如“A”,“B”等等。(如果26个字母不够用,那就使用数字1到9,然后还可以使用特殊字符,如”$“,”¥“等等)。这样,使用 pdb2gmx 处理PDB文件的时候,就会得到各个链的拓扑文件,如topol_A.itp,topol_B.itp等等,并都被topol.top包含。

以上所述使用一个字符标识PDB文件中不同的链,是因为PDB文件只使用第22字符列作为链标识位,两个字符以上不认。(即AA,AB标识的链都被认为是A链。)

那么如果拿到一个没有链标识符的PDB坐标文件或GRO文件,该怎么办呢?那么要先使用make_ndx将不同链的残基选作不同的分子组(group),然后使用editconf将不同组输出成带链标识符的PDB文件,命令如:

editconf -f File.pdb(/File.gro) -n indenx.ndx -o chian_A.pdb -lable A

(以上可以等等A链,以此类推得到不同的链的PDB文件)。 最后将这些PDB文件组合成一个PDB文件,再由pdb2gmx处理即可。甚是麻烦。。。

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学