【6.1】SDF

简单来讲,SDF文件就是一个化学表格文件。

文件扩展名:.sd,.sdf。格式类型:化学文件格式

SDF是MDL开发的一系列化学数据文件格式之一; 它专门用于结构信息。 “ SDF”代表结构数据文件,而SDF文件实际上包装了molfile(MDL Molfile)格式。 多个化合物由由四个美元符号($ $$$$ $)组成的线分隔。 SDF格式的一个功能是它包含关联数据的能力。 关联的数据项表示如下:

  • 第一行:一般作为分子名字,如 Levetiracetam
  • 第二行:注释,ChemDraw06111413562D
  • 第三行:一般是空行
  • 第四行:是原子个数 键的个数等的起始行。
  • M  END所在行结束原子个数 键的个数等信息。 接着就是

    属性1 属性1值

    空行

    属性2 属性2值

    空行 (以四个美元符号结束一个分子的信息存储。)

具体例子:

Levetiracetam
  ChemDraw06111413562D

 12 12  0  0  0  0  0  0  0  0999 V2000
   -1.4405   -0.4285    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7260   -0.8410    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.0116   -0.4285    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.7029   -0.8410    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.4174   -0.4285    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.0116    0.3965    0.0000 N   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7260   -1.6660    0.0000 N   0  0  0  0  0  0  0  0  0  0  0  0
    0.6559    0.8814    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.4009    1.6660    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.4241    1.6660    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.6790    0.8814    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.4405    0.6265    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
  1  2  2  0      
  2  3  1  0      
  3  4  1  1      
  4  5  1  0      
  3  6  1  0      
  2  7  1  0      
  6  8  1  0      
  8  9  1  0      
  9 10  1  0      
 10 11  1  0      
 11  6  1  0      
  8 12  2  0      
M  END
>  <Catalog Number> (1)
A1198

>  <Item Name> (1)
Levetiracetam

>  <Formula> (1)
C8H14N2O2

>  <MolWeight> (1)
170.21

>  <CAS Number> (1)
102767-28-2

>  <Target> (1)
Cancer Biology

$$$$

某些可以导入SDF文件的程序(例如ISIS / Base)要求分子数据之后的第一个数据字段(在上面的示例中为Unique_ID)是每个记录的唯一标识符。

多行允许有多个数据项。[需要澄清] MDL SDF格式规范要求将硬回车字符插入内容超过200个字符的任何文本字段中。 由于许多SMILES和InChI字符串超过该长度,因此在实践中经常违反此要求。

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学