【3.1.2】SDF
简单来讲,SDF文件就是一个化学表格文件。
文件扩展名:.sd,.sdf。格式类型:化学文件格式
SDF是MDL开发的一系列化学数据文件格式之一; 它专门用于结构信息。 “ SDF”代表结构数据文件,而SDF文件实际上包装了molfile(MDL Molfile)格式。 多个化合物由由四个美元符号($ $$$$ $
)组成的线分隔。 SDF格式的一个功能是它包含关联数据的能力。
关联的数据项表示如下:
-
第一行:一般作为分子名字,如 Levetiracetam
-
第二行:注释,ChemDraw06111413562D
-
第三行:一般是空行
-
第四行:是原子个数 键的个数等的起始行。
-
M END所在行结束原子个数 键的个数等信息。 接着就是
属性1 属性1值
空行
属性2 属性2值
空行 (以四个美元符号结束一个分子的信息存储。)
具体例子:
Levetiracetam
ChemDraw06111413562D
12 12 0 0 0 0 0 0 0 0999 V2000
-1.4405 -0.4285 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
-0.7260 -0.8410 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
-0.0116 -0.4285 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
0.7029 -0.8410 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.4174 -0.4285 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
-0.0116 0.3965 0.0000 N 0 0 0 0 0 0 0 0 0 0 0 0
-0.7260 -1.6660 0.0000 N 0 0 0 0 0 0 0 0 0 0 0 0
0.6559 0.8814 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
0.4009 1.6660 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
-0.4241 1.6660 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
-0.6790 0.8814 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.4405 0.6265 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
1 2 2 0
2 3 1 0
3 4 1 1
4 5 1 0
3 6 1 0
2 7 1 0
6 8 1 0
8 9 1 0
9 10 1 0
10 11 1 0
11 6 1 0
8 12 2 0
M END
> <Catalog Number> (1)
A1198
> <Item Name> (1)
Levetiracetam
> <Formula> (1)
C8H14N2O2
> <MolWeight> (1)
170.21
> <CAS Number> (1)
102767-28-2
> <Target> (1)
Cancer Biology
$$$$
某些可以导入SDF文件的程序(例如ISIS / Base)要求分子数据之后的第一个数据字段(在上面的示例中为Unique_ID)是每个记录的唯一标识符。
多行允许有多个数据项。[需要澄清] MDL SDF格式规范要求将硬回车字符插入内容超过200个字符的任何文本字段中。 由于许多SMILES和InChI字符串超过该长度,因此在实践中经常违反此要求。
参考资料
这里是一个广告位,,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn