【5.4】igblast简介及参数设置

在NCBI开发IgBLAST以促进免疫球蛋白和T细胞受体可变结构域序列的分析。

IgBLAST允许用户查看种系V,D和J基因的匹配,重排连接处的细节,IG V结构域区域和互补决定区的描述。 IgBLAST具有分析核苷酸和蛋白质序列的能力,并且可以批量处理序列。 此外,IgBLAST允许同时针对种系基因数据库和其他序列数据库进行搜索,以最小化可能最佳匹配的种系V基因缺失的机会。

在线使用:http://www.ncbi.nlm.nih.gov/igblast/

一、安装

1.1 igblast安装

下载地址:

ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/

选择最新版1.9 :

cd cd /data/software/igblast/
wget -c ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/1.9.0/ncbi-igblast-1.9.0-x64-linux.tar.gz

tar -xzf ncbi-igblast-1.9.0-x64-linux.tar.gz

修改环境变量

vim /etc/profile

igblast_path=/data/software/igblast/ncbi-igblast-1.9.0/bin
export PATH=$igblast_path:$PATH

source /etc/profile

1.2 数据库

internal optional 数据集

cd /data/database/igblast

#database
wget -r 1 -p ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/database/
cp -fr ./ftp.ncbi.nih.gov/blast/executables/igblast/release/database ./

# internal_data
wget -r 1 -p ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/internal_data/
cp -fr ./ftp.ncbi.nih.gov/blast/executables/igblast/release/internal_data ./

#optional_file
wget -r 1 -p ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/optional_file/
cp -fr ./ftp.ncbi.nih.gov/blast/executables/igblast/release/optional_file ./

# 删除
rm -fr  ftp.ncbi.nih.gov

IMGT数据

下载地址IMGT序列:http://www.imgt.org/vquest/refseqh.html#VQUEST

需要通过makeblastdb来构建

makeblastdb -parse_seqids -dbtype nucl -in my_seq_file

具体构建方法,见 https://ncbi.github.io/igblast/cook/How-to-set-up.html

wget -c ftp://ftp.ncbi.nih.gov/blast/executables/igblast/release/edit_imgt_file.pl

# V-segment database
   $perl edit_imgt_file.pl IMGT_Mouse_IGHV.fasta > ./database/mouse_igh_v
   $makeblastdb -parse_seqids -dbtype nucl -in ./database/mouse_igh_v
# J-segment database
   $perl edit_imgt_file.pl IMGT_Mouse_IGHJ.fasta > ./database/mouse_igh_j
   $makeblastdb -parse_seqids -dbtype nucl -in ./database/mouse_igh_j
# D-segment database
   $perl edit_imgt_file.pl IMGT_Mouse_IGHD.fasta > ./database/mouse_igh_d
   $makeblastdb -parse_seqids -dbtype nucl -in ./database/mouse_igh_d

添加环境变量

vim /etc/profile

export BLASTDB='/data/database/igblast'

#export internal_data='/data/database/igblast/internal_data'

export IGDATA='/data/database/igblast'

source /etc/profile

如果不增加数据库的环境变量,就会报/internal_data/ 找不到

二、运行

cd /data/software/igblast/ncbi-igblast-1.9.0
mkdir test;cd test

igblastp -germline_db_V igblast/database/mouse_gl_V -query test.fa -outfmt 3 -organism human

用IMGT germline database

#igblastp -germline_db_V igblast/imgt_201807/IGKVLV -germline_db_J igblast/imgt_201807/IGKVLV -germline_db_D igblast/imgt_201807/IGKVLV -organism human -query test.fa -auxiliary_data igblast/optional_file/human_gl.aux -show_translation


./bin/igblastn -query infile.fasta -out outfile.igblast.fmt7.out -outfmt 7 -germline_db_V ./database/mouse_gl_V -germline_db_J ./database/mouse_gl_J -germline_db_D ./database/mouse_gl_D -auxiliary_data ./optional_file/mouse_gl.aux -organism mouse -domain_system imgt -ig_seqtype Ig -show_translation -num_threads 10

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学