IGV –基因组可视化工具

IGV(Integrative Genomics Viewer)是一个基因组可视化的工具

一、简介

官网:http://www.broadinstitute.org/igv/

使用说明:http://www.broadinstitute.org/igv/book/export/html/6

下载地址:http://www.broadinstitute.org/software/igv/download

学习资料:http://pan.baidu.com/s/1o8SDf42

我选择的版本 Binary Distribution

解压缩后,在cmd终端中输入

e:
cd e:\backup\igv_2.3.67
java -Xmx750m -jar igv.jar
(可以调整750的数值来改变IGV可调用的内存)

运行方式二:

sh igv.sh

在igv.sh中调节内存的大小

二、使用说明

2.1 数据的导入

导入基因组文件:(这里是直接导入自己下载的基因组序列fa文件)

在最上面的选项中依次点击:

Genomes→load genomes from file→选择基因组文件(fa文件,注意:一定要有对应的index文件,也就是图中.fai结尾的文件)

如下图:

三、讨论

1.Igv使用过程中截图,同时保留深度等信息

PrintScreen + Ctrl C

2.reads红色和蓝色分别代表什么?

IGV uses color coding to flag anomalous insert sizes.

Blue is for inserts that are smaller than expected. That is, the inferred insert size on the reference genome is smaller than expected given the actual insert size.

Red is for inserts that are larger than expected. That is, the inferred insert size on the reference genome is larger than expected given the actual insert size.

蓝色代表插入序列比期望的小

红色代表插入序列比期望的大

3.注意的问题

1.如果上传的是bam或sam文件,需要在同一个文件夹中加入index文件(即.bai)文件 2. 比对结果明明没有插入,但是IGV识别出有插入,应该是bam文件中该序列对应的位置信息不清楚

四、报错

4.1 报错

Error message: 198.bam has invalid uncompressedLength: -1430802916

或者:

invalid gzip header

报错原因:

因为bam文件中,同一个位置的reads数目太多,samtools处理的问题。建议用sambamba来获得bam文件。

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn