【5.1】bamsurgeon--模拟突变的bam文件

NGS流程需要测试,这里的测试可以是样本的测试,也可以是已知突变的bam文件的测试,这里我们将生成模拟的bam来测试NGS流程。

一、bamsurgeon简介

BAMSurgeon(由共同第一作者Adam Ewing开发),能够产生肿瘤基因组的一个精确模拟。

下载地址: https://github.com/adamewing/bamsurgeon

二、用法:

见软件说明

三、讨论:

  1. bam文件需要有.bai的索引

  2. 插入突变和一般突变需要先后处理

  3. 一个文件夹中的突变位点位置不要太近,不能是同一条reads上的,因为它的原理是多线程的提取出对应的reads突变以后,再合并;如果很近的位点要同时突变,则需要先后处理

  4. ValueError: quality and sequence mismatch: 145 != 150 删除突变太长,部分amplicons的序列的长度不包括删除突变的几个位点 修改代码即可

  5. DEL突变的频率不一致 好几个Amplicons包括DEL那个区间,其中有的Amplicon质量不好

  6. 这个程序有时候不能生成bam文件,也不报错,有可能仅仅是参数设置把结果给过滤了, 例如:coverdiff这个值默认的是0.9,我怎么都不能生成bam文件,一路debug,才发现 我的bam文件生成的值是0.88,给过滤掉了。忧伤。。。

参考资料:

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn