切除引物--Bamclipper
之前切割引物用的是GATK的ClipReads,但分析数据的过程中发现,测序序列中跟引物序列匹配的部分也会被切换掉,为了 保证更好的切割测序结果中的引物,避免引入带入的测序错误,需要找一款更牛逼的工具。
一、Bamclipper介绍
Bamclipper是一款专门针对bam文件soft-clipping PCR反应的引物
官网:https://github.com/tommyau/bamclipper/blob/master/README.md
运行前先用samtools index my.bam 建立索引 同时要有samtools和parallel的存在 切掉引物后用igv来看,可以看到的确切掉了引物,但是为什么切以后文件大小变化了呢?
# Clip primers by BAMClipper
>./bamclipper.sh -b examples/SRR2075598.bam -p examples/trusight_myeloid.bedpe -n 4
# done!
# SRR2075598.primerclipped.bam and its index SRR2075598.primerclipped.bam.bai are generated.
# the new SRR2075598.primerclipped.bam should be identical to the provided example (compare checksum of alignments and ignore headers)
>samtools view SRR2075598.primerclipped.bam | md5sum
4bcec847fe46649d127767fca9c3084a -
>samtools view examples/SRR2075598.primerclipped.bam | md5sum
4bcec847fe46649d127767fca9c3084a -
# An example line of primer pair BEDPE file (an amplicon targeting ASXL1)
>grep 31022896 examples/trusight_myeloid.bedpe
chr20 31022896 31022921 chr20 31023096 31023123
二、讨论
这个工具在用的时候折腾了一会,就在于, 必须向用samtools建立索引,我的bam文件也是有索引,但是索引的名字给改了 还有一点,这个程序必须要有parallel,多进程,你懂的
参考资料
这里是一个广告位,,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn