【3.1】index基因组

对基因组中部分序列做了mask以后生成了一个新的genome.fa,要用GATK来Call SNP的之前,需要对这个基因组建好各种Index

1.bwa 建立Index

bwa index -a bwtsw ../genome37_mask.fa

2.samtools建立Index

samtools faidx reference.fa
  1. Generate the sequence dictionary

    java -jar picard.jar REFERENCE=reference OUTPUT=reference.dict

或者

picard CreateSequenceDictionary REFERENCE=genome37_mask.fa OUTPUT=genome37_mask.dict

4.faidx

faidx genome37_mask.fa -o genome37_mask.out
  1. novoindex

    novoindex genome37_mask.ndx genome37_mask.fa

问题:

  1. 这些Index有什么不同?
  2. 这些index实现原理是什么?

参考资料

http://gatkforums.broadinstitute.org/gatk/discussion/2798/howto-prepare-a-reference-for-use-with-bwa-and-gatk

这里是一个广告位,,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn