RepeatMasker

RepeatMasker是一款用于寻找DNA序列中中间重复序列和低复杂度DNA序列的软件。这个软件的输出是对其中重复序列的碱基进行标注,默认的是改为N。目前56%的人类基因组重复序列的标注用的是这个工具。RepeatMasker 使用序列比较的工具包括:nhmmer, cross_match, ABBlast/WUBlast, RMBlast and Decypher。数据库位已经验证的重复序列数据库,目前也支持Dfam ( profile HMM library derived from Repbase sequences ) and Repbase。 继续阅读“RepeatMasker”

interproscan安装及使用

Interpro是一个数据库,它里面有蛋白功能,蛋白家族等信息。而Interproscan就是可以将你的蛋白序列跟这个这个数据比对,从而给你的序列功能注释。
Interproscan5新增了一些功能
Phobius用来预测跨膜和信号肽
可以把结果map到上传的数据上
寻找蛋白可能的生物学代谢途径
新的输出格式XML和GFF3.0
提升了图形界面的

继续阅读“interproscan安装及使用”

PfamScan及fam数据库

Pfam(http://pfam.sanger.ac.uk/)是一个被广泛使用的蛋白家族数据库,在最新的版本26.0中包含超过13000个手工确定的蛋白家族,Pfam可以通过http://pfam.sanger.ac.uk/使用,他有两个数据库,高质量,手工确定的Pfam-A,自动注释的Pfam-B数据库。后面的数据产生是根据ADDA算法。是对A的补充。

继续阅读“PfamScan及fam数据库”