【9.5.3】启动子和终止位点预测

更多在线工具: http://molbiol-tools.ca/Promoters.htm

一、启动子:

二、终止位点:

ARNold

ARNold 在核酸序列中发现了不依赖于 rho 的终止子。搜索过程使用两个互补的程序,Erpin 和 RNAmotif。

  • Erpin (Gautheret & Lambert, 2001) 将来自枯草芽孢杆菌和大肠杆菌的 1200 个终止子序列的结构注释比对作为训练集。它从该比对中构建 lod-score 配置文件,并在用户序列中寻找该配置文件的高评分实例。
  • RNAmotif(Macke 等人,2001 年)使用 Lesnik 等人开发的描述符。 (2001) 识别大肠杆菌终止子,但是它可以用于查找任何物种的终止子。本质上,描述符由 4-18 bp 螺旋、0-2 nt 间隔区和 12 nt 富含 T 的区域组成。 RNAmotif 匹配使用富含 T 区域的序列内容和茎环区域的稳定性进行评分,并定义了一个经验性评分截止值来接受或拒绝匹配。

为了为 Erpin 和 RNAmotif 命中提供统一的评分方案,我们使用 RNAfold 计算预测的终止子茎环结构的自由能(Hofacker 等人,1994 年)。该自由能值可用作预测终止子的置信值。

iTerm-PseKNC

iTerm-PseKNC 是一个基于机器学习方法识别细菌转录终止子的网络服务器。 在预测器中,提取了 5 元组核苷酸频率和理化特性以配制样品。 提出了二项式分布技术对 1024 个 5 元核苷酸进行排序。 然后使用增量特征选择(IFS)来确定可以产生最大精度的最佳特征。 支持向量机(SVM)被用来进行预测。 五重交叉验证的结果表明,86.07% 的终止符和 99.46% 的非终止符可以分别被正确识别,表明我们提出的模型非常强大。 这项研究提供了一种识别终止子的新策略。 我们希望网络服务器能为生物化学学者提供便利。

参考文献: https://academic.oup.com/bioinformatics/article/35/9/1469/5104941

RhoTermPredict

参考文献: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-019-2704-x

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn