rboAnalyzer丨有了它,做生信分析更容易了

我们一般做数据挖掘时都是通过BLAST或其他相似工具在数据库中寻找大量相似的序列,然而因为搜索得到的序列结果与数据库中的主题序列存在部分匹配,大大增加我们翻译、解释这些结果的难度。

在今年7月来自捷克的Schwarz课题组在Frontiers in Genetics发表了著作,他们开发了RboAnalyzer软件,主要针对非编码RNA,以自动化工作流程取代手动工作,从而使数据库序列搜索结果的解释更加容易,可有助于解释序列搜索结果。

这是rboAnalyzer 的操作流程图


(图片来自于https://doi.org/10.3389/fgene.2020.00675

rboAnalyzer 软件操作步骤简单地分为三步:

  1. 把部分匹配扩展到其可能的全长序列。
  2. 识别主题RNA的同源性。
  3. 预测二级结构。

所有信息都会集合到HTML输出里。
rboAnalyzer Linux系统上运行,利用具有BiopythonNumPyPandasmatplotlibJinja2BashPython 3操作。

Schwarz课题组用该软件对放线菌的分歧杆菌ms1 RNA的同源性分析做了示范,你看


(图片来自于https://doi.org/10.3389/fgene.2020.00675

他们选取3个不同质量的高分值片段对HSP,图5A代表的是高质量HSPHSP 覆盖了查询序列的很大一部分,但间隙相对较少,表明查询序列与主题RNA具有很强的相似性,从而表明它们的同源性。高序列相似性导致精确扩展的全匹配,使得能够预测由 Turbofold rfam-Rc 预测最好表示的准确二级结构
5B代表的是同源性RNA5C代表的是非同源性RNArboAnalyzer 软件能够准确地识别同源性。事实上,ms1 RNA是个细菌RNA,而非同源性HSP的存在于真核细胞。

这篇文章的作者认为rboAnalyzer软件是必需的,因为通常只有全长序列才能对RNA做有效分析。二级结构、同源性和功能鉴定的预测分析也同样重要。

Posted in 公司新闻, 实用工具, 实验外包服务, 技术文章.

发表评论

电子邮件地址不会被公开。 必填项已用*标注